하루 또는 일주일 사이 앞다퉈 ‘개발자 컨퍼런스’, ‘기술설명회’ 개최
오픈AI, 멀티모달 모델 ‘GPT-4o’, 구글, ‘제미니’ 검색·메일·스마트폰
MS, ‘코파일럿PC’ 시대 천명, “고도화된 생성AI기술 생활화 경쟁”

델 테크놀로지가 21일 개최한 기술설명회. (사진=Future)
델 테크놀로지가 21일 개최한 기술설명회. (사진=Future)

[애플경제 전윤미 기자] 글로벌 빅테크의 AI기술과 제품 경쟁이 새삼 치열하다. 특히 이달 들어오픈AI에 이어 하루 이틀 간격으로 구글, MS, 델(델 테크놀로지) 등이 앞다퉈 ‘기술설명회’ 내지 ‘개발자 컨퍼런스’ 등을 개최, 기술경쟁을 벌이고 있다.

오픈AI가 텍스트·이미지·영상 통합형 멀티모달(Multimodal) 모델 ‘GPT-4o’을 발표한데 이어, 구글은 검색·메일·스마트폰 등에 제미니를 적용하고, AI칩을 공개했다. 또 MS도 거의 같은 시기에 AI개발 도구인 코파일럿을 PC에 적용, 윈도우 체제를 AI 기반을 재정비하는 시도를 하고 있다. 이로 인해 근래 보기 드물게 세계 인공지능 시장의 지각이 또 다시 요동치고 있다.

오픈AI, 멀티모달 ‘GPT-4o’

챗GPT로 생성AI 시대를 열어제친 오픈AI는 지난 13일 텍스트는 물론, 청각과 시각으로도 추론하고 이를 말할 수 있는 새로운 AI 모델 ‘GPT-4o’를 발표하며 다양한 시연 모습을 공개했다. GPT-4o의 ‘o’는 하나의 통합된 AI 모델을 의미하는 ‘옴니모델(Omni model)’이란 의미다.

‘GPT-4o’는 음성 인식과, 말을 문장으로 옮기는 스피치-투-텍스트(Speech to text), 이미지 인식 기능 등이 통합된 대화형 인터페이스 형태다. 이로써 자연스러운 실시간 상호작용이 가능한 멀티모달 모델로 분류할 수도 있다. 이는 음성, 텍스트 또는 이미지로 콘텐츠를 생성하거나 명령을 이해하는 수준에 도달한 것이다.

‘GPT-4o’는 기존 GPT 모델을 뛰어넘는 특별한 기능으로 평가된다. 이른바 미래의 인간보다 뛰어난 슈퍼인공지능(ASI)을 겨냥한 것으로 인식되기도 한다. 종래 GPT 프롬프트는 글자(텍스트)를 통해 명령하는 방식이라면, GPT-4o는 음성, 텍스트, 시각물을 입력하면 AI가 추론하고 그 결과를 도출한 것이다. 특히 GPT-4가 응답에만 평균 5.4초가 걸리는 데 반해, GPT-4o의 응답시간은 가장 뛰어난 성능이 232밀리초(ms·1000분의 1초)이며, 평균으론 320ms의 속도를 보인다.

오픈AI는 “복잡한 기술 향상보다는 AI가 실제 우리 삶을 어떻게 바꿀 수 있는지 구현하는 데 집중하고 있다”며 사용 편의성을 극대화하고 있다. 이번 시연에서는 그래선지 지금까지 AI 음성 챗봇에는 없었던 ‘사실적인 대화’가 주로 진행되었다. 기술매체 엔가젯은 “현재 출시된 경쟁사들의 유사한 음성 비서와 달리, 이는 사용자와 실시간으로 상호 작용을 하며 사용자의 요청에 따라 목소리 톤을 높이고 대화 속도를 빠르게 할 수 있는 점이 특징”이라고 요약했다.

구글 사옥. (사진=셔터스톡)
구글 사옥. (사진=셔터스톡)

구글, ‘광범위한 제미니 생태계 구현’

구글도 이에 질세라 바로 다음 날인 5월 14일에 “광범위한 생태계에 ‘제미니’를 활용해 검색엔진 강자에서 ‘AI 시대 선도자’로 비상할 것”이라며 ‘구글 I/O 2024(구글 연례 개발자 컨퍼런스)’를 개최했다.

라이브 스트리밍으로 진행된 이 자리에서 리즈 레이드 구글 검색 담당 부사장은 “검색·메일·스마트폰 등에 ‘제미니’를 적용한 기술”과 함께 자사의 AI칩도 공개하는 등 나름의 AI 생태계를 고도화했다. 특히 레이드 부사장은 “검색 엔진의 새로운 서비스 ‘AI오버뷰(AI Overview)’를 전면에 내세울 것”이라고 했다. ‘AI 오버뷰’는 사용자가 검색어를 입력하고 ‘생성’ 버튼을 누르면 생성형 AI인 ‘제미니’가 그에 맞제 요약한 검색 결과를 보여주는 것이다. 개인별 용도에 따라 매우 섬세하게 맞춤형으로 진화한 검색기술로 볼 수 있다. 이전까지는 실험용 버전으로 구글에 로그인한 사용자만 사용했던 기능을 전면 개방한 것이다.

구글은 또 검색엔진기술 뿐 아니라, 구글 포토·워크스페이·스마트기기 등 사업 부문 전반에 자체 AI모델인 제미니를 접목시켰다. 문자 그대로 ‘제미니 생태계’를 구축한다는 목표다. 월스트리트저널은 특히 이날 컨퍼런스를 총평하며, “AI모델 개발이나 서비스 구축에서 항상 한발 앞서가는 오픈AI에 대항하기 위해 구글은 기존에 구축해 놓은 거대 생태계를 활용해 ‘AI중심 회사’로 변신하기로 작정했다”고 밝혔다.

델, Apex 확장팩 두 배로 늘리기

델(Dell Technologies) 역시 그로부터 일주일 후인 21일 ‘Dell Technologies World 2024’를 개최, 신기술 경쟁에 가세했다. 특히 이 회사는 인프라 발전과 지속적인 Apex 확장에 주력하고 있다.

이 회사의 XaaS(Any as a Service) 플랫폼인 Dell Apex는 최근 몇 년 동안 점점 더 강해지고 있으며 계속해서 많은 서비스를 중심으로 하는 회사의 주력 제품으로 자리잡고 있다. 이번 ‘Dell Technologies World 2023’에서도 역대 최대 규모의 Apex 확장을 공개했다. “Apex 멀티 클라우드 접근 방식에서 고객을 위한 놀라운 가치를 구현할 것”이란 설명이다.

또 강력한 Nvidia 지원에 힙입은 AI 인프라도 강조했다. 델과 엔비디아는 ‘윈윈’ 협력을 통해 AI기술을 고도화하고 있다. 사전 생성 AI를 위해 엔비디아와 파트너십을 맺고 사전 훈련된 모델과 프레임워크를 포함한 H100 GPU 및 파워에지 XE9680과 같은 최적화된 하드웨어를 제공하기로 했다.

마이크로소프트 로고.(사진=테크크런치)
마이크로소프트 로고.(사진=테크크런치)

MS, ‘코파일럿’+PC

마이크로소프트(MS)도 그로부터 일주일 후인 21일 ‘MS 빌드’(개발자 컨퍼런스)를 개최, 자사 특유의 AI 비서인 ‘코파일럿’(Copilot)을 접목한 ‘Copilot+PC(코파일럿 PC)’를 출시했다. 이제부턴 윈도우PC가 아니라, AI(코파일럿)가 융합된 코파일럿 PC가 MS의 상징이 되는 셈이다. 즉 앞으론 AI가 윈도우 운영체제가 된다.

이처럼 MS는 윈도우와, 이를 실행하는 PC의 최전선에 생성 AI를 도입한 것이다. 그 뿐 아니다. 이번 연례 ‘빌드 개발자 컨퍼런스’에 앞서 열린 기조연설에서 구글은 또 “‘Copilot+ PC’라고 하는 새로운 윈도우 시스템 라인업과 함께, 사용자가 앱, 파일, 기타 콘텐츠를 찾는 데 도움이 되는 생성AI 기반의 ‘Recall’ 기능”도 공개했다.

이 역시 MS의 생성 AI 브랜드인 코파일럿과 윈도우11 환경이 한층 심층적으로 융합된 형태다. 또 구글의 태블릿PC 등 디바이스 브랜드의 새 버전 ‘마이크로소프트 서비스(Microsoft Surface)도 출시될 것으로 예고되었다.

MS는 특히 “이는 애플의 최고급 맥북 에어 M3보다 더 강력하고 58%나 더 속도가 빠른 제품”이라고 굳이 경쟁사의 사례를 들어 ‘차별화’를 강조하기도 했다.

저작권자 © 애플경제 무단전재 및 재배포 금지