초지능 ‘프런티어AI’ 경쟁 가열…‘아마존 노바’ 깜짝 출시

아마존, ‘마이크로’, ‘라이트’, ‘프로’, ‘프러미어’ 등 4종류 출시 이미지·비디오·텍스트 등 멀티모달, 사용자 ‘LLM 경량화’ 기능 등 “구글 제미니, 오픈AI GPT-4 추월”…‘프런티어AI 추구’ 선언

2024-12-04 김예지 기자

아마존 기술 컨퍼런스 're-invent 2024' 로고. (출처=Future)

[애플경제 김예지 기자] 아마존이 최첨단 초지능에 가까운 프런티어AI 기술인 ‘아마존 노바(Amazon Nova)’를 깜짝 출시, 비상한 관심을 끌었다. 3일 열린 ‘AWS re:Invent 2024’에서 모습을 드러낸 CEO 앤디 제시는 “구글 제미니와 OpenAI의 GPT-4와 경쟁할 강력한 새로운 AI 모델을 출시할 것”이라고 밝혔다.

이날 행사에 따르면 이번에 발표된 ‘아마존 노바’는 4단계로 제공되는 기준 모델과, 이미지 및 비디오 중심 모델이 모두 포함되었다. 이에 따르면 일단 ‘노바’는 다양한 멀티모달 상호 작용을 포괄하는 기초모델이다.

가격별, 성능별로 구분, 출시 예정

기존 ‘아마존 베드록’(Amazon Bedrock)에서 제공되는 ‘노바’는 가격별로 4가지가 있고, 텍스트와 비디오에 초점을 맞춘 2가지 인스턴스를 포함, 다양한 모양과 크기로 제공된다. 그 중 ‘노바 마이크로’(Nova Micro)는 가장 기본적인 옵션이다. 이는 저렴한 비용으로 가장 낮은 지연 응답을 제공하는 텍스트 전용 모델로 알려졌다.

‘노바 라이트’(Nova Lite)는 그 다음 단계다. 이는 저렴한 비용으로 이미지, 비디오, 텍스트 입력을 처리하는 멀티모달 모델이다. 공식 출시될 경우 그 때문에 상당한 호응을 얻을 것으로 보인다.

‘노바 프로’(Nova Pro)는 그 보다 한 단계 위다. 다시 ‘노바 프러미어’(Nova Premier)는 최고 수준의 프런티어AI라고 할 수 있다. 이는 최고 수준의 AI기능을 제공하고, 모델 ‘증류’에 사용할 수 있으며, 이번 ‘AWS re:Invent 2024’에서도 특히 눈길을 끈 바 있다. 또한 사용자가 대규모 언어 모델(LLM)을 특정 사용 사례에 맞게, 경량화할 수 있다는 점이 대표적인 특징이다.

아마존은 “아마존 노바 캔버스(Amazon Nova Canvas)와 아마존 노바 릴(Amazon Nova Reel)은 각각 이미지와 비디오를 생성한다.”고 강조했다. 제시는 특히 일부 벤치마킹 테스트를 설명했다. 이에 따르면 특정 벤치마크에서 ‘라마’와 ‘제미니’를 포함한 유사한 형태와 크기의 여러 주요 모델과 동등하거나 더 우수한 것으로 전해졌다.

(출처=게티 이미지)

“외부 벤치마크서 제미니, GPT4o미니 앞서” 주장

제시는 “가능한 한 외부에서 게시된 벤치마크를 사용했다”면서 “그렇게 할 수 없는 경우에만 직접 테스트를 했다”고 밝혔다. 그러면서 “웹사이트에 방법론을 게시했으므로 원하면 시도해 보고 복제할 수도 있다.”고 덧붙였다.

그에 따르면 ‘노바 라이트’(Nova Light) 모델이 19개 벤치마크 중 17개가 오픈AI의 GPT-4o 미니와 동등하거나 더 우수하다. 또 21개 벤치마크 중 17개에서 제미니와 비슷하거나 더 우수하다. 제시는 또 비용 효율성에 대해서도 언급하면서 “‘베드록’의 다른 가중치 모델보다 약 75% 저렴하다”고 언급했다.

한편 아마존은 가까운 미래에 ‘음성 대 음성 모델’과 ‘any-to-any’ 모델을 출시할 것으로 알려졌다. 이는 기본적으로 완전한 멀티모달 상호 작용을 제공하는 모델이다. 이에 제시는 ‘any-to-any’ 모델을 언급하며, “텍스트, 음성, 이미지, 비디오를 입력하고 텍스트, 음성, 이미지, 비디오를 출력할 수 있다.”고 소개했다. 특히 그는 “이것이야말로 ‘프런티어AI’ 모델을 구축하고 사용할 수 있는 가능성을 연 것”이라고 했다.