오픈AI GPT4o, 구글 제미니 능가, ‘AI역량 평가’서 최우수
앤트로픽, 멀티모달 모델 ‘클로드 3.5, 소네트’ 등 ‘클로드’ 시리즈
퍼플렉시티, ‘Sonar 8B’ 기반 무료검색모델, 유료모델 ‘pro’ 운영

퍼플렉시티AI의 웹 사이트.
퍼플렉시티AI의 웹 사이트.

[애플경제 김예지 기자] 생성AI의 최강자가 오픈AI라면, 검색시장의 왕자는 구글이다. 그러나 최근 이들 두 기업의 아성에 도전하며 ‘떠오르는 별’로 주목받는 AI스타트업들이 있어 눈길을 끌고 있다. ‘클로드’ AI 시리즈로 오픈AI에 도전하는 앤트로픽과, 구글의 키워드 검색 기능을 능가하는 생성AI 기반 검색서비스로 주목받는 퍼블렉시티AI가 그들이다.

이들 두 기업은 기술력이나 성능 측면에서 오픈AI, 구글을 능가하거나 위협하는 수준이어 눈길을 모으고 있다. 특히 ‘월스트리트 저널’의 AI기술력 평가에서 오픈AI GPT시리즈, 구글이 제미니 시리즈를 제치고, 단연 최우수 AI 역량으로 평가받아 기염을 토하기도 했다.

앤트로픽 웹사이트 캡처 이미지.
앤트로픽 웹사이트 캡처 이미지.

‘소네트’…GPT-4o, 제미니 1.5 프로, 라마3 400B 능가

이들은 오픈AI의 GPT시리즈와 차별화된 AI기술을 잇따라 선보이며, 발군의 실력을 과시하고 있다.

우선 앤트로픽은 지난달 21일 오픈AI의 최첨단 GPT-4o 성능을 압도하는 ‘클로드 3.5’ 버전인 ‘소네트’를 출시했다. 앤트로픽은 이 제품을 출시하면서 “국제 벤치마크에서 오픈AI의 최신 모델 GPT-4o 성능을 앞섰다”며 의기양양해 했다.

‘소네트’는 앤트로픽 제품군 중 중간급 모델로 평가된다. 이미지 인식 능력을 갖춘 멀티모달 모델의 일종이기도 하다. ‘클로드 3.5’ 모델은 ‘소네트’ 외에도 ‘클로드 3.5 오퍼스(Opus)’, ‘경량 모델 클로드 3.5 하이쿠(Haiku)’ 3종으로 구성된다. ‘소네트’는 이미지 인식 능력을 평가하는 표준 비전 벤치마크에서도 전 세대 모델인 ‘클로드 3 오퍼스’ 성능을 크게 앞선다는 평가다.

특히 벤치마크 8개 중 7개, 비전 벤치마크 5개 중 4개 분야에서 GPT-4o와, 제미니 1.5 프로, 메타의 라마3 400B 등 첨단 모델을 능가한 것으로 나타났다. 이것만 보면 글로벌 AI업계 최고의 기술력을 지닌 것으로 평가할 만하다. 특히 ‘대학원’ 수준의 추론 능력(GPQA)은 59.4%로 GPT-4o(53.6%)를 앞섰고, 파이썬 코드 완성 테스트를 통한 벤치마크 코딩 능력(HumanEval) 역시 92.0%로 GPT-4o(90.2%)보다 우위인 것으로 나타났다.

또한 멀티모달 과제를 수행하는 경우도 차트 이해도와 문서 이해도 부문에서 각각 90.80%, 95.2%의 점수를 받아, 85.7%, 92.8%를 기록한 GPT-4o를 능가했다.

앤트로픽, “현존 가장 지능적인 모델” 자부

클로드 3.5 ‘소네트’는 중간 크기의 모델이지만 앞선 세대 최고 모델인 ‘클로드 3 오퍼스’의 성능도 추월하며 현재 가장 지능적인 모델이라는게 앤트로픽의 설명이다. 이는 또 불완전한 이미지에서 텍스트를 정확하게 전사(transcription)할 수 있다. 텍스트보다 이미지, 그래픽, 일러스트레이션에서 더 많은 정보를 얻을 수 있는 소매, 물류, 금융 서비스에 매우 긴요하게 쓰일 것이란 전망이다.

이는 특히 “코딩 능력이 뛰어나 정교한 추론이나 문제 해결 기능을 통해 독립적으로 코드를 작성·편집·실행할 수 있으며 ‘코딩 AI 에이전트’ 수준으로 활용할 수 있다”는게 앤트로픽의 설명이다.

그 동안 앤트로픽은 이미지 생성 기능은 제외했다. 이는 비즈니스를 위해 그런 기능이 필요할 수도 있지만, 실제로 기업에게 별로 필요없는 기능이라고 판단한 때문이다. 그러나 최근엔 영국 인공지능 안전 연구소(UK AISI)에 텍스트-이미지 모델을 제출, 테스트를 완료했고, 미국 인공지능 안전 연구소(US AISI)와도 결과를 공유, 안전성도 확보한 것으로 전해졌다.

클로드가 생성한 결과물을 사용자가 실시간으로 확인하면서 편집·구축할 수 있는 아티팩트(Artifacts) 기능도 등장했다. 이는 웹에서 클로드가 생성한 콘텐츠를 프로젝트와 작업 절차에 원활하게 통합할 수 있도록 지원하는 일종의 작업 공간 역할을 한다. 예를 들어 클로드가 이메일을 작성해 주면, 아티팩트를 통해 확인하고 해당 이메일을 텍스트 편집기로 복사하지 않고 클로드 앱 내에서 직접 수정할 수도 있다.

앤트로픽 클로드 3.5 소네트 모델. (출처=앤트로픽)
앤트로픽 클로드 3.5 소네트 모델. (출처=앤트로픽)

퍼플렉시티, ‘구글의 대항마’로 인식돼

퍼플렉시티도 앤트로픽 못잖게 오픈AI에 맞선 강력한 다크호스로 부상하고 있다. 이 회사는 특히 구글 검색 시장에 도전하는 잠재력으로 주목받기도 한다. 퍼플렉시티는 본래 오픈AI 출신의 아라빈드 스리니바스를 포함한 4명의 AI 관련 엔지니어들이 지난 2022년 8월 캘리포니아주 샌프란시스코에 설립한 스타트업이다. 오픈AI의 일급 ‘두뇌’들이 빠져나가 친정에 도전하는 셈이다.

펴플렉시티는 생성AI 기반 검색엔진 기술에 특히 주력하고 있다. 자체 언어모델인 ‘Sonar 8B’을 기반으로 동작하는 무료모델과, 유료인 ‘pro’를 운영하고 있다. ‘pro’는 GPT-4. 클로드 3, 소나 70B 모델 등을 이용한 것이다. 덕분에 이 회사는 설립 1년 반 만에 유니콘 기업으로 성장한 바 있다.

퍼플렉시티는 그래서 ‘구글의 대항마’로 불리기도 한다. 기존 구글 검색 서비스의 한계를 생성AI 기술로 넘어섰기 때문이다. 즉, 기존 구글 검색엔진은 키워드 기반 검색 방식으로, 사용자의 복잡한 질문에 적절한 대답을 제시하는 데 한계가 있다. 또 여러 웹페이지를 연결해 제공하기 때문에 사용자가 원하는 핵심 정보를 빠르게 얻는 데는 부족했다는 평가다.

그러나 퍼플렉시티는 LLM 기반으로 사용자와 대화하며 검색 서비스를 제공한다. 검색 결과의 기사, 보고서를 다양한 형식의 웹페이지로 변환하는 도구도 출시했다. 질문에 대한 간결하고 직접적인 대답을 생성해 제공함으로써 기존 검색 서비스의 단점을 보완하며, AI가 생성한 답변의 근거가 되는 정보 출처도 함께 제시하고 있다.

퍼플렉시티AI의 '소나 8B' 기반 검색 엔진. (출처=퍼플렉시티AI)
퍼플렉시티AI의 '소나 8B' 기반 검색 엔진. (출처=퍼플렉시티AI)

1년 반만에 ‘유니콘’, 메가 라운드 투자도 유치

퍼플렉시티는 이미 전 세계적으로 매월 2억 3천개가 넘는 검색 요청을 처리한 것으로 알려졌다. 지난 5월 ‘월스트리트 저널’에서 발표한 ‘챗봇 사용성 평가’(The Great AI Chatbot Challenge)에서도 종합 1위를 차지해 업계를 놀라게 했다. <애플경제>도 이를 인용 보도한 바 있듯이, 특히 문서나 자료, 텍스트를 요약하는 기능에선 퍼플렉시티가 가장 뛰어났다. 또한 코딩 역량도 매우 우수한 것을 나타났다.

이런 기술력을 바탕으로 지난 1월 엔비디아와 아마존 등으로부터 투자를 유치하면서 현재 25~30억 달러 규모의 메가 라운드 투자를 유치하고 있는 중이다. SKT도 생성AI 기반 검색 기능이 전통적인 키워드 검색시장을 대체할 것으로 전망하며 퍼플렉시티에 1천만 달러(약 139억 원)를 투자한 바 있다. 퍼플렉시티도 SK텔레콤이 2023년 미국 실리콘밸리에 설립한 ‘글로벌 AI 플랫폼 코퍼레이션(GAP Co.)’에 곧 투자하기로 합의했다. GAP Co.는 SK텔레콤의 글로벌 AI 서비스 개발 주체다. 앞으로 퍼플렉시티와 함께 AI 검색 서비스를 공동개발하는 것이 목표다.

퍼플렉시티는 향후 자사 고객에게 유료 구독형 검색 서비스인 ‘퍼플렉시티 프로’를 1년간 무료로 제공할 계획이다. 또 에이닷, T우주, T멤버십 등 다양한 채널을 통해 공동 마케팅도 추진한다는 계획이다.

저작권자 © 애플경제 무단전재 및 재배포 금지