10일 ‘구글 IO 2023’에서 공개, ‘LaMDA’ 기반 “곧 ‘PaLM’으로 구동”
한층 강력한 핵심 AI 모델과 멀티모달 챗봇 기능, 복잡한 추론과 수학 능력
[애플경제 김향자 기자]10일(현지 시각)구글이 마침내 MS의 ‘Bing’이나 오픈AI GPT-4를 따라잡기 위한 구글의 새로운 AI검색엔진 ‘매기(Magi)’를 공개한다. ‘매기’라는 명칭은 앞서 ‘뉴욕타임즈’를 통해 처음 알려졌다. 초대형 생성AI ‘구글 바드’가 접목된 신 개념 검색엔진 ‘매기’ 출시를 계기로 구글은 오픈AI의 GPT 기술을 넘어선다는 계획이다.
특히 ‘월스트리트 저널’은 구글의 기술 공개 행사인 ‘구글 IO 2023’을 앞두고 미리 구글의 ‘매기’에 관한 정보를 습득, 보도했다. 이에 따르면 구글의 ‘매기’는 짧은 동영상과 소셜 미디어 게시물이 표준 링크 목록과 함께 포함되는 등 좀더 아기자기하면서도 다양하게 만들어졌다.
또 ‘IT프로포탈’은 9일 구글 측의 표현을 빌려 “‘매기’는 딱딱한 검색 기능의 이미지를 탈피, 더욱 시각적이고, 재미있고, 감성적인 내용으로 만들려고 애를 썼다”고 했다.
빙(Bing)의 챗GPT 구동 로봇에 대항
‘매기’는 빙(Bing)의 챗GPT 구동 로봇에 대항한 AI봇이다. 여태까지 구글은 진작에 개발했던 챗봇 ‘바드’를 자사의 다른 제품에 접목하지 않았다. 그러다가 이번에 처음으로 검색엔진에 이를 접목한 ‘매기’를 출시한 것이다.
이는 “사용자가 여지껏 구글 검색 인터페이스를 통해 검색해본 적이 없는 결과와 답변을 기대할 수 있을 것”이란 기대다.
바드 챗봇, 즉 ‘매기’는 한층 강력한 핵심 AI 모델과 멀티모달 챗봇 기능을 갖추고 있다. 10일 열리는 연례 I/O 컨퍼런스의 가장 중심적인 이슈가 될 전망이다. CNBC는 구글의 내부 문서를 인용해 “I/O 발표문에 100개 이상의 언어로 훈련된 새로운 대형 언어 모델(LLM)인 PaLM 2가 포함되어 있다”고 보도하기도 했다.
앞서 지난 2022년 4월에 공개된 PaLM(Pathways Language Model)은 구글의 5400억 매개 변수 LLM이다. 이를 바탕으로 한 ‘매기’는 멀티모달, 그리고 복잡한 추론과 첨단 수학 능력을 갖춘 ‘멀티 바드’로 불리는 대형 모델을 기반으로 하고 있다.
멀티모달 생성 AI 모델은 사용자가 익숙해진 자연어 텍스트 입력 외에도 이미지 또는 소리와 같은 입력을 처리할 수 있다는 점이 특징이다. 앞서 멀티모달 모델의 대표적인 사례는 오픈AI의 새로운 GPT-4를 꼽을 수 있다. 이는 이미지에서 텍스트를 구문 분석하고, 차트 데이터를 요약하며 컴퓨터 비전용 비디오 피드의 요소를 식별할 수도 있을 정도다.
이전의 그 어떤 모델보다 입력된 자연어에 대해 더 복잡한 이해가 가능하고, 더 자세한 텍스트 응답을 생성할 수 있다.
‘바드’, “한층 재미있고 인간적이며 세밀한 검색”
한편 구글은 ‘바드’ 챗봇과 같은 고객 대면 제품에 PalLM을 활용하지는 않고 있다. PalLM은 출시 당시 오픈AI의 GPT-3 언어 모델과 비교되었으며, 현재 구글 바드의 배경이 된 모델인 람다(LaMDA)를 포함해 모든 동시대 모델을 능가한다는 평가다.
구글 CEO 순다르 피차이는 ‘뉴욕 타임즈’의 팟캐스트인 하드 포크와의 인터뷰에서 “‘바드’는 현재는 ‘LaMDA’ 모델에 기반을 두고 있지만, 곧 ‘PaLM’에 의해 구동될 것”이라고 말했다.
피차이는 “‘바드’를 더 유능한 PaLM 모델로 업그레이드할 것”이라며 “그래서 추론, 코딩 등 더 많은 기능을 제공할 계획”이라고 밝혔다. ‘바드’의 경우 챗GPT보다 훨씬 더 개인적인 주장이나 부정확한 주장을 하기 쉽다는 사실이 밝혀진데 따른 개선책으로 해석된다.
‘IT프로포탈’에 의하면 시장조사기관 ‘CCS Insight’는 업계의 또 다른 전문가들의 말을 빌려 “구글의 이번 I/O 발표는 자사의 의료용 대형 언어 모델 ‘Med-PalLM 2’를 따를 것”이라고 전했다.
앞서 지난 4월 중순에 ‘바드’는 코드 생성과 번역 기능을 완성했다. 테스트 결과 GPT-4나 Bing 채팅과도 직접 연결, 코드를 생성하거나 번역을 할 수 있는 것으로 나타났다. ‘바드’의 개선된 코드는 구글렌즈를 사용, 흐름도를 코드로 변환하거나, 생성된 코드의 정확도를 단순하지만 효과적으로 개선하는 것을 목표로 한다.
구글 측은 “현재 사용자는 모델이 생성한 코드를 포함하여 바드에게 코드를 더 효율적으로 만들 것을 요청할 수 있으며, 이러한 라인에서 모델을 개선하여 보다 효율적인 코드 출력을 제공할 수 있다”고 ‘테크레이다’에 밝혔다.
‘테크레이다’는 “이 기능은 구글의 AI 제품 중 몇 안 되는 것 중 하나로, 지금 당장 확실한 사업 이익을 창출할 수 있고, 인기 있는 깃허브 코파일럿과 같은 방식으로 프로그래머들을 지원할 수 있다”고 덧붙였다.
이들 전문가에 의하면 새로운 멀티모달 ‘바드’가 PaLM 2의 직접적인 파생 모델로 나올지는 아직 확실하지 않다. 다만, GPT-4가 GPT-3이었던 것처럼, ‘바드’가 PaLM의 직접적인 후속 모델임은 분명하다.
