심층기획(10-①)-지금 IT ‘화두’는…LLM vs sLM
천문학적 비용․시간 드는 LLM 대신 sLM으로 선회, '경량화' 매개변수 수십억 개가 대부분, 의료․배송․마케팅 등 특화된 용도
[애플경제 김예지 기자] -------------------------------------------------------
2024년 들어 생성AI를 비롯해 IT기술 전반에 걸쳐 혁명적 변화가 이어지고 있다. 이에 연초부터 국내외 각종 연구기관들마다 다양한 기술 전망을 내놓은 바 있다. 그 중에서도 금년 이후 적어도 수 년 간 지속될 기술 트렌드가 특히 눈길을 끈다. 가장 대표적인 것이 생성AI와 그로 인한 디지털 기술패턴과 IT문명의 변화다. 전문가들의 진단과 전망을 추려보면 대략 ▲AI ‘경량화’로 일상화 ▲반도체 혁명 ▲모빌리티와 자율행동체 ▲AI를 밑천삼은 크리에이터 이코노미 ▲앰비언트 디지털 ▲오픈랜과 네트워크 지각 변동 ▲디지털기술에 대한 ‘SW 재정의’ ▲디지털로 재난과 위기 극복 ▲IT 패권 경쟁 치열 ▲기술 만능의 테크노피아에 대한 각성 등을 들 수 있다. 이들 ‘화두’를 10회에 걸쳐 연재함으로써 지금 디지털 기술의 알파와 오메가에 접속해본다. (편집자 주)
------------------------------------------------------------------------------------
지난 2023년 오픈AI가 내놓은 챗GPT의 등장은 그 동안 지속되어온 AI 산업의 ‘터닝 포인트’가 될 만한 희대의 ‘사건’이었다. 매개변수 1700억개에 달하는 챗GPT는 이른바 초거대 언어모델(LLM)의 시초로서, 이제껏 없었던 생성AI 플랫폼을 세상에 선보였다. 이는 그간 유례가 없었던 ‘AI기술문명의 폭발’을 유발할 만큼 충격적이었다.
챗GPT, 생성AI 기반 LLM 쏘아올려
사용자들은 챗GPT의 프롬프트(입력)를 통해 다양한 질문을 할 수 있고, 이에 챗GPT 역시 웬만한 석학 못지않은 답변을 내놓곤 했다. 그러나 때로는 환각과 오류 등의 부작용을 빚으며, 세간의 비웃음과 비판을 감수하기도 했다.
이에 오픈AI는 GPT-3, GPT-4, 그리고 최근의 GPT-4o에 이르기까지 지속적인 업그레이드를 하며 챗봇의 성능을 높여왔다. 향후 매개변수가 1조개를 넘는 LLM 출현까지 예고하는 가운데, 챗GPT와 유사한 초대형 생성AI 봇들이 잇따라 등장했다.
챗GPT가 등장한지 2달만에 이용자가 1억명에 달한데 이어, 2023년들어 경쟁사들도 각기 생성AI 기반의 LLM모델을 개발, 출시했다. 대표적으로 구글의 대화형 AI ‘바드’에 이어, 마이크로소프트의 생성AI 비서를 표방한 ‘코파일럿’, 메타의 대화형 챗봇 ‘라마’1, 그리고 ‘라마2’,‘라마3’로 이어졌다. 그 중 ‘바드’는 치명적인 오류로 인해 서비스 일부가 중단되었으며, 구글이 금년 초에 출시한 ‘제미니’가 그 자리를 대시하고 있다. ‘제미니’ 역시 일부 성능에 문제가 있긴 하지만, 그런대로 무난한 제품으로 평가받으며 현재 활발하게 보급되고 있다.
초거대 AI모델, 치열한 차별화 경쟁 이어져
그런 가운데 이들 초거대 AI모델 간에도 차별화 경쟁이 치열하게 이뤄지고 있다. 오픈AI는 GPT-4를 기반으로 한 멀티모달, 즉, 텍스트를 이미지나 동영상으로 전환할 수 있는 기술을 선보였다. 그러다가 지난 3월엔 텍스트-동영상 전환 AI모델인 ‘소라’(Sora)를 개발, 세상을 놀라게 했다.
또 구글은 2023년 5월, “(GPT보다) 더욱 강력한 기술”인 ‘Pathways Language Model 2’ 또는 ‘PaLM 2’의 최신 버전을 공개하면서 “‘제미니’라는 이름의 훨씬 더 큰 모델에 대한 작업이 시작되었다”고 말했다. 특히 눈길을 끄는 것은 ‘PalLM 2’는 전세계 120개국에 이를 보급하면서, 유독 ‘한국어’와 ‘일본어’ 버전을 따로 출시한 점이다. 구글은 그러면서 “100개 이상의 언어에 걸쳐 있는 다국어 텍스트에 대해 더 엄격하게 훈련되었다”고 덧붙였다.
이에 오픈AI는 다시 GPT-4에 대한 플러그인으로 유료 API를 제공하는 등 강수로 대응했다. GPT-4에 대한 나름의 독자적 생태계를 구축하겠다는 의도로 읽힌다.
메타 역시 ‘라마2’에서부터 모델을 오픈소스로 공개하며, 시장 점유율을 높이는 전략에 나섰다. 최근엔 ‘라마3’를 개발, 출시하며 생태계 확장 전략에 박차를 가하고 있다.
이 밖에 2024년 들어 앤트로픽의 클로드3, 퍼플렉시티 AI의 ‘퍼플렉시티’ 등이 잇달아 출시되며, AI챗봇시장 경쟁은 더욱 치열해지고 있다.
국내 기업들도 합종연횡으로 생성AI모델 주력
국내에서도 삼성의 ‘가우스’, 네이버의 ‘클로바X’, ‘하이퍼클로바X’를 개발, 출시한데 이어, SK텔레콤은 지난해 AI 개인비서 '에이닷'을 출시, AI 기반 통화녹음 및 요약으로 아이폰 사용자들에게 호응을 얻었다. KT도 이미 AI 통화비서 '보이스 스타일링'을 서비스하고 있고, AI 문맥 맞춤 광고 서비스를 준비하고 있다. 또한 자체 LLM '믿음'와 더불어 경량형인 sLLM을 공급할 예정이다.
LG유플러스도 AI 기반 소호 솔루션인 '우리가게패키지 AX솔루션'을 서비스 중이다. 또 자제 개발 중인 생성형 AI ‘익시젠’을 상반기 중 출시하고, 이용자의 피부에 와닿는 서비스인 ‘챗 에이전트’를 선보인다는 계획이다.
이들 국내 IT 기업들은 또 LLM 내지 sLM 개발을 위해 국내외 다른 기업들과 합종연횡의 제휴와 협력을 반복하고 있다. ‘하이퍼클로바X’로 국내 LLM 분야에서 선두를 달리는 네이버도 삼성전자·인텔과 손을 잡았다. ‘코GPT’를 준비하던 카카오는 메타, IBM, 인텔 등이 참여한 국제 ‘AI 얼라이언스’에 합류했다. 국내 이동통신3사도 이같은 글로벌 기업과의 협력에 몰두하며, LLM 개발에 목을 매고 있다.
LLM보다 실속있는 sLM으로 ‘AI 생활화’ 박차
이런 생성AI 개발 경쟁 국면에서 최근 두드러진 경향은 AI 경량화, 즉 sLM 개발 경쟁이다. 흔히 초거대 AI, 즉 LLM을 개발하기 위해선 천문학적 비용과 함께 엄청난 분량의 데이터를 수집해야 한다. 최근 무단으로 데이터를 수집하다가 ‘뉴욕타임스’의 저작권 침해 소송을 당하거나, 배우 스칼렛 요한슨의 음성을 허락없이 도용하다가 구설수에 오른 오픈AI도 대표적인 경우다. 이는 비단 오픈AI만이 아니라 AI를 개발하고 있는 빅테크 공통의 고민꺼리다. 이에 아예 언론사 등과 제휴를 맺기도 하지만 막대한 로열티를 지불해야 하는 것도 부담이다.
실제로 오픈AI의 GPT-3는 훈련비용만 1천만달러, 하루 운영비 70만달러에 달한다. 그 바람에 2022년 현재 오픈AI는 한화로 7천억원 이상의 적자를 감수해야 했다. 또 구글 팜(PaLM)의 경우 슈퍼컴퓨터 2대로 50일 이상 훈련할 정도로 시간도 오래 걸린다. 뿐만 아니라 GPT-4의 경우 한달에 7200메가와트의 전력, 즉 화력발전소 2기 분량의 전기가 들어갈 정도로 막대한 에너지가 소요된다.
이에 합성데이터, 혹은 가상의 데이터가 유행하기도 한다. 이는 기왕의 AI학습에 써먹었던 데이터를 다시 재합성하거나 가공해서 만든 가상의 데이터로서, 실제 팩트에 근거한 데이터를 대체할 목적이다. 그러나 이는 실제 데이터에 비해 정확도나 학습 효과 등에서 뒤처짐으로써 완성된 AI모델이 오류나 환각을 불러일으킬 우려가 크다는 지적이다.
이런 이유로 광범위한 목적의 LLM이 아닌, 특정한 용도에 특화된 소형 AI모델, 즉, sLM에 많은 기업들이 눈을 돌리고 있다.
적은 매개변수 불구, ‘특화 성능’ GPT 3.5 능가
이는 매개변수 자체가 적다. 수천억개의 LLM 매개변수를 수백 내지 수십억개로 줄인 것이다. 예를 들어 스탠포드대학의 ‘알파카’는 매개변수가 불과 80억개로서, 개발에 불과 3시간 걸렸고, 비용도 600억 달러가 들었다. 그럼에도 이는 문서작성, 특히 이메일, 그리고 소셜미디어 작성을 할 때 GPT 3.5 성능을 일부 능가할 정도로 뛰어난 것으로 알려졌다.
또 마이크로소프트(MS)의 PHI-1 모델은 매개변수가 불과 13억개다. 이는 엔비디아 A100칩 8개로 불과 4일간 학습한 끝에 개발해낸 것이다. 그러나 정작 이는 콘텐츠 제작이나, 소셜미디어 작성 등에서 GPT3.5의 성능을 능가할 정도임이 확인되기도 했다. MS는 그 후 PHI-2, PHI-3를 잇달아 개발하며 업그레이드된 기술을 선보였다.
이같은 sLM은 생성AI의 일상화를 촉진하며, 새로운 AI시대를 열어제쳤다는 평가다. 특히 의료분야에서 사람 의사보다 암을 더 정확하게 발견해내며, 보고서 작성시간을 절반 가깝게 줄였다는 체험담도 잇따르고 있다. 특히 마케팅 분야에 이를 도입, 주당 5시간이나 업무를 절약할 수 있었다는 보고도 전해지고 있다. 이 밖에도 AI카피라이팅, 레시피 추천, 배송, 금융, 교육 등 산업 전 분야에 걸쳐 sLM시대를 열며, 생성AI의 새로운 지평이 펼쳐지고 있다.