脫미국, ‘AI 주권’ 위한 ‘소버린 AI’ 붐
美 AI기업 기술종속 탈피, ‘자국만의 언어, 가치관, 문화’ 반영 자체 데이터와 인력, 비즈니스 네트워크, ‘파라미터 1천억개 미만 LLM’ 구축도
[애플경제 김홍기 기자] 미국 중심의 빅테크의 AI에 종속되지 않고, 자국만의 언어와 기술, 가치관에 바탕을 둔 ‘소버린AI’(Sovereign AI) 붐이 갈수록 확산되고 있다. 미국을 제외한 주요국들이 제각기 ‘AI 주권’을 지향한 것이다. 오픈AI나 MS, 메타, 아마존, IBM, 애플 등 빅테크는 물론, 수많은 미국의 AI스타트업들은 독보적인 AI기술을 통해 세계 각국의 정보와 자산을 ‘스펀지’처럼 빨아들이며, 더욱 독점적 지위를 확고히 하고 있다.
이에 반발해 미국 AI 빅테크들에 종속되지 않는 독립적인 AI 기술과 역량을 쌓으려는 움직임이 지구촌 곳곳에서 등장하고 있다.
구글 딥마인드, 메타 출신 연구원들이 설립한 프랑스의 AI스타트업 미스트랄AI가 자체 생성형 AI 모델 ‘르 챗’을 개발한 경우가 대표적인 케이스다. 이는 스페인어, 프랑스어, 독일어 등 EU 회원국 언어로 검색과 분석을 할 수 있어, 유럽 국가의 사용자들에게 더욱 적합한 분석 도구로 평가받고 있다.
佛 미스트랄AI, 伊 패스트웹 등 EU 맞춤형 개발
역시 프랑스의 스케일웨이는 엔비디아 칩 기술을 활용해 유럽에서 가장 강력한 클라우드 네이티브 AI 슈퍼컴퓨터를 구축하고 있다.
이탈리아의 패스트웹 역시 엔비디아 기술과 자체 클라우드와 사이버 보안 인프라를 통해 자국 기업과 공공 행정기관, 스타트업들이 다양한 용도의 생성AI 애플리케이션을 개발할 수 있는 ‘엔드 투 엔드’ 시스템을 출시할 계획이다.
이같은 ‘소버린 AI’는 나라마다 각기 다른 자국 언어와 문화, 가치관을 담고 있다는게 무엇보다 큰 특징이다. 자체 인프라와 자국에서 생산되거나 수집한, 데이터, 자체 인력, 비즈니스 네트워크를 사용해 지역 언어와 문화, 가치관 등을 반영한 LLM를 기반으로 AI 서비스를 구축한 것이다.
이는 특히 미국 기업의 영향력이나 기술 종속에서 탈피, 자체적으로 기술을 발전시키고 자국의 AI역량을 강화하기 위한 노력이다. 각 나라 혹은 지역마다 고유한 방언·사투리, 문화, 가치관, 관행 등을 널리 포용하며, 다양한 현지 데이터를 학습하고, 인프라를 구축한다.
한편 가트너에 의하면 ‘소버린 AI’는 이제 ‘시장 태동기’(Innovation Trigger)를 지나 ‘과도한 기대 단계’(Peak of Inflated Expectations)로 진입했다. 국적을 불문하고 빠르게 널리 확산되고 있다는 의미다. 가트너는 또 ‘소버린 AI’가 시장의 주류로 성장하는 데는 2∼5년이 걸릴 것으로 내다보기도 했다.
인도, 핀란드, 일본, 대만 등…한국 ‘네이버’도 활발
좀더 구체적인 예를 보면, 인도 AI 스타트업인 크루트림은 인도어를 학습한 LLM ‘크루트림’을 공개했다. 이는 힌디어뿐 아니라 타밀어, 텔루구어 등 10가지 이상 현지어를 지원하고 있다. 또 중국의 스타트업 ‘문샷 AI’는 중국어 문장 처리에 특화된 챗봇 ‘키미’를 선보였다.
핀란드 스타트업 ‘사일로’는 북유럽 언어 기반 LLM인 ‘포로’와 ‘바이킹’을 공개했다. 핀란드어로 '순록'이라는 단어에서 이름을 딴 ‘포로’ 34B 모델은 알리바이(ALiBi) 임베딩이 포함된 블룸(Bloom) 트랜스포머 아키텍처를 사용했다. 영어와 핀란드어를 비롯해 파이썬이나 자바 같은 프로그래밍 언어를 포괄하는 21조 개 토큰에 달하는 다국어 데이터셋을 분할, 학습한 것이다. 일본의 파나소닉은 AI스타트업과 협력, 일본어에 특화된 LLM 개발 계획을 최근 발표(7.2)했다. 역시 일본의 NTT는 지난 3월 세계적 수준의 일본어 처리 성능을 갖춘 ‘츠즈미’를 공개했다. 이는 파라미터가 1천억 개로서, 업무용 LLM으로는 일본 최대 규모가 될 전망이다.
국내에선 2021년 초 네이버가 초거대 AI ‘하이퍼클로바’가 등장했고, 그후 지속적으로 성능을 개선해 후속 모델 ‘하이퍼클로바X’를 출시했다. 하이퍼클로바X는 자체 개발한 LLM을 바탕으로 한국어뿐 아니라 한국의 사회·문화 맥락에 대한 이해도가 높다는 평가다.
네이버는 최근엔 사우디아람코와 제휴, 중동 맞춤형 AI와 클라우드 구축에 나서고 있다. 또한 “국제 협력을 확대해 전 세계에 ‘소버린 AI’의 중요성을 알리고 기술력을 공유한다”는 구상이다.
각국 정부도 ‘소브린 AI’ 적극 지원 나서
‘소브린 AI’는 특히 각국 정부가 적극 나서고 있다. 이들 정부는 자국에 특화된 AI 모델 개발을 적극 지원하며, AI 주권을 강화하고 있다.
영국 정부의 경우 GPT-4 같은 파운데이션 모델 훈련을 위해 1억 파운드(약 1,742억 원)를 투자한데 이어, 슈퍼컴퓨터에 9억 파운드(약 1조 5,682억 원)를 투입했다. 특히 오픈AI·구글 등 미국 기업을 중심으로 형성 중인 ‘AI 패권’을 견제하고, 영국 문화와 역사에 초점을 맞춰 설계한 ‘브릿GPT’를 개발한다는 목표다.
인도는 또 국가 AI 인프라 강화를 위해 약 12억 4,000만 달러 규모의 자금을 지원하고 있다 이를 통해 최소 1만개의 GPU를 탑재하는 슈퍼컴퓨터 등을 구축한다는 계획이다. 그야말로 토종 LMM을 개발, 기술 자립과 함께 모든 사회 계층을 위한 AI 기술 민주화를 이룩한다는 목표다.
싱가포르는 엔비디아와 협력, 국가 슈퍼컴퓨터센터(NSCC)를 엔비디아 H100 GPU로 업그레이드하고 있다. 이와 함께 지난해 12월 LLM 구축 계획을 공식 발표하기도 했다. 네덜란드 정부는 지난 1월 개방형 LLM인 ‘GPT-NL’의 추가 개발을 포함한 ‘생성 AI 계획’을 발표했다. 이를 통해 자국과 EU 차원에서 슈퍼컴퓨터를 포함한 대규모 과학기술 기반 시설 투자를 감행한다는 계획이다.
일본도 미국 기술 의존도를 줄이기 위해 자 약 725억 엔(약 6,200억 원)의 자금을 기업들에 지원하고 있다. 또 엔비디아와 협력해 일본어에 특화된 LLM을 개발하고 있다. 대만은 지난 1월 중국의 AI 공세에 대응하기 위해 ‘소버린 AI’ 개발에 약 7,400억 원의 예산을 책정했다. 특히 대만 사람들이 즐겨 쓰는 ‘번체자’로 된 콘텐츠를 제공하는 AI 챗봇 ‘타이드(Taide)’ 개발에 집중할 계획이다.