구글도 메타 흉내? “새 AI모델 ‘젬마’ 오픈소스로”
“개발자나 사용자 누구나 무료 AI툴로 사용할 수 있어” 개발자들 구글 클라우드로 유인, ‘구글AI 생태계’ 구축 의도? 매개변수 20억~70억개, 엔비디아 “‘젬마’와 연동” 밝혀
[애플경제 이윤순 기자] [애플경제 이윤순 기자] 구글도 메타처럼 일반 개발자들이 자유롭게 갖다 쓸 수 있는 새로운 공유 AI모델 ‘젬마’(Gemma)를 출시했다. 이는 개발자나 사용자 누구나 자신의 AI툴로 사용할 수 있도록 무료로 널리 개방된 AI 모델이다.
구글은 21일 “개인과 기업이 ‘젬마’라는 새로운 ‘개방형 모델’ 제품군을 기반으로 한 AI 소프트웨어를 무료로 구축할 수 있을 것”이라며 “소위 모델 중량과 같은 주요 기술 데이터를 공개적으로 제공하고 있다”고 로이터 통신에 밝혔다.
이러한 움직임은 구글 나름의 전략의 일환으로 해석된다. 즉, 소프트웨어 엔지니어들이 구글의 기술을 기반으로 AI 솔루션을 구축하고, 구글로선 수익성이 큰 구글 클라우드를 더 많이 사용할 수 있도록 유도하는 것이다. 나아가선 ‘구글 AI생태계’를 구축한다는 의미도 깃들어있다.
실제로 ‘테크크런치’는 “이 모델은 구글 클라우드에 '최적화'되어 있으며, 처음 클라우드를 사용하는 고객은 300달러의 크레딧을 받을 수 있다”고 구글을 인용, 보도하기도 했다.
저작․소유권 설정 등 “완전한 오픈소스 아냐” 평가
그럼에도 구글은 ‘젬마’를 완전한 오픈 소스로 만드는 데는 실패한 것으로 평가된다. 즉, 구글이 여전히 저자권이나 소유권을 주장하며 언제든 권리를 실현하거나 개입할 수 있다는 얘기다.
이에 일부 전문가는 “오픈 소스 AI가 남용되지 않기 위한 최소한의 조치”라고 한 반면, 또 다른 전문가는 “이 기술에 기여하고 혜택을 받을 수 있는 사람들의 범위를 넓혀가는 접근 방식이 더 나을 것”이라고 상반된 입장을 보이기도 했다.
다만 구글은 ‘젬마’는 공개 소스로 개방했지만, 자사가 개발한 거대한 첨단 모델 ‘제미니’는 공개할 의도가 추호도 없는 것으로 알려졌다.
이번에 오픈소스로 공개된 ‘젬마’ 모델의 크기는 20억 또는 70억 개의 매개변수, 즉 알고리즘이 출력을 생성하기 위한 다양한 값의 수로 구성되어 있다. 그러나 이는 메타의 라마2(Llama 2) 모델에는 약간 못미친다. ‘라마2’는 70억~700억 개의 매개변수를 갖고 있어 중간 크기의 LLM이라고 할 수 있다.
그러나 구글은 가장 큰 ‘제미니’ 모델은 의 크기조차 밝히지 않고 있다. 지난 2020년에 처음 발표된 오픈AI의 GPT-3 모델에는 1,750억 개의 매개변수가 있다. ‘제미니’는 아마도 그보다는 현격한 차이로 규모가 클 것으로 보인다.
한편 엔비디아는 21일 “‘젬마’ 모델이 본사 칩에서 원활하게 실행되도록 구글과 협력하고 있다”고 밝혀 눈길을 끌었다. 엔비디아는 또한 “윈도우 PC에서 AI 모델을 실행하기 위해 개발 중인 챗봇 소프트웨어가 ‘젬마’와 연동되도록 곧 만들 것”이라며 구글에 호응하고 나섰다.