프랑스 스타트업 개발, 출시, 매개변수 73억개…‘무료 배포’
‘GPT-4, 메타의 라마2에 버금’ 주장, ‘텍스트작성, 요약, 문답 등’
[애플경제 이윤순 기자] 프랑스의 한 스타트업이 오픈AI의 GPT-4나 메타의 LLama 2에 버금가는 대형 언어모델을 개발, 세계 각국을 대상으로 무료 배포에 나서 관심을 끌고 있다.
프랑스의 생성 AI 스타트업인 Mistral AI(미스트랄 AI)는 최근 대형 언어 모델인 ‘Mistral 7B’를 자체적으로 개발, 사용자 제한 없이 무료로 다운로드할 수 있도록 하고 있다.
미국이 주도하고, 중국, 한국 등이 뒤를 이어 기술 경쟁을 벌이고 있는 글로벌 생성AI 시장에 프랑스도 본격 뛰어든 셈이다. 28일(현지시각) ‘테크리퍼블릭’, ‘인사이더’ 등 기술매체들에 의하면 미스트랄 7B는 73억 개의 매개변수를 가지고 있으며 메타의 라마2(Llama 2)와 경쟁할 만한 수준으로 인정받고 있다. 이는 특히 미스트랄AI사의 블로그 게시물에서 직접 다운로드 받을 수 있어 인기가 높다.
‘개방적이고 커뮤니티 중심으로 차별화’
미스트랄AI는 “본사의 LLM은 독점적이지 않고 개방적이고 커뮤니티 중심이라는 점에서 라마2 및 GPT-4와 같은 경쟁 제품과 다르다”고 차별화를 강조했다.
이에 따르면 미스트랄7B는 무료로 다운로드받을 수 있고, 커뮤니티 소통을 위해 디스코드 (Discord) 채널과 깃허브 페이지를 설정한다. 또 “아파치2.0 상업용 라이센스에 따라 출시되며, 사용 방법이나 대상에 대한 제한이 없다”며 기존 생성AI제품들과의 차이점을 부각시켰다.
Mistral AI사는 27일 블로그 게시물에서 “커뮤니티 지원 모델 개발은 언젠가 있을 수도 있는 (정보와 표현물에 대한) 검열과 편견에 맞서 싸울 수 있는 가장 확실한 길”이라며 “앞으로도 모델 크기와 비용을 조정함으로써 더 저렴하고 지연을 줄일 수 있는 생성AI를 만들 수 있을 것”이라고 확언했다.
Mistral AI는 (매개변수 70억개 수준인) Mistral 7B가 리마2를 포함, “최대 130억개 매개변수까지 사용 가능한 모든 개방형 모델보다 성능이 뛰어나다”고 주장했다.
특히 그룹화된 쿼리 기능(Attention)은 추론 속도를 높이고 슬라이딩 윈도우 기능은 긴 시퀀스를 비용 효율적으로 처리한다고 강조했다. 또 이를 위해 자사 연구팀은 “최고 성능의 머신러닝옵스(MLops) 스택을 재구축하고, 고도의 정교한 데이터 처리 프로세싱을 설계하며 3개월 간 집중적인 개발 작업을 벌인 결과”라고 소개했다.
“맞춤형 모델 생성AI 모델 추세에 적합”
다른 생성 AI와 마찬가지로 Mistral 7B는 텍스트를 생성하고, 코드를 작성하며, 텍스트를 요약하고, 질문에 답할 수 있다. 특히 Mistral AI는 “Mistral 7B LLM이 흔히 벌어지는 AI 기반의 잘못된 출력 정보를 방지, 교정하는 수단이 될 수 있다”고 강조했다.
공공 기관이나 민간 기업이 생성AI 시스템의 결함을 감사하고, 생성 모델의 잘못된 사용을 감지할 수 있는 도구로 유용할 것이란 얘기다.
특히 최근 기업 내부의 특정한 목적이나 용도를 위한 맞춤형 생성AI 모델을 선호하는 추세와도 부응한다고 소개했다. 즉 모델을 압축하고 이를 특정 양식에 연결함으로써 맞춤화하는 데 도움이 될 것이란 얘기다.
Mistral AI는 향후 생성 AI의 유료 버전을 판매할 것으로 알려졌다. 현재까지 알려지기론 유료 버전은 훈련 가중치와 코드 소스가 사용자에게 공개된 ‘화이트 박스’ 솔루션을 제공한다. 또한 불특정한 날짜에 호스팅 솔루션과 전용 엔터프라이즈 배포를 제공할 것으로 예상된다.
한편 Mistral AI 공동 창립자이자 CEO인 아르투르 멘슈는 이전에 알파벳 딥마인드사에서 연구자로 근무한 것으로 전해졌다. 수석 과학자이자 공동 창립자인 기욤 랑플 역시 메타(페이스북 시절) AI 연구자였고, CTO 티모시 라크롸도 메타의 연구 엔지니어로 근무한 것으로 알려지고 있다. 메타와 알파벳 출신들이 주축이 돼 세워진 스타트업인 셈이다.
