120억개 매개변수, 용량 24GB ‘Pixtral 12B’ 출시
무료 오픈 모델, ‘이미지와 텍스트를 모두 처리’
[애플경제 이지향 기자] 프랑스의 AI 스타트업 Mistral이 이미지와 텍스트를 모두 처리할 수 있는 멀티모달 모델을 처음 출시했다.
‘Pixtral 12B’라고 불리는 이 모델은 120억 개의 매개변수에 크기는 약 24GB다. 매개변수는 대체로 모델의 문제 해결 능력을 결정하는 요소다. 매개변수가 많은 모델은 일반적으로 매개변수가 적은 모델보다 성능이 더 좋다.
이는 또 미스트랄의 텍스트 모델 중 하나인 ‘Nemo 12B’를 기반으로 했다. URL이나 base64(바이너리-텍스트 인코딩 방식)를 사용, 주어진 임의의 크기와 숫자의 이미지에 대한 질문에 답할 수 있도록 코딩했다. 앤트로픽의 ‘클로드’ 제품군과, 오픈AI의 GPT-4o와 같은 다른 멀티모달 모델과 유사한 특징을 갖추고 있다. 테크크런치는 “Pixtral 12B는 최소한 이론적으로는 이미지에 캡션을 달고, 사진 속 객체 수를 세는 것과 같은 작업을 수행할 수 있어야 한다”고 분석했다.
이는 또 깃허브 토런트 링크와, AI 및 머신 러닝 개발 플랫폼 허깅페이스를 통해 제공된다. 다운로드, 미세 조정, 미스트랄의 표준 개발 라이선스에 따라 사용할 수 있다. 이 라이선스는 상업적 애플리케이션에 대해선 유료다. 그러나 연구용이나 학술적 용도는 무료다.
그러나 ‘Pixtral 12B’에 정확히 어떤 라이선스가 적용되는지는 아직 명확하지 않다. 그 동안 미스트랄은 제한 없이 ‘Apache 2.0’ 라이선스에 따라 일부 모델을 제공하곤 했다.
미스트랄 개발자 관계 책임자인 소피아 양은 X에 게시된 글에서 “‘Pixtral 12B’는 미스트랄의 챗봇이나, API 제공 플랫폼인 ‘Le Chat’나, ‘Le Platforme’에서 곧 테스트할 수 있을 것”이라고 말했다.
미스트랄이 이 모델을 개발하는 과정에서 어떤 이미지 데이터를 사용했는지는 알려지지 않았다. 미스트랄의 다른 모델을 포함한 대부분의 생성AI 모델은 흔히 저작권이 있는 웹의 방대한 공개 데이터로 학습하느게 보통이다. 한때 오픈AI 샘 앨트먼도 그런 얘길 한 적이 있듯이, 일부 AI모델 개발업체들은 “‘공정 사용’ 권리에 따라 모든 공개 데이터를 스크래핑할 수 있다”고 주장한다. 그러나 대부분의 저작권 소유자들은 이에 동의하지 않는다. 그 때문에 오픈AI나 미드저니 등과 같은 대형 공급업체를 상대로 소송을 제기, 이러한 관행을 중단시키기도 했다.
‘Pixtral 12B’는 미스트랄이 ‘General Catalyst’가 주도한 6억 4,500만 달러 규모의 펀딩 라운드를 마감한 이후에 출시되었다. 이 라운드 과정에서 미스트랄의 시장가치는 60억 달러로 평가되었다. 창업 1년 남짓 된 미스트랄은 현재 마이크로소프트도 소수 지분을 갖고 있다. 이 회사는 특히 유럽 AI커뮤니티에겐 유럽판 오픈AI로 여겨지고 있다. 아직 신생기업인 미스트랄은 지금까지 무료 ‘오픈’ 모델을 출시해왔다. 다만 해당 모델의 관리형 버전에 대해선 요금을 부과하고, 기업 고객에게 컨설팅 서비스를 제공하는 방식이었다. 이번에 출시한 ‘Pixtral 12B’ 그런 점에서 향후 미스트랄의 행보에 새로운 전환점을 마련할 것인지가 주목된다.
