‘무비 젠’ 모델, ‘이미지, 음성, 음악으로 영상 콘텐츠 생성’

(사진=로이터)
(사진=로이터)

[애플경제 이지향 기자] 메타가 마치 오픈AI의 ‘소라(Sora)’처럼 사운드가 있는 비디오를 생성할 수 있는 새로운 AI 모델을 발표했다. 사실상 텍스트-비디오 AI모델을 내세워 오픈AI에 도전장을 내민 셈이다.

5일 외신을 종합하면, 메타는 사용자 프롬프트에 응답, 매우 사실적인 영상과 음성을 생성할 수 있는 ‘무비 젠(Movie Gen)’이라는 새로운 AI 모델을 구축했다고 발표했다. 그러면서 “오픈AI나 일레븐랩스(ElevenLabs)와 같은 선도적인 미디어 세대 스타트업의 도구와 경쟁할 수 있게 되었다”고 노골적으로 주장했다.

이날 메타가 공개한 ‘무비 젠’의 창작물 샘플을 보면, 동물이 수영하고 서핑하는 영상과, 캔버스에 그림을 그리는 것과 같은 동작을 하는 사람들의 실제 사진을 사용한 영상이 제작, 표출되었다.

메타는 또 자사 블로그 게시물을 통해 “‘무비 젠’은 또한 영상 콘텐츠와, 동기화된 배경 음악, 음향 효과를 생성할 수 있다”고 밝혔다. 그러면서 “사용자들은 이를 사용해, 기존 영상을 편집할 수도 있다”고 소개했다.

이 도구로 만든 또 다른 샘플 영상을 보면, 사막에서 혼자 달리는 남자의 손에 폼폼(pom-poms)을 넣기도 했다. 또 다른 영상에선 먼저 마른 땅에서 스케이트보드를 타는 남자의 모습이 보인다. 그러다가 곧 그 마른 땅이 물이 철벅거리며 튀어오르는 습지로 변해버린다.

저작권자 © 애플경제 무단전재 및 재배포 금지