바이트댄스, 中콰이슈, 엔비디아 이어 어도비도 합류, “오픈AI 등에 도전”
[애플경제 이지향 기자] 텍스트-비디오 AI 모델 시장의 춘추전국시대가 열리고 있다. 금년 초 최초로 오픈AI가 ‘소라’(Sora)를 선보인 후 다른 빅테크는 물론, 업종 계열의 다른 업체들까지 이 시장에 뛰어들고 있다. 틱톡 주인인 바이트댄스, 그리고 엔비디아 등도 이미 텍스트-비디오 AI 모델을 개발, 시장에 뛰어들었다.
또한 ‘Kling AI’라고 불리는 새로운 ‘비디오 생성 모델’도 지난 6월 이미 중국의 틱톡 경쟁자인 ‘Kuaishou’가 선보이기도 했다. 중국에서는 아직은 대기자 명단을 통해 공개 데모로만 제공된다. 사측은 “‘Sora’만큼 유능하다”는 것을 시사하며 홍보에 열을 올리고 있다.
이보다 앞서 그 계통은 좀 다르지만, 엔비디아는 이미 GIF를 새로운 수준으로 끌어올릴 수 있는 텍스트-비디오 AI기술의 데모를 작년에 선보인 바 있다. 이른바 ‘잠재 확산 모델’(또는 LDM)로 불리는 이 도구는 엄청난 컴퓨팅 파워가 필요 없이 비디오를 생성할 수 AI모델이다. 엔비디아는 “이 기술이 텍스트-이미지 생성도구의 발전을 견인하는 획기적 기술”이라고 홍보하기도 했다.
그 후 이번에는 또 이미지 포토샵의 대명사로 알려진 어도비도 그 대열에 뒤늦게 합류했다. 이 회사는 14일 “텍스트-비디오 AI 모델을 개발, AI 영상 모델 경쟁에 나선다”고 밝혀 눈길을 끌었다. 그 동안 어도비는 크리에이티브, 마케팅 및 문서 관리 솔루션 등에 주력하며, 여느 대형 기술기업들과는 약간의 거리를 둔 입장이었다. 그러다가 갑작스레 14일 늦은 밤(한국시각) “텍스트 프롬프트에서 비디오를 생성할 수 있는 AI 모델”을 공개하며, 이를 배포하겠다고 전격적으로 밝혔다.
이미 기존의 오픈AI나 메타 등이 장악하고 있는 생성AI를 활용한 AI 영상 모델 시장에 전혀 새로운 유형의 기업들까지 뛰어들고 있는 모양새다. 어도비 역시 그런 추세를 보여주는 케이스 중 하나다. 어도비에 앞서 이미 틱톡 소유주 바이트댄스, 메타 등도 최근 몇 달 동안 텍스트-비디오 AI모델을 개발, 출시했다.
로이터 등 외신에 따르면 이번에 어도비가 출시한 텍스트-비디오 AI모델은 ‘피델리티 비디오 모델(Firefly Video Model)’이라고 이름붙여졌다. 이는 이미 올초에 관련 업계에서 가장 먼저 출시된 오픈AI의 ‘소라’(Sora)를 겨냥하고 있다. 거대한 글로벌 빅테크에 도전장을 낸 어도비는 일단 저작권법에 저촉되지 않는, 가용한 데이터를 총동원, 훈련된 모델을 구축한 것으로 알려졌다.
이번에 출시한 ‘피델리티’ 모델은 당분간 본격적인 대중화는 미뤄질 예정이다. 대신에 일부 선별된 사용자들에게 베타 버전을 곧 배포할 것으로 알려졌다.
어도비측은 아직 ‘피엘리티’ 모델을 시범적으로 사용하게 될 고객들을 공식적으로 밝히진 않았다. 그러나 로이터통신에 의하면 펩시콜라(PepsiCo) 계열사인 ‘Gatorade’가 고객 맞춤형 병을 주문할 수 있는 사이트에 해당 모델을 이미 도입한 것으로 알려졌다. 또 마텔(Mattel)도 바비 인형 라인의 포장을 디자인하는 데 어도비 도구를 사용하고 있다고 밝혔다.
어도비사의 디지털 미디어 최고 기술 책임자인 엘리 그린필드는 “어도비 ‘피델리티’ 모델의 경우, 영상 제작자와 편집자가 일상적으로 사용할 수 있도록 한 실용적 제품을 목표로 하고 있다”면서 “특히 생성할 영상을 기존 영상과 섞는 기법에 중점을 두고 있다”고 밝혔다. 그러면서 “비디오 편집자와 영상 작가가 사용하는 개념, 즉 카메라 위치, 카메라 각도, 카메라 동작을 모델에 학습시키는 등 세부적인 기술에 정성을 쏟았다”고 장점을 덧붙였다.
