AI모델 ‘레드 판다’, 벤치마크서 “그 어떤 모델보다 우수”
“7초만에 이미지 생성”, ‘달리3’의 100배 속도 판정
자세한 스펙 극비, “‘변죽’만 울리지말고 공개해야” 목소리도

'레드 판다'가 생성한 것으로 알려진 이미지로서, 실사와 전혀 다름이 없다.(출처=Deedy Das)
'레드 판다'가 생성한 것으로 알려진 이미지로서, 실사와 전혀 다름이 없다.(출처=Deedy Das)

[애플경제 김예지 기자] 엄청난 성능을 지녔음에도, 정작 그 자세한 실체를 미공개한채 ‘변죽’만 울리는, ‘신비로운’ 이미지 생성 모델이 등장했다. 최근 오픈AI의 DALL-E 3보다 100배 이상 빠른 7초만에 텍스트를 이미지로 전환하는 AI 모델이 등장한 것이다. 이는 체스 플레이어들의 기술 수준을 서열화하면서 진화한 인공지능 평가 플랫폼 ‘Artificial Analysis’의 텍스트-이미지 리더보드에서 단연 최고의 평가를 받았다. 그러나 벤치마크 외엔 아직 그 정확한 스펙이나 제조사가 밝혀지지 않아 온갖 궁금증을 낳고 있다.

이는 크라우드소싱 ‘Artificial Analysis’ 벤치마크에서 미드저니, 블랙 포레스트 랩스, 오픈AI의 다른 이미지 생성 모델 등을 크게 앞선 것으로 드러나 놀라움을 안겨주고 있다. 28일 기술매체 ‘테크크런치’ 등에 따르면 이는 기존 미드저니나, ‘Black Forest Labs’, 오픈AI의 AI 모델을 앞지르는 것으로 평가되었다.

‘레드 판다(red_panda)’라는 이름의 이 모델은 ‘Artificial Analysis’의 텍스트-이미지 리더보드에서 최고 성능을 인정받았다. 그 다음으로 순위가 높은 모델인 ‘Black Forest Labs’의 ‘Flux1.1 Pro’보다 엄청난 포인트 격차로 앞서 있다. ‘Artificial Analysis’는 원래 체스 플레이어의 상대적 기술 수준을 계산하기 위해 개발된 순위 시스템인 Elo를 사용하고 있다. 그 후 AI모델 등을 테스트하는 공인된 시스템으로 인정받고 있다.

이에 따르면 실제로 ‘렌드 판다’가 생성한 것으로 알려진 이미지는 실사(實寫)와 구분하기 어려울 정도다. 유사한 커뮤니티 AI 벤치마크인 ‘Chatbot Arena’처럼 ‘Artificial Analysis’는 크라우드 소싱을 통해 모델을 순위를 매긴다. 이미지 모델의 경우 ‘Artificial Analysis’는 무작위로 모델을 선택, 평가를 위한 나름의 프롬프트를 제공한다. 프롬프트 결과로 나온 이미지를 사용자들에게 제시하고, 사용자는 그 중에서 프롬프트를 더 잘 반영한다고 생각되는 이미지를 선택함으로써 AI모델 성능을 평가한다.

물론 이 투표 과정에는 약간의 편향이 있다는게 전문가들의 정평이다. ‘Artificial Analysis’의 투표자는 대부분 AI 애호가이다보니, 아무래도 생성 AI 사용자 커뮤니티의 선호도를 반영하지 않을 수 없다. 그럼에도 불구하고, ‘레드 판다’는 생성 ​​속도 측면에서 ‘Artificial Analysis’ 리더보드에서 객관적으로 성능이 좋은 모델로 평가받은 것은 부정할 수 없다는 얘기레드판다.

'레드 판다'가 생성한 이미지들. (사진=Deedy Das)
'레드 판다'가 생성한 이미지들. (사진=Deedy Das)

실제로 ‘레드 판다’는 이미지를 생성하는 데 중간값으로 약 7초가 걸리는데, 이는 오픈AI의 DALL-E 3보다 100배 이상 빠른 속도다. 이런 내용이 ‘Artificial Analysis’에 의해 공표되고, 테크크런치 등 일부 언론에 소개되자 즉각 사용자들 간에는 큰 반향을 불러 일으켰다. 더욱이 그 정체가 확실히 밝혀지지도 않은채, 그저 “조만간 공식적으로 출시될 것”이란 정도의 정보만 알려지자 궁금증은 더욱 커지고 있다.

과연 ‘레드 판다’는 어디에서 왔을까? 어떤 회사에서 만들었을까? 언제 출시될까? 등의 질문들이 인터넷에 쏟아지고 있다. 그러나 정작 ‘Artificial Analysis’와 그 정체가 베일에 가려진 AI 연구실은 공식화 이전 기대감을 높이기 위한 의도로 공개를 미루며, 궁금증만 증폭시키고 있다.

이에 일부 네티즌들은 “웹을 뒤져봤지만 아무것도 나오지 않았다”고 다양한 질문과 함께 의구심을 표하고 있다. “‘Red Panda’는 여전히 우리에게는 닿을 수 없는 것 같다! 누구의 접근도 없고 독립적인 검토도 없는데, 그들이 내놓는 지표를 어떻게 믿을 수 있겠? 속도 개선은 훌륭하지만, 실제 품질은 어떨까?” 등의 질문을 쏟아내고 있다.

또 “현실 세계의 검증이 필요하고, 레드 판다가 마침내 공개될 때 이를 실현할 수 있을지 기대된다.”는 반응도 따랐다. 그러나 현재로선 “‘레드 판다’는 앞으로 커뮤니티 벤치마크를 점점 더 많이 사용하고 있으므로 곧 (그 실체를) 알게 될 수도 있다”는 정도의 정보만 현재 알려지고 있다.

저작권자 © 애플경제 무단전재 및 재배포 금지