유튜브 델피ai로 AI아바타 생성, ‘FSM과는 다른 GPTs’ 등
목소리, 표정 등 고인의 모습 되살린 ‘환생 챗봇’ 일상화 예상
“캐릭터 모방, 거의 복제인간 수준”…“5~10년 내 가능할 듯”

 '2023 메타버스 페스티벌'에 출품된 제품으로 본문과 직접 관련은 없음.
 '2023 메타버스 페스티벌'에 출품된 제품으로 본문과 직접 관련은 없음.

[애플경제 전윤미 기자] 최근 AI 개발자 커뮤니티에선 AI아바타나 GPTs, GA(Generative Agents) 등 인공지능 기반의 새로운 서비스에 대한 평가와 전망이 다채롭다.

유튜브가 SNS를 크롤링하여 AI 아바타를 생성한다고 밝힌 것도 화제다. 그 핵심은 AI 캐릭터 생성을 해주는 ‘델피.ai’다

AI캐릭터 생성 기술 급속도 발달

예를 들어, 죽은 사람의 통화내용이나, 소설미디어 대화 등을 모아서 그를 그대로 복제한 AI 챗봇을 만든다. 이미 수 개월 전 등장한 AI 캐릭터 생성 도구 ‘Caryn.ai’가 이런 기능을 발휘해 화제가 되었다.

이는당시 유명한 인플루언서의 데이터와 목소리를 복제, 그와 똑같은 아바타를 만들어 돈을 받고 팔아다. 그 결과 목돈을 벌었다는 후문이다.

델피.ai는 직접 문서를 올릴 수도 있다. 이에 그치지 않고, 웹사이트, 유튜브, 트위터, 팟캐스트 링크만 주어지만 자동으로 크롤링하여 학습 데이터를 추출한다. 이는 ‘ElevenLabs’와 협업, 목소리도 복사할 수 있다. 최근에는 인플루언서, 크리에이터, 유명 정치인 등 셀럽들을 대상으로 아바타 모델을 찾고 있는 것으로 전해졌다. 아바타를 만들어 돈을 벌어보자는 의도다.

개인이 GPTs 기술로 ‘나만의 챗봇’ 만들어

이는 사실 GPTs와 유사한 성격이 많다. GPT를 활용해 ‘나만의 챗봇’을 만들자는 의도가 그런 점이다.

최근 GPTs 기술이 보급되면서, 이젠 특정 기업뿐 아니라 개인 누구라도 자신이 챗봇을 만들어 사고팔 수도 있다. 지난 6일 오픈AI가 ‘마켓’을 개설하기로 한 것도 그 때문이다.

다만 아직까진 GPTs는 문서만 업로드하다는게 한계다. 반면에 AI 아바타를 만드는 ‘델피.ai’는 다양한 소스를 손쉽게 이용할 수 있다. 음성 데이터를 수집, 목소리 클론도 가능하고, 평소 습관도 그대로 흉내낼 수 있다.

알려지기론 GPTs 기술도 날로 발전을 거듭하며, 앞으후 이런 기능을 추가할 것이 확실하다는게 전문가들의 의견이다.

이처럼 생성AI 기술은 가상의 캐릭터가 스스로 환경을 인지하고 움직이는 수준에까지 이르렀다.

특히 GA(Generative Agents)는 이제 게임으로 대표되던 자율적 인지능력의 아바타를 뛰어넘는 수준이어서 주목된다. 예를 들어 게임의 NPC(비플레이어)들은 지금도 대부분 유한상태기계(FSM, Finite State Machine)나 행동 트리(Behavior Tree) 방식을 씁니다. 즉 사용자가 시키면 시킨대로 훈련해서 실행하는 것이다.

이는 특정한 상태를 미리 정의하고 외부 환경이나 내부 인자에 따라 다음 상태로 이동합니다. 각 상태에서는 그에 맞는 규칙에 따라 행동을 결정하다. 예를 들어, 대기 상태에서 적이 다가오면 공격 상태로 바뀌어 공격을 한다. 적을 물리치면 다시 휴식 상태로 돌아간다.

그러나 대기하다가 적이 다가오면 일단 적을 ‘쫓아간’ 다음, ‘달려가서’, ‘공격’을 하는, 좀 복잡한 단계가 되면 별도 학습이 필요하다.

이를 위해 개발자들은 각 NPC들의 행동을 미리 결정해준다. 그러면 분명 겉으로 보기엔 자율적으로 움직이는 것과 같다.

 '2023 메타버스 페스티벌'에 출품된 제품으로 본문과 직접 관련은 없음.
 '2023 메타버스 페스티벌'에 출품된 제품으로 본문과 직접 관련은 없음.

기존 아바타 기술 뛰어넘는 GA, “그대로 복제” 수준

올해 4월에 공개된 GA 역시 일단은 LLM 기반의 AI NPC다. FSM과 비슷하게 10분 단위로 루프를 돌면서 다음에 할 행동을 선택한다. ‘배운 그대로 반복하는’ 양상이라고 할 수 있다.

그러나 큰 차이가 있다. FSM은 모든 규칙을 개발자가 변수를 지정하고 일일이 코드로 구현해야 한다. 반면에 GA는 챗GPT를 기반으로 하기 때문에 동작 과정이 전부 텍스트로 이루어진다. 모든 정보를 그냥 말로 풀어서 설명해줄 수도 있다.

그리고 챗GPT에게 “다음에 내가 취해야 할 행동을 알려달라”고 한다. 그러면 행동 뿐만이 아니라 대화까지 챗GPT로 자연스럽게 이어갈 수 있게 되는 것이다.

국내의 한 개발자 커뮤니티 운영자는 이런 ‘GA’에 대해 “지금은 계산 리소스 때문에 당장 이런 기법을 상용화하기는 어렵다는게 중론”이라며 “그러나 향후 5~10년 안에는 이렇게 자율적인 AI가 대중화될 것”이라고 했다. AI아바타가 단순한 ‘아바타’가 아니라, 그야말로 ‘디지털 복제인간’이나 다름없을 것이란 얘기다.

“이런 인간 지능에 도전하는 미래형 챗봇과 AI 아바타 기술은 게임만이 아니라 로봇, 개인비서, 앱서비스 등 다양한 곳에 응용이 가능하다”는 전망이다.

저작권자 © 애플경제 무단전재 및 재배포 금지