돌고래 ‘소리’, 인간 언어로 바꿔 ‘대화’한다?
구글, 돌고래 소리 정밀 분석 AI 모델 ‘돌핀겜마’ 개발 구글 사운드스트림 토크나이저로 돌고래 소리 해독, “매개변수 4억 개” ‘돌핀겜마’ 입·출력 형식, 돌고래 소리 시퀀스 처리후 패턴 식별
[애플경제 전윤미 기자] 구글은 새로운 LLM, ‘돌핀겜마’(DolphinGemma)를 통해 돌고래 언어를 인간의 언어로 번역할 계획이다. 이는 AI의 힘을 활용, 돌고래의 휘파람 소리와 딸깍거리는 소리를 천천히 해독하는 방식이다.
구글은 돌고래와 인간은 공통점이 많다는데 착안했다. 둘 다 도구를 사용하고, 호기심을 보이며, 함께 어울리는 사람들로부터 새로운 것을 배운다. 또한, 목소리를 통해 동료들과 소통한다. 지난 수 십 년 동안 과학자들은 돌고래의 어떤 소리가 어떤 의미를 전달하는지 알아내려고 노력해 왔다. 또한 돌고래의 언어가 실제로 인간의 언어와 유사한지도 알아내고자 했다.
구글 ‘돌핀겜마’는 이런 의문에 대한 열쇠가 될 수 있을 것이란 기대다. 이같은 기발하고 야심 찬 AI연구 프로젝트는 구글 딥마인드가 맡아하고 있다. 또 평생 돌고래 연구자로 활동하며 세계 최대 규모의 돌고래 발성 자료를 보유한 이 분야 최고의 전문가인 데니스 허징과 파트너십을 체결했다.
허징의 지난 40년간 축적된 통찰력을 바탕으로 딥마인드는 구글의 사운드스트림(SoundStream) 토크나이저를 사용, 돌고래 소리를 모방하고 해독하는 4억 개의 매개변수를 가진 언어 모델을 구축했다.
언어모델 자체는 구글 픽셀(Pixel) 스마트폰에서 실행된다. 이 모델은 비영리 단체인 ‘와일드 돌핀 프로젝트’와, 조지아 공과대학교가 개발한 ‘고래 청각 증강 원격 측정 시스템’인 ‘CHAT’에 의존하고 있다.
연구자는 해당 언어모델과 픽셀이 장착된 웨어러블 수중 컴퓨터를 가슴이나 팔뚝에 착용한다. 수중에서 방수 골전도 ‘이어피스’를 통해 돌고래와 ‘대화’할 수 있도록 한다. 이는 ‘돌핀겜마’의 오디오 입력·출력 형식을 활용, 돌고래 소리 시퀀스를 처리하고 패턴을 식별한다.
‘돌핀 겜마’는 이렇게 수집한 패턴을 통해 돌고래가 대화를 잇는 과정에서 다음에 ‘말할’ 가능성이 높은 내용을 예측한다. 이는 구글 검색과 생성 AI가 사용자 프롬프트에 답변하는 과정에서 질의의 다음 부분을 예측하는 방식과 유사하다.
이때 ‘CHAT’ 데이터베이스에서 인식한 ‘휘슬블로우(휘파람 단어)’와, 돌고래 소리 중 하나가 일치하면, 다시 ‘여성 음성’으로 그에 상응하는 인간의 단어를 말하는 방식으로 번역한다. ‘야생 돌고래 프로젝트’에 따르면, 연구자는 미리 프로그래밍된 소리로 응답할 수도 있다. 연구자가 올바른 소리를 사용했는지 확인하기 위해 ‘CHAT’은 ‘남성 음성’으로 그에 상응하는 인간의 단어를 발성하기도 한다.
구글에 따르면 이미 해당 ‘프로젝트’를 위해 현장에 ‘돌핀 겜마’(DolphinGemma)를 도입하기 시작했다. 그 결과는 “즉각적으로 큰 변화와 긍정적 현상을 초래할 것”이라는 얘기다. 이를 고려하면 “이미 돌고래 언어에서 AI 없이는 식별하기 어려웠을 패턴을 발견했을 가능성이 높다”는 전문가들의 해석이다.
앞서 데이스 허징은 “아직은 소셜 미디어 영상을 봐도 과연 동물에게 단어가 있는 지 여부를 알 수가 없다.”면서 “그러나 돌고래는 거울 속 자신을 알아볼 수 있고, 도구를 사용하기 때문에 똑똑하다”고 단언했다. 하지만 “(돌고래의 사고를 담은) 언어는 여전히 마지막 장애물인데, 언젠가는 돌고래처럼 말하는 것이 목표”라고 했다.