오픈AI, 챗GPT 음성 모드 출시, ‘자유롭게 대화’
“사람처럼 다양한 주제의 대화 상대”
[애플경제 김예지 기자] 유료독자들을 위한 챗GPT 고급 음성 모드가 출시되었다. 오픈AI는 상당한 개발 기간을 거쳐 24일(한국시각 25일) “월 20달러 이상을 지불하는 사용자들에게 한층 고성능의 대화형 옵션을 제공하기 위한 것”이라며 이같이 밝혔다.
그 동안 텍스트와 문장으로 프롬프트(요청)했던 차원을 넘어, 챗GPT와 사람이 자유롭게 대화를 나누는 수준에 이른 것이다. 이는 GPT 대규모 언어 모델과 ‘DALL-E’ 이미지 생성기에 이은 오픈AI의 또 다른 중요한 무기가 될 것이란 평가다. 우선 미국에서 출시되고 있는 챗GPT 플러스, 팀(Team), 그리고 엔터프라이즈(Enterprise) 사용자들은 이 새로운 기능을 통해 음성만으로 대화형 요청(프롬프트)을 할 수 있다.
앞서 오픈AI는 X를 통해 45초 분량의 영상을 통해 고급 음성 모드 출시를 알렸다. 해당 영상을 보면, 한 젊은 여성이 챗GPT를 향해, “귀가가 늦은 것에 대해 할머니께 사과하고 싶다”고 말한다. 그러면 챗GPT는 실제 사람들이 말하는 것과 거의 흡사한 억양으로 “귀하가 사과하고 싶어하는 모습(언행)이 ‘달콤하다’”고 응답한 다음, 사용자가 사과할 수 있는 방법을 알려준다.
이에 사용자는 다시 챗GPT를 향해 “할머니가 중국어만 할 줄 안다”고 하자, 챗GPT는 빠르게 태도를 변경, 사용자에게 중국어로 된 진심 어린 사과표현을 전하고, 다시 영어로 방금 말한 내용을 번역해서 알려주었다.
가끄은 톤이 약간 낮아져 챗GPT가 실제로 사람이 아니라 컴퓨터라는 것을 알 수 있는 수준이다. 그럼에도 이 정도 수준의 음성 기능은 놀라운 것이란게 리뷰어들의 평가다. 적어도 X에서 보여준 영상만을 보면 그렇다. 이는 또 기존의 음성 제어 스마트 어시스턴트와 달리, 사용자의 프롬프트와 챗GPT의 청각적 응답 속도 사이에 지연이 거의 없어 눈길을 끈다.
이를 위해 오픈AI는 지난 몇 달 간 유료 사용자 전용으로 베타 버전을 제공한 바 있다. 다시 5월에 챗GPT의 무료 음성 기능을 선보인 후 이를 업그레이드해서 이번에 유료 버전으로 출시한 것이다.
챗GPT의 유료 음성 모드는 5개의 새로운 음성을 제공, 총 9개에 달한다. 또한 챗GPT 스마트폰 앱의 ‘설정’ 섹션에서 사용자는 챗봇이 응답을 더 원활하게 할 수 있도록 개인 정보를 입력할 수도 있다. 예를 들어 사용자가 사는 지역이나, 특정 음식에 대한 거부감이나 알레르기 등의 정보다. 그리고 챗봇이 명확하게 발음하거나 톤을 늦추도록 요청할 수도 있다. 이 기술은 또 챗GPT의 무료 음성 모드보다 한층 ‘사용자 정의’가 가능하고 유연한 편이다.
미국의 유료 가입자는 이번 주에 고급 음성 모드를 사용할 수 있다. 그러나 아직은 유럽 연합이나, 영국, 스위스, 아이슬란드, 노르웨이, 리히텐슈타인 등에 제공되지 않는다고 밝혔다. 지연 이유를 밝히진 않았지만 “온라인상의 각종 위험에 대비해 AI 애플리케이션을 규제하는 EU ‘AI법’을 염두에 두고 있기 때문”이란 추측이다.
