음성 대화 챗GPT 등장에 아마존, 애플 ‘비상’

사용자와 음성 문답 등 대화 가능, 기존 알렉사․시리 능가 기존 음성AI 비서와 달리 무한한 데이터 기반 정확한 답변과 소통 이미지 인식, 응답기능도…아마존․애플도 긴급 업그레이드 계획

2023-09-26     전윤미 기자
 텍스트뿐 아니라 음성으로 명령하면, 역시 음성으로 대답을 하는 새로운 기능이 챗GPT에 추가되었다. (사진=뉴욕타임즈)

[애플경제 전윤미 기자] 이젠 말이나 음성을 통해 챗GPT를 구동할 수 있게됐다. 텍스트나 이미지 등 프롬프터를 통해 결과물을 출력하던 종래 방식에서 한 단계 더 향상된 것이다. 그 바람에 음성비서를 출시한 바 있는 아마존(알렉사)과 애플(시리)의 고민도 깊어지게 되었다.

26일 ‘뉴욕타임즈’와 현지 기술매체 등에 따르면 오픈AI는 이처럼 사람의 말과 음성을 통해 소통할 수 있는 챗GPT 버전을 공개했다. 이는 기존 알렉사, 시리 등 음성 디지털 보조 장치와 마찬가지로 사용자는 챗GPT와 문답을 주고받을 수 있다.

냉장고 사진 보여주면 요리 목록 제공도

뿐만 아니다. 챗GPT는 최초로 이미지에도 응답할 수 있다. 예를 들어, 냉장고 내부 사진을 챗GPT에 업로드하면, 챗봇 자신이 저장하고 있는 데이터(재료)로 요리할 수 있는 요리 목록을 제공할 수도 있다.

이는 오픈AI가 최근 생성AI 시장 경쟁이 날로 치열해지고 있는 가운데, 자신만의 차별화를 기하기 위한 노력의 일환으로 해석된다. 이 회사는 이미 DALL-E 이미지 생성 버전을 공개하고 이를 챗GPT에 통합한 바 있다.

챗GPT가 출시된 후 수억 명의 사용자를 확보하며 생성AI 시장을 주도하고 있지만, 수많은 후발 주자들이 역시 유사한 서비스를 출시하면서, 경쟁은 날로 치열해지고 있다. 이에 오픈AI는 나름대로 새로운 버전의 챗봇을 출시, 구글 바드 등 경쟁 제품들을 견제해왔다. 그러다가 이번에는 알렉사, 시리 등과 같은 음성 챗봇 기술에 뛰어든 것이다.

알렉사와 시리는 이미 오랫동안 스마트폰, 노트북 및 기타 디바이스를 통해 사람의 음성으로 작동해왔다. 이에 비해 챗GPT나 구글 바드 등은 한층 강력한 언어 능력을 무기로 내세웠다. 챗봇 스스로 이메일이나, 서정시, 학기말 과제나 논문을 즉시 작성할 수 있으며, 거의 모든 주제에 대해 논할 수도 있다.

강력한 언어능력으로 기존 음성AI비서 제압?

이런 점을 활용해 오픈AI는 기존 음성 AI비서를 능가하기 위해 사람과의 음성 대화 기능을 첨가한 것이다. 더욱이 기존 음성AI비서보다 한층 자연스러운 음성으로 사람과 소통할 수 있다.

오픈AI측은 앞으로 2주간에 걸쳐 월 20달러 구독료를 내는 챗GPT 플러스 사용자들에게 이를 제공할 것으로 알려졌다. 그러나 아직은 아이폰, 아이패드, 안드로이드에서만 음성으로 대화를 주고받을 수 있다.

또한 이는 스스로 잘못된 점을 파악하고, 수정이 가능하다. 또한 이는 주로 인터넷에서 수집된 엄청난 양의 텍스트를 분석하여 즉석에서 언어를 생성하는 방법을 학습한 대규모 언어 모델(L.L.M.)에 의해 구동된다는 점에서 기존 AI음성비서와도 다르다.

알렉사나 시리 등 구형 음성AI비서는 정해진 수의 작업을 수행하거나, “알렉사, 조명을 켜줘” 등과 같이 한정된 데이터베이스에 프로그래밍된 질문 목록에 대한 답변만 제공할 수 있다. 만약 새로운 질문 목록을 추가하려면, 최대 몇 주간이 걸릴 수도 있다.

이에 비해 챗GPT는 거의 모든 질문에 단 몇 초 만에 정확하게 응답할 수 있다는 점에서 기존 AI음성비서로선 위협적이다.

(사진=게티 이미지)

아마존, 애플, ‘기존 음성비서, LLM 기반 업그레이드 돌입’

이에 아마존, 애플도 당장 ‘비상’이 걸렸다. 이미 오픈AI가 음성 대화 챗GPT를 출시한다는 소식이 공개되기 전에도 이들 회사는 기존 음성AI 비서를 챗GPT와 유사한 수준으로 업그레이드할 계획을 추진하고 있는 것으로 전해졌다.

지난 주 이미 아마존은 ‘모든 주제’에 대해 보다 유동적인 대화를 목표로 한, 업데이트된 알렉사 시제품을 미리 선보였다. 이는 일부 기능이 새로운 L.L.M.에 의해 구동되기도 한다. 또한 “더 자연스럽게 들리도록 속도와 억양을 업그레이드했다”는게 회사측 얘기다.

애플은 아직 챗GPT이 이런 변신에 대응할 계획을 공개적으로 밝히지 않고 있다. 다만 회사 사정에 밝은 소식통은 “향후 새로운 (음성AI) 제품을 위한 대규모 언어 모델의 프로토타입을 테스트하고 있다”고 ‘뉴욕타임즈’에 밝혔다.

특히 새로운 챗GPT는 웹은 물론, 아이폰, 아이패드, 안드로이드를 통해 이미지에도 응답할 수 있다는 점이 강점으로 꼽힌다. 사진, 차트 또는 다이어그램이 주어지고, 해당 이미지에 대한 자세한 설명을 제공하면 챗GPT가 해당 내용에 적합한 대답을 할 수 있다. 이는 특히 “시각 장애가 있는 사람들에게 유용한 도구가 될 수 있다”는 얘기다.

“챗GPT, 이미지 식별 기술 출시는 보류”

오픈AI는 이같은 이미지 변환 기술을 지난 봄에 개발한 것으로 알려졌다. 그러나 사측은 “이 기술이 어떻게 오용될 수 있는지 더 잘 이해할 때까지 대중과 공유하지 않을 것”이라고 밝혔다. 해당 기술은 불특정 사진 속의 불특정한 사람을 빠르게 식별하기 위한 도구로 악용될 소지가 크다는 우려 때문이다.

그 점을 빼놓고도, 새로 업그레이드된 음성 대화 챗GPT는 기존 음성AI비서를 충분히 능가할 것으로 보고 있다. 이에 아마존과 애플 역시 기왕의 음성비서 기능의 업그레이드를 시도할 가능성이 큰 때문에 경쟁은 더욱 치열해질 전망이다.