‘구글 I/O 2025’의 위선? “2시간 떠들며 ‘환각’엔 ‘침묵’” 눈총

대규모 컨퍼런스, ‘제미니 등 다양한 AI기반 기술·제품’ 소개만
CEO 피차르 등 임원들, “무대 발언 내내 일절 언급 안해”
“신개념 AI솔루션 악영향 우려”, “글로벌 기업다운 책임 회피” 비판

[애플경제 엄정원 기자]

구글 I/O2025에서 CEO 순다르 피차이가 기조 연설을 하고 있다. (사진=구글)

[애플경제 엄정원 기자] 사용자들이 있지도 않은 ‘AI의 환각(hallucinations)’이 실제로 있다고 착각한 걸까. 오히려 AI가 아닌 인간이 ‘환각’에 사로잡혀있는 걸까. 화려하게 대미(大尾)를 장식한 구글 연례행사 ‘구글 I/O 2025’를 보면 그런 생각이 들 정도다. 구글은 이번 행사에서 AI 기반의 엄청난 기술과 솔루션들을 공개하면서도 정작 ‘AI의 환각’은 일절 입에 담은 적이 없다.

이번 연례 개발자 컨퍼런스에서 구글은 새로운 AI 동영상 생성 도구인 ‘Flow’, 250달러짜리 AI Ultra 구독 플랜, 제미니(Gemini)에 적용된 다양한 기능들, ‘가상 쇼핑’ 체험 기능, 특히 미국 내 사용자를 대상으로 한 검색 도구 ‘AI Mode’ 등을 출시하며, 한껏 사세를 과시했다. 대부분의 제품과 솔루션은 제미니를 비롯한 AI를 기반으로 한 것이다. 그러나 정작 AI의 가장 치명적인 단점인 ‘환각’에 대해선 침묵했다.

‘구글 I/O 2025’, 단 하나의 주제 ‘AI’에 집중

현지 전문가들 사이에선 이에 대한 쓴소리가 이어지고 있다. 오랜 경력의 테크 전문 저널리스트인 ‘매셔블’의 티모시 벡 워스 편집자는 “구글은 2시간 동안 내내 AI에 대해 떠들었지만, 정작 ‘환각’에 대해선 언급하지 않았다.”고 꼬집었다.

그는 “되레 우리가 ‘환각’을 겪고 있는 걸까, 아니면 구글이 엄연한 현실(‘환각’의 부작용)에 대해 관심이 없거나, 일부러 외면하는 걸까”라며 비판의 날을 세웠다.

앞서 금년 ‘구글 I/O 2025’는 애초부터 단 하나의 주제, 즉 인공지능에 집중했다. 그러나 워스 편집자는 “구글 임원들이 정작 AI에 대해 거의 2시간 동안 이야기하면서도 ‘환각’이라는 단어는 듣지 못했다”고 했다. 실제로 유튜브(YouTube o8NiE3XMPrM)와 각종 스트리밍을 통해 순다르 피차이 등 임원들이 나서, 자사 제품을 소상하게 설명, 홍보하면서도 AI의 가장 큰 한계이자 부작용인 ‘환각’에 대해선 언급이 없었다.

이에 워스 편집자 뿐 아니라, 많은 시청자와 사용자들이 이에 대해 의문을 가질 정도였다. “구글이 제품 소개에 몰두하다보니 그럴 수 있다”는 관대한 반응도 있지만, “자신들의 ‘잔칫날’이라고 생각한 나머지 고의로 ‘환각’과 같은 ‘부정적’ 단어는 외면한 셈”이라는 비판이 더 많았다.

구글 I/O2025에서 회사 임원이 제품을 소개하고 있다. (사진=구글)

실제로 ‘환각’은 AI 모델에서 가장 고질적이고 우려되는 문제 중 하나다. LLM이 엉뚱한 상상과 착각, 선입견에 의해 조작된 사실과 부정확한 내용을 답변하는 현상이다. 이미 주요 AI 브랜드의 자체 지표에 따르면 환각은 날로 더 심해지고 있다. 심지어 일부 AI봇이나 모델은 40% 이상의 확률로 환각현상을 보이기도 한다.

“‘환각’ 언급 회피, 소비자 기만” 비판도

그래서 “구글이 행사 내내 이를 언급하지 않은 것은 소비자들을 기만하는 것”이란 비판도 나오고 있다. 나아가선 “책임있는 글로벌 기업으로서 기업윤리를 도외시한 것”이란 비난도 쏟아진다. 앞서 워스 편집자는 그런 목소리의 대표격이라고 할 수 있다.

그렇다보니 “구글 I/O 2025만 내내 보다보면, ‘환각’현상이 AI에 존재한다는 사실 자체를 모를 수도 있을 것”이란 지적까지 나온다. 이번 행사가 오로지 AI 기반 기술에 집중되고 있음을 감안하면, 그야말로 ‘사기’에 가까운 위선이란 비난도 이어지고 있다.

또 구글의 이런 태도는 마치 ‘제미니’와 같은 모델은 절대 환각을 일으키지 않는다고 생각게 한다. 그러나 정작 구글 사이트나 보도자료, 블로그 등에서 자사의 AI 기술과 제품마 “AI 응답에는 실수가 포함될 수 있다”는 경고를 추가하고 있다. 이번 행사에서 보인 태도와는 정반대인 셈이다.

그래서 구글 I/O 2025에서 구글이 보인 위선적 태도는 자못 의아할 정도다. 구글은 그나마 극히 간접적인 화법으로 ‘환각’ 문제를 ‘암시’하긴 했다. 새로 내놓은 검색용 ‘AI 모드’와 ‘제미니’의 심층 검색 기능에 대한 프레젠테이션 중 “이들 모델은 답변을 제공하기 전에 자체적으로 작업을 확인한다”고 언급했다. 그러나 ‘작업을 확인하는 과정’에 대한 자세한 설명이 없는 만큼, 이는 “하나마나한 소리”라는 비판이다.

특히 AI 회의론자들에게 구글의 이런 태도는 더욱 가증스럽게 다가온다. 이들은 애초 실리콘 밸리가 AI도구를 신뢰하는 정도가 실제 (사용자들이 체험한) 결과와는 동떨어진 것으로 간주하고 있다. 사용자들은 흔히 AI 도구가 숫자 세기나, 맞춤법 검사, 혹은 “물은 화씨 27도에서 얼까?”와 같은 극히 초보적인 질문조차 엉뚱한 답변을 하는 경우가 많다는 지적이다.

‘제미니 2.5 프로’ 과장 홍보 구설수

이번 컨퍼런스에서도 구글은 자사의 최신 AI 모델인 ‘제미니 2.5 프로’가 여러 AI 벤치마크 순위표에서 “정상에 올랐다”며 한껏 홍보에 열을 올리곤 했다. 하지만 그 말과는 달리, ‘진실성’이나, 간단한 질문에 답하는 능력면에선 제미니 챗봇의 점수가 급강하 곡선으로 나타난 것으로 밝혀지기도 했다.

구글에 의하면 ‘제미니 2.5 프로’는 구글에서 가장 지능적인 AI 모델이다. 그러나 기술매체 ‘아즈 테크니카’에 따르면 ‘기능성’을 매기는 ‘SimpleQA 벤치마킹’ 테스트에선 52.9%에 그쳤다. 이전에 공개되었던 오픈AI 연구 논문에 따르면 ‘SimpleQA’ 테스트는 “짧고도 사실에 기반한 질문에 답할 수 있는 언어모델의 능력을 평가하는 벤치마크”라는 평이다.

구글 측은 이같은 ‘SimpleQA 벤치마크’의 저조한 테스트 점수나, ‘환각’에 대한 자세한 설명을 피하고 있다. 다만 “구글의 ‘AI 모드’ 및 AI 개요에 대한 공식 설명 자료를 참고할 것”을 권할 뿐이다.

해당 자료에서 구글은 “방대한 언어 모델을 사용하여 질의에 답변하며, 드물지만 '환각'이라고 불리는 부정확한 정보를 자신 있게 제시하는 경우고 있다”고 인정하면서도 “(구글은) 모델의 추론 기능에 새로운 접근 방식을 적용해 ‘사실성’을 높여가고 있다”고 해명했다. 즉 “구글 딥마인드 연구팀과 협력하는 등 ‘맞춤형 학습’에 ‘에이전트 강화 학습’(RL)을 적용해 모델이 정확할 확률이 더 높고(환각이 아닌) 입력에 의해 생성된 진술이 나오도록 보상하고 있다”고 강조했다.

구글 침묵에 “그럼 소비자들이 ‘환각’ 겪는 건가” 비난도

일단 구글은 이처럼 “환각은 해결 가능한 문제”라며 ‘낙관적’ 입장을 보이고 있다. 그러나 그동안 많은 국내외 연구에서 밝혀졌듯이, LLM의 환각은 현재로서는 해결 가능한 문제가 아니라는 것이 점점 더 명확해지고 있는 실정이다.

그럼에도 구글과 오픈AI 등 세계 AI문명을 이끄는 기업들은 (환각의 염려에도 불구하고) 그런 AI 기반의 ‘검색’ 시대로 질주하고 있다. 이번 ‘구글 I/O 2025’ 역시 그런 추세를 대변하는 이벤트인 셈이다. 그래서 “우리가 ‘환각’을 겪는 것이 아니라면, 그 시대(검색 시대)는 (AI의 환각으로 인한) ‘오류’로 가득할 가능성이 높다”는 앞서 워스 편집자의 한탄섞인 전망이 공감을 불러일으키고 있다.

엄정원 기자 ugw1013@naver.com

다른기사 보기

상단영역

본문영역