일부 기술매체들, 복잡 다양한 테스트 결과, “대체로 홍보 내용과 비슷”
“웹 서핑으로 바로 찾기 힘들면, ‘제미니’ 사용도 바람직” 평가도
전체적으로 "문제점 있지만, 구글 선전 내용과 큰 차이는 없어”
[애플경제 엄정원 기자] 흔히 AI기업들은 새로운 AI모델을 과대광고하거나, 과장하는 경우가 많다. 그렇다보니 최근 오픈AI의 GPT-5처럼 사용자들의 불만과 항의를 받는 경우가 드물지않다. 이 외에도 많은 AI모델들은 늘 광고나 홍보 내용과는 달리, 사용자들의 눈높이에 못미치는 경우가 비일비재하다.
지난 주 ‘제미니3’를 내놓은 구글 역시 예외가 아니다. “새로운 AI 모델에 대화형 3D 시각화를 생성하는 코드 생성부터, 작업을 완료하는 ‘에이전트’ 기능까지, 다양한 업그레이드된 기능을 제공할 것”이라고 한껏 자랑했다. 하지만 과거에도 그랬듯이 광고 내용이 항상 현실과 일치하는 것은 아니다.
그래서 일부 현지 기술매체들은 실제로 이를 꼼꼼히 테스트해보기도 했다. 테크스토리, ‘더 버지’ 등이 대표적이다. 이들을 요약해보면, 공통적으로 “제미니3는 나름대로 괜찮은 성능을 발휘하는 것으로 나타났다”는 평가다. 단, “몇 가지 제한 사항”은 짚고 넘어갔다.
‘캔버스’, ‘제로샷 생성’ 탁월, “그러나 3D 모델은 품질 떨어져”
이에 따르면 제미니 앱에 내장된 작업 공간인 ‘캔버스’(Canvas)의 가장 큰 개선 사항 중 하나는 AI 챗봇에게 코드 생성을 요청하고 출력 결과를 미리 볼 수 있다는 것이다.
구글은 “‘캔버스’를 사용해 빌드할 때 제미니 3가 텍스트, 이미지, 비디오 등 다양한 소스의 자료를 동시에 해석할 수 있다”고 밝혔다. 구글이 자랑하듯, 실제로 이는 더 복잡한 프롬프트도 처리할 수 있어, 더욱 풍부하고 인터랙티브한 사용자 인터페이스, 모델, 시뮬레이션을 생성할 수 있다. 구글은 “또한 ‘제미니 3’는 제로샷 생성(zero-shot generation)에서도 ‘탁월하다’”고 설명하고 있다. ‘더 버지’는 “이는 훈련되지 않은 작업을 더 잘 완료한다는 것을 의미한다”고 이를 인정했다.
특히 이들 매체는 구글이 데모 중 하나에서 선보인 더욱 복잡한 요청 중 하나를 시도했다. ‘제미니 3’에 ‘아원자 입자’, ‘원자’, ‘DNA 가닥’, ‘비치볼’, ‘지구’, ‘태양’, ‘은하의 크기 차이’를 3D로 시각화해 달라고 요청했다.
이에 ‘제미니 3’는 구글에서 시연했던 것과 유사한 ‘상호작용형 시각 자료’를 만들어서 스크롤하며 다양한 원소의 크기를 비교할 수 있도록 했다. 그 결과는 마치 양성자부터 시작, 우주의 그물에 이르기까지, 각 원소의 크기가 작은 것부터 큰 것까지 정확하게 나열되어 있는 것 같았다. 이는 데모에 표시된 거의 모든 내용이 포함되어 있었다. 하지만, DNA 가닥과 비치볼의 3D 모델이 구글에서 보여준 것보다 상당히 어두워, 몇몇 영역에서 이미지 품질이 떨어졌다. 구글의 다른 데모를 ‘제미니’에 입력했을 때도 비슷한 현상이 많이 나타났다. 모델은 정확한 개념을 보여주었지만, 해상도가 낮거나 구성이 조금 더 어둡거나 다소 조잡했다.
‘제미니 3’의 출력은 조금 더 간단한 것을 시도했을 때도 구글이 홍보했던 것 만큼 좋지는 않았다. 나무 위 독수리 모습을 재현해 달라고 요청한 결과, 데모와 상당히 유사했다, 그러나 “독수리에 눈이 없고 나무에도 몸통이 없다는 점이 눈에 띄었다”고 했다. 특히 펭귄과 거북이의 표준 3D 모델은 구글 선전과는 달리, 디테일이 거의 없거나 전혀 없는 매우 원시적인 결과물을 보여주었다.
새로운 ‘생성 UI’, ‘제미니 에이전트’ 기능
하지만 ‘제미니 3’는 단순히 프로토타입 제작과 모델링만을 위해 만들어진 것이 아니다. 구글은 ‘프로’ 구독자를 위한 새로운 ‘생성 UI’ 기능을 테스트하고 있다. 이 기능은 응답을 ‘시각적’ 잡지 스타일 인터페이스나, ‘동적인’ 인터랙티브 웹페이지 형태로 패키징한다. ‘테크스토리’는 “‘제미니 3’의 시각적 레이아웃만 볼 수 있었다”며 “구글은 이를 로마로 가는 3일간의 여행처럼 여행 계획을 구상하는 방법으로 보여주었다.”고 전했다.
이에 따르면 실제 로마 여행 프롬프트를 사용해 본 결과, ‘제미니 3’는 여행 일정이 담긴 개인화된 웹페이지처럼 보이는 화면을 보여주었다. 여행 일정을 더욱 세부적으로 맞춤 설정할 수 있는 옵션도 제공되었다. 예를 들어 여유로운 휴가를 선호하는지, 빠른 속도로 진행되는 휴가를 선호하는지, 특정 식사 스타일을 중시하는지 등을 선택할 수 있었다.
‘선호 사항’을 입력하면 ‘제미니 3’가 선택 사항에 맞춰 레이아웃을 재설계한다. ‘더 버지’는 이 기능은 컴퓨터 조립이나 수족관 설치 방법 등 다른 주제에 대한 인터랙티브 가이드도 제공할 수 있다는 것을 알게 되었다.
또 ‘제미니 앱’ 내에서 구글이 울트라 구독자를 대상으로 테스트 중인 ‘제미니 에이전트’(Gemini Agent)를 사용해 보았다. 그랬더니 다른 에이전트 기능처럼, 제미니 에이전트는 캘린더에 알림을 추가하고, 예약을 생성하는 등 사용자를 대신하여 작업을 수행했다.
구글이 애초 광고를 통해 소개한 사례에선 ‘제미니 에이전트’가 ‘Gmail 받은편지함’을 정리하는 모습을 보여줬다. 이에 해당 매체들은 “(구글 광고와 같은) 작업을 해달라고 요청했더니, 명령대로 잘 진행되었다”면서 “지난주에 읽지 않은 이메일 99개를 찾아 대화형 차트에 표시해 주었고, 알림을 설정할 수 있는 옵션도 제공했다”고 전했다.
또 ‘제미니’에 “‘청구서 납부 알림’을 예약해 달라”고 요청했더니, AI 비서가 정확한 납부일을 입력하여 구글 태스크(Google Tasks)에 넣어주었다.
‘받은편지함’을 직접 정리할 수도 있지만, ‘제미니 3’의 지원 기능이 놓쳤을지도 모르는 몇 개의 잊힌 이메일을 찾아주어 다소 도움이 되었다는 얘기다. 또한, 스팸 이메일 제공업체를 대량으로 찾아 구독 취소하도록 요청할 수도 있었다.
예약 기능 등은 ‘절반만 만족’
퍼플렉시티의 AI비서인 챗GPT와 ‘제미니’ 중에서, ‘제미니’는 (예상대로) Gmail과의 가장 풍부한 통합 기능을 보여줬다. 이에 비해 퍼플렉시티는 ‘받은 편지함’에 나열된 이메일을 불러온다. 그러나 Gemini처럼 버튼 하나만 누르면 되는 것이 아니라, 어떤 이메일을 보관할지, 삭제할지 직접 지정해야 한다. 또 챗GPT는 Gmail과의 통합이 ‘읽기 전용’ 모드라고 주장하며 ‘받은 편지함’을 정리하지 않았다. 이에 반해 ‘제미니’는 Gmail에 직접 연결되어 있지만, 앱에서 이메일을 보내는 속도는 퍼플렉시티에 비해 훨씬 느렸다.
‘제미니’는 그러나 어떤 인위적 조작없이도 레스토랑 예약을 거의 완료할 뻔했지만, 예약 직전에 “예약과 관련된 ‘예약비’가 있다”고 거짓말을 했다. 그러나 “‘작업 완료’에 약간의 문제가 있었음에도 불구하고, ‘제미니 3’ Pro의 인터랙티브 시각화 기능은 인상적이었다”고 평가했다. 인터랙티브 모델이나 시각적 레이아웃이 어떤 상황에서는 유용할 수 있다는 것을 알 수 있었다고도 했다.
‘테크스토리’는 “물론 매일 사용할 것 같지는 않지만, ‘제미니’의 텍스트 기반 답변은 대체로 유익한 편”이라며 “당분간은 웹 서핑으로는 바로 찾을 수 없는 질문들을 위해 평소처럼 ‘제미니’를 계속 사용할 생각”이라고 종합 평가를 내렸다.
