‘파격보단, 점진적 개선’…AI산업에 ‘GPT-5 현상’?

획기적인 기술혁신보다 매 버전마다 ‘점진적 기능 개선·개량’ GPT-5, ‘기대 이하’ 평가 불구, ‘AI생태계의 새로운 추세’ 평가도 사용자들 놀라게하는 것보다 “‘슬로우 템포’의 개선이 수익에 도움” 일각에선 “이미 일부 영역, AI기술의 ‘특이점’ 도달” 한계 지적도

2025-08-18 전윤미 기자

GPT-5 기반의 챗GPT 화면. (출처=오픈AI)

[애플경제 전윤미 기자] 오픈AI의 오랜 숙원이었던 새 모델에 대한 기대감은 2023년 GPT-4 출시 이후 2년 간 날로 커졌다. 그러다가 내놓은 것이 GPT-5다. 그러나 이는 엄청난 과대 광고에도 불구하고, 대부분의 평가는 “기대 이하”로 판명났다. 이를 두고 오픈AI의 또 다른 ‘패착’으로 보기도 한다.

그러나 또 다른 시각도 있다. 과거처럼 새 버전이 거듭될수록 엄청난 혁신을 이루던 시대는 지났다. 그 보단 매우 느리게 점진적으로 기능이 보완되는 ‘슬로우 모션’이 대세란 얘기다. 그런 방식은 개별 소비자를 감동시키진 못해도, 실질적인 수익으로 이어질 가능성이 더 높다는 분석이다.

AGI 겨냥하는 국면과는 엇갈려

는 현상근본적으로 이와 다른 관점도 있다. 이른바 일정 부분에 있어선 기술적 ‘특이점’(Singularity)에 도달했다는 것이다. 즉 더 이상 기술이 발전할 수 없는 극단적 지경에 이른 것이다. 이런 논리는 미래학자 레이 커즈와일이 줄기차게 주장해온 것이기도 하다. 물론 이는 아직 큰 공감을 얻긴 힘들 것으로 보인다. 특히 인간을 능가한다는 AGI를 겨냥한 기술 개발이 활발하게 진행되는 현실과도 어긋난다. 아직은 AI기술의 극한점에 도달하지 않았다는 반론을 피하기 어렵다.

실제로 이번 GPT-5의 한계를 두고, 미리 ‘특이점’을 인용하는 것은 무리일 수도 있다. 그럼에도 불구하고, 슈퍼AI 기술로 나아가는 길이 결코 쉽지만은 않을 것이란 전제는 설득력을 얻고 있다.

챗GPT에 GPT-5가 처음 등장했을 때, 사용자들은 대체로 실망하는 분위기였다. 기대했던 만큼의 획기적 발전은 보이지 않았다. 대신에 그저 ‘점진적’인 기술 변화만 보일 정도였다.

GPT-5가 처음 출시될때부터 며칠 간 빗발치던 혹평과 사용자들의 불만, 항의, 비난이 이젠 조금 잦아드는 편이다. 다만 비용(정확히는 가성비)과 속도, 코딩 부문에선 일단 그런대로 괜찮다는 평가를 받았다. 이를 두고 일각에선 “비록 기대했던 만큼 화려하진 않아도, 오픈AI로선 오히려 안정적 수익을 늘리는데는 도움이 될 것”이란 평가도 나왔다.

애초 오픈AI와 샘 앨트먼은 지난해부터 이미 엄청난 홍보와 과대광고를 이어왔다. 오픈AI는 자사 사이트를 통해 GPT-5를 “지금까지 있었던 모든 AI 가운데 최고의 시스템”이라며 “코딩, 수학, 글쓰기, 건강, 시각 인식 등 모든 분야에서 최첨단 성능을 갖춘 지능의 비약적 발전”이라고 칭했다. 샘 앨트먼 역시 기자 회견에서 GPT-5와의 대화가 “박사급 전문가와 대화하는 것 같다”고 했다.

GPT-5 소개 화면. (출처=테크스토리)

과장된 홍보에 전혀 못미친 GPT-5

그러나 이런 과장된 홍보는 현실과 극명한 대조를 이루었다. 소셜 미디어에선 사용자들이 발견해낸 온갖 오류와 흠집이 줄을 이었다. 이에 따르면 챗GPT-5는 ‘박사급’ 지능을 가졌다면서 정작 블루베리(blueberry)라는 단어에 ‘b’가 세 개 있다고 반복해서 주장하기도 했다. 미국에서 ‘R’이 포함된 주 이름이 몇 개인지도 제대로 식별하지 못했다. 심지어는 네바다를 캘리포니아의 한 지역으로 표시하기도 했다.

특히 사용자들의 비판을 샀던 것은 ‘응답’의 맥락과 ‘태도’였다. 상담이나 위로 등 감정적 도구로 봇을 사용했던 사람들은 GPT-5가 “매우 냉담하다”며 격력히 비난했다. 이에 오픈AI는 한때 삭제했던 GPT-4o를 다시 접목시키기도 했다.

전문가들의 여론 또한 관대하지 않았다. 테크스토리나 더 버지, 엑시오스 등에 따르면 AI 업계의 거물인 게리 마커스는 이 모델을 “늦고, 과장되었으며, 기대에 미치지 못한다”고 잘라 말했다. 미국 ‘AI 정책 및 전략 연구소’ 설립자인 피터 와일드포드는 자신의 리뷰에서 “이게 우리가 찾던 기대주인가? 안타깝게도 결코 아니다”라고 했다.

인기 AI 업계 블로거인 즈비 모우쇼비츠도 “그저그런 평범한 모델” 정도로 평가하는 등 전문가들의 혹평은 끝없이 이어졌다.

GPT-5 출시 후 며칠 동안 쏟아져 나오던 부정적인 리뷰는 지난 주말부터 다소 누그러졌다. 그러면서 조심스럽지만 좀더 객관적 평가가 나오기 시작했다. 대체로 “GPT-5가 사람들이 기대했던 만큼 획기적인 발전은 아니었지만, 비용과 속도 면에서 개선되었고, 환각 현상도 줄었다”거나, “백엔드에서 사용자의 질의를 가장 적합한 모델로 자동 연결, 사용자가 직접 결정할 필요가 없도록 하는 스위치 시스템도 새로운 느낌”이란 평도 이어졌다.

이에 샘 앨트먼은 “옳다구나” 한 듯, “GPT-5는 우리가 만든 가장 스마트한 모델이지만, 우리가 가장 중요하게 여겼던 것은 실제 사용자 편의와 대중의 접근성, 그리고 부담없는 가격”이라고 강조했다.

“사용자 편의, 접근성, 가격에 중점” 해명도

또 다른 오픈AI 관계자들도 X에 GPT-5의 장점을 나열했다. 즉 “진짜 핵심은 유용성”이라고 했다. “사람들이 중요하게 생각하는 것, 즉 배송 코드, 창의적인 글쓰기, 건강 정보 탐색 등을 더욱 안정적이고 간편하게 처리할 수 있도록 도와준다”면서 “특히 환각 현상도 줄였고, 모르는 것은 정직하게 ‘모르겠습니다'라고 말하고, 사실과 추측을 구분하며, 필요할 때 인용을 통해 답변을 뒷받침할 수 있다.”고 소개했다.

그럼에도 불구하고 GPT-5가 챗GPT의 텍스트 능력이나 화법을 떨어뜨렸다는 의견도 널리 퍼져 있다. 실제로 소셜 미디어 바이럴 게시물들을 보면 “글솜씨가 떨어지고 깊이가 부족하며, 로봇 같고 차갑게 느껴진다”고 불평했다.

심지어 GPT-5의 마케팅 자료에서조차 이런 점은 드러났다. 사측이 GPT-4o와 GPT-5로 생성된 결혼 축사를 나란히 비교한 내용을 보면 오히려 GPT-4o가 낫다는 반응이 많다. 그래서 “개인적으로 4o 모델을 더 선호한다”는 사용자들이 더 많았다.

오픈AI의 CEO 샘 앨트먼. (출처=테크스토리)

‘파격’이나 혁신보단 ‘안정’이 유리한 전략?

그러나 분명 장점도 있다. 바로 코딩이다. GPT-5의 한 버전은 현재 코딩 부문의 AI 모델 순위표 1위를 차지하고 있다. 그 뒤를 앤스로픽의 클로드가 차지하고 있다. 따지고 보면, 이는 오픈AI로선 매우 반가운 일이다. 오픈AI는 오랫동안 앤스로픽이나 구글 등 경쟁사들과 AI 코딩 전쟁에서 치열하게 경쟁해 왔기 때문이다.

오픈AI는 또한 의료 분야에서 GPT-5의 역량을 강조했지만, 아직 실제 적용 사례는 거의 검증되지 않았다. 따라서 그 성공 여부는 당분간 알 수 없을 것으로 보인다. 결론적으로 GPT-5는 이전 모델보다 더 나은 성능을 보였지만, 많은 업계 관계자에 따르면 이러한 개선은 크게 눈에 띄지 않았다. 대다부 벤치마크는 “공식적인 평가 측면에서 GPT-5는 대체로 예상대로 소폭의 점진적인 증가를 보였을 뿐, 이렇다할 기술혁신을 보이진 않은 제품”이란 평가가 주를 이룬다.

하긴 이는 GPT-5뿐이 아니다. 최근 사례를 보면, AI모델들은 개발사의 요란한 홍보와는 달기, 소폭의 점진적인 기능 추가에 그치는 경우가 많다. 그런 전략이 오히려 “실질적인 수익으로 이어질 가능성이 더 높다”는 판단을 하고 있다. 실제 AI 기업들은 가장 큰 수익 창출 경로가 고객 기업이나 정부 계약 수주, 그리고 투자자다. 그렇다보니 이젠 ‘파격’이나 혁신보단 ‘안정’에 무게를 두는 편이다. 즉 견고한 기존 기능을 점진적으로 발전시키면서 코딩 강화와 환각 퇴치에 투자하는 것이 “더 많은 것을 얻는 가장 좋은 방법”임을 깨닫는 듯한 분위기다.