출시 앞둔 ‘GPT-5’…알고 보면 ‘GPT-4.5’?

GPT-4.5 위한 코드 ‘오리온’을 GPT-5 용으로 전환? 샘 앨트먼 과대광고 불구, “GPT-4와 크게 다를 것 없어” “GPT 버전 업그레이드 반복해도 획기적 기술 발전 어려워” 이달 출시 ‘GPT-5’ “별 것 없어…과잉 기대는 금물”

2025-08-05     이윤순 기자
 GPT-5는 사실상 GPT4.5 개발을 위한 코드를 기반으로 한 것이란 얘기도 있다. 사진은 오픈AI 사이트 화면. (출처=오픈AI)

[애플경제 이윤순 기자] 지난해 오픈AI 샘 앨트먼은 GPT 모델이 세대(버전)을 거듭할수록 지속적이고, 파격적으로 발달할 것이라고 예언한 바 있다. 그러나 현실은 그와는 다르다는 지적이 많다. 물론 GPT-3을 거쳐 GPT-4에 이르면서 상당 수준의 기술 발전을 이룬 것은 사실이다. 그러나 ‘파격적’이라고 할 수준은 아니란게 많은 사용자들과 전문가들의 시각이다.

실리콘밸리를 비롯한 글로벌 업계 일각에선 “몇 년 후 설사 GPT-8이 나온다고 해도 과연 이를 ‘진정한 디지털 초지능’이라고 부를 순 없을 것”이란 평가까지 나오고 있다. 앨트먼과 오픈AI가 그토록 변죽을 울리며 사전에 과대 광고를 하고 있는 GPT-5 역시 “별 것 없을 것”이란 전망이 지배적이다.

요란한 ‘언론 플레이’ 불구, ‘별로 달라진게  없을 것’

실제로 앨트먼은 연일 “GPT-5가 이달 말까지 출시되면서, AI 기술의 또 다른 진면목을 보여줄 것”이라고 홍보하느라 바쁘다. 그가 한 마디 할때마다 수많은 유력 외신을 포함한 국내외 언론매체들도 받아쓰기에 바쁘다. 액면대로라면, 마치 GPT-4 이전에 비해 천지개벽이라도 되는 듯, ‘획기적’이란 얘기다.

그러나 앨트먼이 자꾸 출시를 미루면서, 홍보에만 열을 올리는 모습에 일각에선 “GPT-5가 곧 출시되지만, 과대광고에 묻히지 않는 진실을 직시해야 할 것”이라는 비판도 이어지고 있다. 이런 비판은 아직은 일부 벤치마크 플랫폼과 ‘킷그루’, 매셔블 등 일부 전문 매체들에 국한된 것이다. 그럼에도 그 행간을 보면, 분명 GPT-5가 “그다지 달라진 것 없는, GPT-4의 다음 제품 목록”이란 평가도 가능할 법하다.

심지어는 “과열을 자제하라”고 일부 사용자들의 지나친 기대를 경계하기도 한다. 이에 따르면 GPT-5가 오픈AI 말로는 “GPT-4보다 더 똑똑하다”고 하지만, 그 차이는 크지 않을 것으로 보인다. 이미 GPT-5가 출시되기 몇 달 전부터 샘 앨트먼이 워낙에 요란한 ‘과대광고’를 하는 바람에 과잉 기대감이 팽배한 상태란 지적이다.

앨트먼은 지난 6월 블로그에 올린, 이른바 ‘젠틀 싱귤래리티(Gentle Singularity)’란 제목의 게시물이 대표적이다. 그는 “인류가 디지털 초지능을 구축하는 단계에 근접했다”고 주장하며, ‘GPT-5’를 그 상징적 존재로 꼽았다. “놀라운 새로운 기능을 목격했고 8월에 공개하기를 손꼽아 기다리고 있다”는 것이다.

 GPT의 새로운 버전을 발표하고 있는 오픈AI CEO 샘 앨트먼. (이미지=펙셀)

‘GPT-5’의 기만?…‘쉬쉬’ 숨겨진 문제점

정말 그럴까? GPT-5엔 그런 굉장한 새로운 기능들이 있을까? 정작 앨트먼이 어느 정도 그 자세한 성능을 언급하면서부터 그런 사전 홍보나 광고가 다분히 과장된 것임이 서서히 밝혀지고 있다. 앨트먼 스스로가 “GPT-5가 나에게 유용한 이메일을 선택해 보내줬을 때 오히려 ‘쓸모없는 것들’이라고 느꼈다” 한 팟캐스트에게 털어놓은 사실이 밝혀졌다.

또한 X에서 앨트먼은 “GPT-5에 열광하며 TV 프로그램 목록을 추천했다”면서 “이들은 AI에 대한 생각을 자극하는 TV 프로그램”이라고 말했다. 그러나 그의 이런 언급에 대한 날선 비판도 쏟아졌다. “GPT-5가 ‘진정한 디지털 초지능’이 아니라, 이전 모델보다 약간 개선된 것이라고 말하는게 더 솔직했을 뻔했다”는 것이다,

앨트먼의 언행이 과장되었다는 사실이 새삼 밝혀지기도 했다. 실리콘 밸리 ‘특종 정보 사이트’로 불리는 ‘더 인포메이션’(The Information)이 그 내막을 추적, 파헤치면서 알려졌다. 이 매체는 오픈AI와 파트너사인 마이크로소프트 Microsoft 내부의 여러 소식통을 인용해, “GPT-5의 업그레이드는 주로 수학 문제 해결이나, 소프트웨어 코드 작성 분야에 집중되어 있다”고 했다. 그러면서 “2020년 GPT-3나, 2023년 GPT-4의 업그레이드 수준보다는 훨씬 못한 편이며, 이전 GPT 모델들의 성능 향상 속도와도 비교가 안 된다”고 폭로했다.

이는 기술 개발 노력이 부족해서가 아니다. 애초 GPT-5를 개발하려는 첫 번째 시도였던 코드명 ‘오리온(Orion)’이 문제라고 했다. 실제로는 GPT-4.5라는 이름으로 출시되기로 했던 코드 기반 모델이 ‘GPT-5’로 둔갑했다는 것이다.

그 이유는 뻔하다. 그만큼 획기적인 기술 개발이 없었기 때문이다. 오픈AI 내부에서조차 자체 실험 모델 중 ‘GPT-5’라는 이름으로 출시하는게 적절치않다고 판단했기 때문이다.

 오픈AI의 GPT-4o 소개 이미지. (출처=오픈AI) 

‘고품질 웹 데이터 부족’으로 기술 ‘정체’ 필연적

또한 문제가 된 것은 모델을 학습시킬 고품질 웹 데이터의 부족이다. 그 때문에 GPT-5 모델 전체가 애초 계획했던 수준에 이르지 못한 것으로 알려졌다. 이에 권위있는 AI 전문가인 게리 마커스는 ‘매셔블’에 “단순한 규모 확장만으로는 ‘디지털 초지능’에 도달할 수 없다”면서 “AI 산업의 수익성이 신통치 않은 것도 그 때문”이라고 했다.

AI 모델이 AI 에이전트에 통합되면 더욱 그럴 가능성이 크다는게 이들 전문가들의 진단이다. 실제로 AI 메트릭 스타트업 ‘펜로즈’(Penrose)의 윤위 린(Yunyu Lin) 연구원도 ‘킷 그루’에 “최근 오픈AI의 o3 및 o4 mini를 포함한 여러 LLM들도 시간이 지남에 따라 성능이 저하된다는 사실을 발견했다”면서 “심지어 전문 분야인 기본 수학에서도 마찬가지”라고 했다.

예를 들어 회계 SW ‘퀵북스’를 사용, 회계 작업을 수행하라는 요청을 받았을 때, 해당 모델들은 12개월 이내에 약 15%의 오류율을 기록했다. 즉, 장부 균형을 맞추려는 과정에서 의도치 않은 ‘회계 부정’을 저지른 것이다. 게다가 단 한 달치 회계 작업도 완료하지 못했다. “계속해서 일정한 ‘루프’(챗바퀴)에 갇혔다”는 것이다.

그럼에도 올해 오픈AI는 GPT-5와 같은 새로운 모델을 연구하는 무려 약 80억 달러의 현금이 소진될 것으로 예상하고 있다. 더 많은 유료 고객을 유치할 수 있도록 성능을 개선하기 위해 연말까지 최대 400억 달러의 자금을 확보하기 위해 분투하고 있다. 이런 사정은 GPT-5는 물론, 후속 모델들(GPT-6, GPT-7, GPT-8 등)에 대해서도 매번 ‘과대광고’를 할 수 밖에 없는 요인이 될 것으로 보인다.