‘GPT-5’…세상을 ‘사고의 사슬’로 풀어낸다
‘GPT-4.5 코드 재활용’ 구설수 불구, 체계적 ‘사고’ 기능에 눈길 문제를 ‘분해’, 논리적 구조로 나눠 각 부분 의미 파악, 수정 답변 ‘종합’보다 질문 ‘역설계’, 작게 나눈 목록을 질의의 맥락으로 사용 추론 작업 단계별 처리, 개선된 통찰력으로 향상된 추론 시현
[애플경제 전윤미 기자] 오픈AI와 샘 앨트먼이 그토록 요란하게 홍보해왔던 GPT-5가 마침내 그 모습을 드러냈다. 앞서 이는 GPT-4의 점진적 후속모델 ‘GPT-4.5’ 코딩 모델을 그대로 ‘재활용’했다는 등의 구설수가 따르기도 했다.
그럼에도 정작 8일(현지시각) GPT-5가 출시되면서 일각에선 “LLM 초창기에 바라던 (이상적인 AI의) 모습 그대로일 수 있다”는 기대섞인 호평까지 나왔다. 일단 최고 수준의 생성AI모델임을 인정한 셈이다. 이에 현지 외신들은 물론, 국내 언론들도 GPT-5의 특성과 사양에 대한 다양한 기사를 쏟아내고 있다. 향상된 추론 기술과 고도의 음성합성 기능 등 많은 새 기술들이 소개되었다.
언론 ‘백화점식 기능 나열’ 보도가 놓친 ‘생각의 사슬’
그러나 GPT-5의 가장 대표적인 차별화 포인트는 한 마디로 ‘사고의 사슬’(Chain of Thought)이다. 이는 AI 비관론자와 회의론자들까지도 공감할 만한 ‘인문학적 사고’가 뒷받침된 ‘인간형 기술’로 평가할 수도 있다. 이날 라이브 스트리밍으로 중계된 기술 발표회에서 CEO 샘 앨트먼은 무엇보다 ‘새롭게 업그레이드된 마크 저커버그 음성’을 공개했다. 고도의 음성합성 기술을 과시한 것이다.
정작 눈길을 끈 것은 앨트먼이 “모델이 이전 모델을 잘못 사용해 만족스럽지 못한 답변을 하면 그것을 반환한 후, 조금 더 어려운 답변을 요구하면 더 나은 답변을 제공하는 상황이 가능한지가 제 질문”이라고 한 대목이다. 곧 ‘생각의 사슬’을 그렇게 표현한 것이다.
이날 오픈AI가 자체 유튜브, 블로그 등을 통해 공개한 라이브 스트리밍은 짐짓 ‘엄숙한 선언식’인양 비춰졌다. 그 만큼 자신들로선 비장한 각오로 GPT-5를 출시했다는 뜻이다. 앨트먼 역시 스트리밍 서두에서 “GPT-5를 계기로 AI의 응용 분야를 엄청나게 확장할 수 있을 것”이라고 강조하기도 했다.
이번 GPT-5의 핵심인 ‘생각의 사슬’은 쉽게 말해 답변을 ‘종합’하기에 앞서, 프롬프트의 질문을 ‘분해하고 이해’하는 데 집중하는 것이다. 마치 기술 개발에 앞서 선험적 기술을 먼저 해부해보는 ‘역설계’를 방불케 한다. 질문을 작은 목록으로 나누고, 전체 대화 기록을 향후 모든 질의의 맥락으로 사용하거나, 학업 모드로 읽고 응답할 수 있는 기능이 그런 경우다.
‘非사고의 사슬 모델’ GPT-4와 대비
이는 직전 버전인 GPT-4와 대비된다. GPT-4 역시 사용할 수 있는 데이터와 이를 처리하는 방법 모두 수많은 업그레이드를 거쳤다. 그러나 GPT-4의 두드러진 특징은 추론의 과정을 ‘추가’하는 것이 아니라, ‘제거’하는데 중점을 둔 부분이다. 즉, GPT-4는 “非사고의 사슬 모델”이라는 주장이다.
그런 점에서 GPT-5는 다른 무엇보다 ‘非사고’가 아닌, ‘사고(생각)의 사슬’이란 점이 특징이자 가장 대표적으로 개선된 내용이다.
‘사고의 사슬’은 이미 구글에서부터 널리 쓰인 용어이긴 하다. 질문을 여러 하위 질문으로 나누어 원래의 복잡한 질문을 구성하는 과정이다. GPT-5 역시 각 (추론) 작업을 단계별로 처리하되, 한층 개선된 통찰력은 이후 향상된 추론 작업을 위한 재료가 된다.
인간은 바로 ‘생각의 사슬’을 바탕으로 한 고도의 사고와 사유능력 덕분에 AI보다 훨씬 더 쉽게 세상과 우주의 새로운 변화에 능숙하게 대처할 수 있다. 즉 눈앞의 문제를 ‘분해’(분석)하고, 논리적 구조로 나눠 각 부분의 의미를 파악하며, 수정할 수 있다. 또한 그런 결과 가 어떤 영향을 미칠지도 정확하게 직감할 수 있다.
GPT-5는 이런 인간의 ‘사고 체계’(사고의 사슬)를 거칠게나마 착안한 것이다. 나아가선 프롬프트를 통해 사용자의 사고를 교정할 뿐만 아니라, 뛰어난 논리적 도출 과정을 설명할 수 있는 최초의 AI 모델이 될 것이란 기대다. 그래서 사용자 스스로 “대화 상대인 AI보다 더 똑똑하다”고 느낄 수 있게 하는 것이 목표이기도 하다.
오픈AI, ‘생각의 사슬’ 요란한 광고
GPT-5의 이런 기능은 이미 오래 전부터 요란한 광고와 홍보를 통해서도 널리 알려져왔다. 오픈AI는 “이 모델은 더 빠르고 효과적인 추론을 제공하고, 통찰력을 더욱 명확하게 전달한다”면서 “사용자와의 협업 능력이 향상되었으며, 궁극적으로는 실제 프로그래밍을 만드는 능력도 향상될 것으로 예상된다”고 했다.
이날 스트리밍 후반, 발표자가 GPT-5에게 어린이용 웹 앱을 실시간으로 제작하도록 즉석에서 지시하기도 했다. 이는 특히 음성 합성 기능이 내장된 통합 게임을 포함하고 있다. 그러나 이 정도는 늘 있을 법한 LLM의 표준 업데이트처럼 들린다. 무엇보다 중요한 것은 역시 ‘생각의 사슬’을 통한 추론 능력의 향상이다.
GPT-4 등 예전 모델 내포한 ‘통합 모델’
또 다른 특징 중 하나는 GPT-5가 통합 모델이라는 점이다. 즉, 이전 버전(GPT-4 등)을 포함하고 있다는 뜻이다. 모든 모델에 단일 웹 인터페이스가 적용되어 시스템이 질문의 난이도를 즉시 판단한다. 또 예전 모델로 쉽고, 더 빠르게 적은 전력으로도 해결할 수 있다고 판단되면, 해당 모델을 대신 사용하기도 한다.
물론 이 밖에도 GPT-5에는 여러 ‘사소한’ 기능 개선이 곁들여있다. GPT가 개성있는 태도와 표적으로 말하는 방식이나, 한층 세련된 오디오 출력을 위한 스마트한 음성 합성 기능 등도 있다. 또 프로(Pro) 버전에선 제미니, 구글 캘린더와의 통합 기능도 있다.
또 다른 새로운 기능들 중 일부는 프로 버전에서만 제공된다. 유료 사용자는 채팅 색상까지 개인 설정할 수 있는데, 이에 대해선 “그다지 쓸모없는 기능”이란 평가도 있다.
챗GPT의 GPT-5 통합은 무료 버전을 포함한 모든 티어에 적용된다. 즉, 처음으로 챗GPT의 모든 기능을 GPT-5를 통해 누구나 이용할 수 있게 된다. 매우 높은 수준의 기능에 대해서만 유료화된다. 즉 “가장 가치 있고 많이 사용되는 엔터프라이즈급 도구 중 일부를 이젠 일반 사용자들에게도 제공할 수 있게 되었다.”는게 이날 오픈AI의 소개다.