단순한 데이터 분석, 기계적 추론 아닌 ‘사고 능력’ 추구
‘깊이 생각할 시간’ 때문에 속도는 GPT4o보다 느려
수학, 물리학 등서 ‘박사 과정’ 수준, 수학경시대회서 ‘상위’ 그룹
[애플경제 이보영 기자] “지금까지의 AI가 기본적으로 자동화의 원리에서 출발해 이를 심화한 것이라면, 이번 ‘o1모델’은 다른다”-.
오픈AI가 13일(현지 시각) ‘o1’(‘o1’-preview) AI 모델을 새롭게 내놓으면서 덧붙인 말이다. 생성AI를 포함해 그간의 AI기술은 본질적으로 자동화의 첨단 버전이며, 주어진 질문을 ‘생각’하는게 아니라, 통계와 데이터를 분석, 응답을 생성한다는 설명이다. 그러나 o1모델은 “실제로 ‘생각’하는, 진정한 의미의 지능 기술”이라고 했다. 일단 코드 작성, 수학 문제 해결, 심층적 추론 수행과 같은 복잡한 작업을 처리하도록 설계되었다.
“인간처럼 사고하는 AI 추구”
이보다 앞서 오픈AI는 장차 인간 지능에 버금가는 ‘사고형 AI’를 제시하며, ‘스트로베리’ AI 시리즈를 개발하기로 했다. 이번 ‘o1’ 모델은 ‘스트로베리’ 시리즈의 제1탄이다. 그래서 모델 이름도 ‘o1’로 붙였다. 현지 매체들과 전문가들은 이를 두고 “오픈AI가 의도적으로 더 느리게 만든 AI”라고 규정했다.
‘엔가젯’은 이에 대해 ‘의도적으로 느린’ 이유가 있다고 풀이했다. 즉, “빠른 속도가 중요한게 아니라, 깊이 생각하고, 인간처럼 논리적을 사고하며 추론하는 AI를 염두에 둔 것”이란 설명이다. 갈수록 더 정교한 ‘초지능’을 추구하는 AI 경쟁에서 주도권을 잡기 위한 오픈AI 나름의 비법인 셈이다.
오픈AI는 출시 직후 웹사이트에서 “‘o1’은 마치 사람처럼 문제에 대응하기 전에 더 많은 시간을 들여 생각할 수 있도록” 훈련되었다고 밝혔다. 즉, “분석이 아닌 ‘사고’ 능력을 키우고, 다양한 선택지를 고민하며, 실수를 인식하는 법을 훈련했다”는 것이다. 예를 들어 의료과학자들이 세포 계열 데이터에 주석을 달고, 물리학자들이 수학 공식을 생성하고, 개발자들이 소프트웨어 아이디어를 구현하는 상황을 염두에 두고 있다.
그러면서 “현재의 AI 시스템은 본질적으로 자동 완성의 더 고급 버전으로, 질문을 ‘생각’하는 대신, ‘통계’를 통해 응답을 생성하므로 사실 ‘지능적’이진 못하다”는 것이다. 이에 오픈AI는 복잡한 문제 해결과 논리적 사고가 실제로 가능하도록 설계된 새로운 종류의 AI 모델을 개발하기로 하고, 그 첫 번째 결과물의 의미를 담아 ‘o1’로 명명했다.
o1 및 o1-mini는 GPT-4의 언어 기능을 향상시키는 대신 과학, 코드 및 수학 생성 및 디버깅에 중점을 두고 있다. 오픈AI는 블로그 게시물에서 이를 자세히 설명하면서 “물리학, 화학, 생물학에서 어려운 벤치마크 과제를 놓고, ‘o1’ 모델은 박사 과정 학생과 비슷한 성과를 보였다”면서 특히 “수학과 코딩에서 탁월하다”고 했다. 특히 현재의 주력 모델인 GPT-4o가 국제 수학 올림피아드 예선에서 문제의 13%만 올바르게 푼데 비해, ‘o1’은 전체의 83%나 풀어냈다. 그 결과 미국 내 상위 500명의 학생 중 한 명으로 평가되었다고 밝혔다.
초지능AI ‘스트로베리’ 시리즈 ‘제1탄’
그러나 이 모델에는 웹 브라우징이나 파일 및 이미지 업로드 등과 같은 기능은 포함되지 않았다. ‘더 버지(The Verge)’에 따르면 이는 GPT-4o에 비해 프롬프트 처리 속도는 상당히 느리다. 빨리 대답하기보단, 시간을 두고 깊이 생각한 끝에 답변을 내놓는게 중요하다는 의미다.
o1-preview는 최대 32k 토큰을 출력할 수 있는 반면, o1-mini는 최대 64k 토큰을 출력할 수 있다. 토큰은 텍스트의 복잡성에 따라 글자 하나만큼 짧기도 하고, 한 단어만큼 길어질 수 있다. 두 버전의 새 모델은 모두 텍스트 입력만 지원하며, 오디오나 이미지는 지원하지 않는다.
그럼에도 불구하고, ‘o1’ 역시 ‘환각’ 문제를 완전히 해결하지는 못한 것으로 전해졌다. 오픈AI는 “환각을 해결했다고 말할 수는 없다.”면서 “’o1’은 아직 초기 단계에 있어, 좀더 개선된 버전은 현재 연구 중”이라고 밝혔다. 그래서 ‘o1’ 모델에 대해 오픈AI는 ‘생각하는 AI’ 모델의 ‘미리보기’라고 부르고 있다. 이는 일단 13일부터 챗GPT 유료 고객에게만 제공하고 있으며, 한 주당 프롬프트 질문 가짓수에 제한이 있다. 동시에 오픈AI는 특히 “코딩에 효과적”이라고 밝힌, 간소화된 버전인 ‘o1-mini’도 출시했다.
챗GPT Plus, 팀 사용자 및 어픈AI API를 사용하는 개발자 등은 ‘o1’-preview의 ‘미리보기’ 버전에 액세스할 수 있다. 이들 사용자는 ‘o1’-mini에 액세스할 수도 있다. o1-mini는 더 작은 모델이며 “o1-preview보다 80% 저렴하고, 추론은 필요하지만 광범위한 지식은 필요하지 않은 애플리케이션에 적합한, 강력하고 비용 효율적인 모델”이라고 했다.
