“유해한 성적 언사, 폭력, 정신 건강 등 부적절 콘텐츠 절제”
‘GPT‑5.1 Instant’, ‘GPT‑5.1 Thinking(씽킹)’ 등 2가지 모델
단순 작업은 쉽고 빠르게, 복잡한 작업 지속성 뛰어난 ‘고급 추론 모델’

GPT 5.1 이미지와 오픈AI 로고. (출처=챗GPT 출력)
GPT 5.1 이미지와 오픈AI 로고. (출처=챗GPT 출력)

[애플경제 이윤순 기자] 오픈AI는 12일 GPT-5.1을 공개하면서 이른바 “더욱 따뜻하고, 대화형으로 진행되며, 불쑥 감정을 유발하는 언사를 지양한다”고 소개했다. “성적 갈등이나, 폭력, 정신 건강에 대한 불쾌한 의견이나 콘텐츠를 극도로 절제할 것”이란 얘기다.

이는 두 가지 버전으로 구성된다. “더 온화하고 지능적이며, 사용자의 지시를 더 잘 따르는” ‘GPT‑5.1 Instant’가 그 중 하나다. 또한 “단순한 작업에선 더 이해하기 쉽고 빠르며, 복잡한 작업에서는 더 지속성이 뛰어난 고급 추론 모델”인 ‘GPT‑5.1 Thinking(씽킹)’도 출시했다. 이는 유료 구독자에게 제공된다. 무료 서비스(GPT-5-instant-aug15)는 지난 8월 출시되었고, 지난달 업데이트된(gpt-5-instant-oct3) GPT-5를 계속 이용할 수 있다.

결론적으로 “지능과 소통 스타일 모두에서 의미 있는 개선을 이루었다”는 오픈AI의 평가다.

채팅 스타일에 대한 선호도는 사람마다 다르다. 심지어 대화 한 마디에도 서로 다를 수 있다. 이에 “챗GPT가 사용자가 원하는 답변의 분위기를 더 잘 표현할 수 있도록 더욱 직관적이고 효과적인 제어 능력을 도입했다”고 한다.

오픈AI는 지난 8월에 GPT-5를 출시하면서 개인 설정 메뉴에 4가지 챗GPT 성격의 설정(냉소적, 로봇, 청취자, 괴짜)를 추가한 바 있다.

이번 ‘5.1’에선 다시 로봇은 ‘Efficient’로, ‘Listener’는 ‘Friendly’로, ‘Cynical’은 ‘Cynic’으로 바뀌었고, ‘Nerd’는 변경되지 않았다. 다만 ‘Professional’, ‘Candid’, ‘Quirky’라는 페르소나가 새로 추가되었다.

또 지난 8월에 GPT-5의 톤을 조정할 때, ‘성격’ 조정 과정에서 문제로 지적되었던, ‘아첨꾼’으로 변하는 것을 막았다고 밝혔다.

오픈AI는 ‘GPT‑5.1 Thinking’을 설명하기 위해 “더 따뜻하고 공감 능력이 뛰어나다”와 같은 용어를 사용하는 것은 조심해야 한다는 입장이다. 머신러닝 모델이 특정 토큰을 생성함으로써 그러한 특성을 보여줄 수 있다는 생각을 불필요하게 고착화한다는 이유다.

한편 GPT-5.1은 이전 버전에 비해 일부 내부 프로덕션 벤치마크에서 성능이 떨어진 것으로 나타났다. 즉 GPT-5.1-thinking 모델은 ‘괴롭힘’이나, ‘증오’ 표현이 포함된 콘텐츠와, 허용되지 않는 성적 콘텐츠에 대해 GPT-5-thinking 모델보다 약간 퇴보한 것으로 보인다는 설명이다.

결론적으로 GPT-5.1-instant는 첫 번째 GPT-5 버전인 GPT-5-instant-aug15보다 우수하지만, 지난달 출시된 업데이트인 GPT-5-instant-oct3보다는 유해한 성적 콘텐츠, 폭력 콘텐츠, 정신 건강 및 정서적 의존을 경계하는 기능은 미흡하다는 지적이다.

외부 벤치마크 결과는 아직 발표되지 않았다. 하지만 오픈AI는 “GPT‑5.1이 적응형 추론 기능 구현 덕분에 ‘AIME 2025 및 Codeforces’와 같은 수학 및 코딩 평가에서 상당한 개선을 보였다”고 주장한다.

이는 또 특정 쿼리의 복잡성에 따라 할당할 계산 리소스의 양을 변경할 수 있는 고급 추론 모델이다. 즉, 비교적 간단한 쿼리를 약 2배 빠르게 처리한다. 동시에 한층 복잡한 작업에 훨씬 더 많은 시간을 할애, 모든 응답에서 일관성과 균일성을 보장한다. 기본적으로 가장 간단한 작업에서는 2배 빠르고, 가장 복잡한 쿼리에서는 2배 느리다는 얘기다.

저작권자 © 애플경제 무단전재 및 재배포 금지