텍스트, 문자․숫자 배열 ‘맥락과 논리’ 파악, 추론 능력 더 뛰어나
오픈AI, GPT-4 매개변수 등 함구, “GPT3.5보단 엄청 많아”
챗GPT-Plus 가입자에 제공, “7월말경 일반에게 더욱 확대 개방”

오픈AI의 GPT-4에 대한 설명문 이미지.(출처=오픈AI 홈페이지)
오픈AI의 GPT-4에 대한 설명문 이미지.(출처=오픈AI 홈페이지)

[애플경제 박문석 기자]챗GPT가 AI 기술의 새로운 전환기를 마련한데 이어, 지난 7일부터 오픈AI는 “성실하게 결제를 해온 기존 API 소유자”들을 대상으로 신제품인 GPT-4 API를 자유롭게 사용할 수 있도록 했다 또 7월 말까지 모든 가입자들에게 이를 개방할 것으로 알려지면서 새삼 GPT-4에 대한 관심이 높아지고 있다.

그렇다면 GPT-4는 기존 GPT-3이나, GPT-3.5 기반의 챗GPT에 비해 어떻게 다른가. 오픈AI의 4세대 기반 모델이다. 일단 챗GPT-PLUS(챗GPT 플러스)에 가입하면 이용할 수 있다. 물론 리소스의 양에 따라 속도 제한이 가해지는 등 변수는 있기 마련이다.

“사람과 같은 말투와 추론 모방”

오픈AI 제품 설명과 블로그에 의하면 GPT-3.5와 마찬가지로 GPT-4도 사람과 같은 말투와 추론을 모방할 수 있는 AI LLM(대형 언어모델)이다. 고전 문학 작품부터 광범위한 인터넷상의 정보에 이르기까지 방대한 인간사회의 정보와 커뮤니케이션, 라이브러리를 섭렵한다.

특히 이는 어떤 문자나, 숫자에 이어, 또 다른 어떤 문자가 논리나 순서대로 이어질지, 즉 맥락을 예측하는 능력도 수준급이다.

그래서 사람이 만든 수필이나 보고서는 물론, 예술품이나 영상물 또는 오디오를 모방할 수 있는 대형 멀티모달 모델다. 또 시험 문제를 풀거나, 텍스트 또는 이미지를 생성하는 능력이 GPT-3.5보다 탁월하다. GPT-4 API는 GPT-3.5 터보(Turbo), 달-리(DAL·E), 휘스퍼(Whisper) API 등과 함께 사용할 수 있다.

본래 오픈AI는 지난 3월 14일 GPT-4 출시를 발표했다. 출시때부터 ‘챗GPT-플러스’ 가입자는 즉시 사용할 수 있었고, 다른 관심 있는 사용자의 경우는 대기자 목록에 일단 등록해야 했다. GPT-4 기반의 ‘챗GPT-플러스’ 사용료는 월 20달러(한화 약 3만3천원)다. 기업체 오피스용이나 교육사업용이 아닌, 개인이 구독한다면 싸다고 할 수 없다.

오픈AI에 따르면 사용량은 토큰 수(Token, 자연어 처리를 위해 문장 및 단어를 조각낸 최소 단위)로 측정되며, 영어의 경우 1토큰은 보통 4개의 알파벳(=0.75단어)으로 계산된다. ‘gpt-4-32k’로 알려진, 컨텍스트 길이가 더 긴 두 번째 옵션인 약 50페이지의 텍스트도 사용할 수 있습니다.

올림피아드, 변호사 시험 등서 90점 이상 득점

이전 버전인 GPT-3.5처럼 GPT-4 역시 주요 기능은 자연어 질문과 프롬프트에 대한 응답 이다. OpenAI는 GPT-4가 “자연어로 된 복잡한 지침을 따르고 어려운 문제를 정확하게 해결할 수 있다”면서 구체적으로 “GPT-4는 수학 문제를 풀고, 질문에 답하고, 추론을 하거나 이야기를 할 수 있다”고 했다. 또한 GPT-4는 많은 양의 콘텐츠를 요약할 수 있어, 비즈니스에도 유용하다는 평가다.

특히 오픈AI는 국제 올림피아드 시험이나, 변호사 시험을 포함한 여러 평가를 통해 GPT-4의 능력을 테스트했다. 그 결과 변호사 시험에선 평균 90점을 받았고, SAT 증거 기반 읽기 및 쓰기 시험에선 93점을 받는 등 탁월한 능력을 과시했다.

이것들은 지식에 대한 진정한 테스트가 아닙니다. 대신에, 표준화된 테스트를 통해 GPT-4를 실행하는 것은 모델이 훈련된 기존의 글과 예술의 질량에서 정확한 답변을 형성하는 능력을 보여줍니다. GPT-4는 어떤 토큰이 순서대로 다음에 올 것인지 예측합니다. (하나의 토큰은 숫자, 문자, 문자, 공백 또는 기타 문자.)

API(Chat Completions API)를 사용하면 개발자가 자유 형식 텍스트 프롬프트 형식을 통해 GPT-4 API를 사용할 수 있다. 이를 통해 대화를 주고 받는 챗봇이나 다른 기능들을 만들 수 있다. 본래 API는 지난 2020년 6월부터 사용할 수 있게 했다.

오는 2024년 1월에는 API가 새로운 모델을 사용하도록 업그레이드될 예정이다. 또 오픈AI의 ‘아다’, ‘배비지’(Vebage), ‘퀴리’, ‘다빈치 모델’은 ‘002 버전’으로 업그레이드되며, 다른 모델을 사용하는 채팅 작업은 ‘gpt-3.5-timeout-message’로 전환된다.

기존의 GPT-3.5기반의 챗GPT는 "21년 이전 정보밖에 없어, 정확히 알 수는 없지만, GPT-4 역시 대형언어모델"이라는 선에서 답변하고 있다.
기존의 GPT-3.5기반의 챗GPT는 "21년 이전 정보밖에 없어, 정확히 알 수는 없지만, GPT-4 역시 대형언어모델"이라는 선에서 답변하고 있다.

“그럼에도 역시 ‘환각’ 등 오류, 한계로 지적”

그러나 GPT-4도 한계가 있다. 예를 들어 GPT-4는 문장이 정확한지를 확인하지 않는다. 즉 텍스트와 이미지를 비논리적이거나 선동적으로 만들 수도 있다. 그러나 오픈AI는 이에 대해 “출력물을 가능한 한 유용하고 비즈니스에 적합하게 유지하기 위해 디지털 제어 장치와 휴먼 트레이너가 있다”고 강조하고 있다.

GPT-4는 또 GPT3.5 기반의 챗GPT처럼 이른바 ‘환각’(halluciation)을 유발하기도 한다. 즉, 시스템이 훈련된 바에 따른 확률을 기반으로 정보를 판단하므로, 순차적으로 의미를 매길 수는 있지만, 사실이 확인되거나 실제 사건과 직접 연결되지 않는 대답이 나올 수도 있다.

이에 오픈AI는 “모델이 생성하는 거짓의 수를 줄이기 위해 노력하고 있다.”고 한다.

또 GPT-4에 제공되는 사용자 기업들의 중요한 정보로 AI모델을 교육하거나, 외부 당사자에게 데이터를 노출하는지도 알 수 없다. 실제로 지난 4월 보고서에 따르면 오픈AI와 판매 계약을 맺은 마이크로소프트는 2023년 내에 일반 기업에 개인 챗GPT 사례를 제공할 계획이어서 이런 우려를 뒷받침하고 있다.

GPT-3.5와 마찬가지로 GPT-4 역시 2021년 9월 이후의 정보를 다루지 않고 있다는 점도 맹점이다. 이는 GPT-4의 라이벌이라고 할 수 있는 구글의 ‘바드(Bard)가 최신 정보를 공유하고 있는 것과는 대조적이다.

“GPT-3.5 또는 챗GPT보다는 더 정확”

오픈AI는 GPT-4가 훈련받은 모델의 크기를 밝히지 않고 있다. 다만 “챗GPT가 훈련받은 수십억 개의 매개 변수보다 ‘더 많은 데이터와 더 많은 연산’이라고만 한다. GPT-4는 또한 허위정보나 틀린 결과치를 포함한 더 다양한 자료를 작성해내고 있다.

그럼에도 GPT-4는 기왕의 GPT-3.5 기반의 챗GPT보다는 한층 성능이 우수하다. 주어진 프롬프트에 대한 답변이은 더 간결하고 구문 분석도 한층 빠르게 할 수 있다. 또한 GPT-4는 스케줄링 또는 요약과 같은 비즈니스 의사 결정을 내리는 데 있어 GPT-3.5보다 탁월하다.

오프AI는 또 “GPT-4는 허용되지 않는 콘텐츠에 대한 요청에 응답할 가능성이 (챗GPT보다) 82% 낮고, 사실에 입각한 응답을 생성할 가능성이 40% 더 높다.” 고 밝혔다.

특히 GPT-4는 이미지를 처리할 수 있다는 점에서 직전 모델들과 다르다. 현실 세계의 사물을 설명하거나 웹사이트의 가장 중요한 요소를 결정하고, 그것들을 설명하는 시각적인 기능이 탁월하다.

그래서 전문가들은 “GPT-4를 통해 제공되는 새로운 기능이 비즈니스에 적합한지 여부는 주로 사용 사례와 자연어 인공 지능으로 성공을 거두었는지 여부에 따라 결정된다”고 평가한다.

테크크런치는 이에 대해 “기능과 제한 사항을 검토하고 GPT-4가 시간을 절약하거나 비용을 절감할 수 있는 부분은 고려하되, 인간의 지식, 기술 및 상식으로부터 실질적으로 이익을 얻을 수 있는 작업이 무엇인지를 따져봐야 할 것”이라고 조언한다.

저작권자 © 애플경제 무단전재 및 재배포 금지