인간의 감성․이성과 흡사한 능력 갖춘 ‘인조인간’ 탄생?
1750억개 매개변수 갖춘 ‘GPT-3’ 대표적, 국내서도 R&D 박차
정부․공공기관, ‘초거대 인공지능 API’ 모델 시범 사업 펼쳐
‘미리 학습’으로 생성, 분석 파라미터 10억개 이상의 AI모델

[애플경제 이보영 기자]기존 AI의 기능과는 비교가 안되는, 이른바 ‘초거대(Hyperscale) 인공지능’ 기술도 점차 가속도를 내고 있다. 이는 대용량의 데이터를 딥러닝을 이용하여 학습하여 인간 수준의 언어처리 능력을 갖춘 차세대 인공지능이다. 별도의 학습 과정 없이도 공급자가 제공하는 API만을 이용하여 원하는 서비스를 사용 및 튜닝을 하여 서비스를 제공할 수도 있다. 최근엔 과학기술정보통신부와 정보통신산업진흥원이 ‘초거대 인공지능 API 시범 서비스 지원’의 대상 기업이나 기관을 모집하면서 이제 이는 국가 사업으로 승격되며, 새삼 관심을 끌고 있다.

애초 초거대 인공지능의 원조는 구글의 양방향 언어모델 버트(Bert, Bidirectional Encoder Representations from Transformers), 그리고 Open AI의 단방향 언어모델 GPT-3(Generative Pre-Training 3)를 꼽을 수 있다. 이는 인간이 물리적으로 처리할 수 없는 엄청난 데이터를 분석해 의미있는 결과값을 창출할 수 있다. 비약하면 사실상 인간과 거의 같은 ‘인조 인간’의 탄생이라고 해도 과언 아니다.

이는 기계적으로는 대용량을 빠르게 연산할 수 있는 기계다. 즉, 대규모 데이터를 학습해 마치 인간처럼 종합적, 자율적으로 사고하고, 학습, 판단, 행동하는 인간의 뇌 구조를 닮은 인공지능이다. ‘GPT-3’는 바로 그 대표적인 인공지능이다. 이는 테슬라의 일론 머스크가 설립한 오픈AI가 지난 2020년 발표한 것으로 방대한 데이터를 학습해 고차원적 추론 결과를 내놓을 수 있는 자연어처리 능력을 갖추고 있다.

이번에 정보통신산업진흥원이 시범 사업을 펼치고 있는 ‘초거대 인공지능 API’ 모델도 이와 유사하다. 즉, ‘미리 학습’(Pre-trained)을 통해 생성(Generative) 할 수 있는 인공지능이며, 분석 파라미터가 10억개가 넘는 사전학습 인공지능 모델이다. 이는 뇌 학습‧연산 기능을 담당하는 시냅스 역할을 하며 데이터를 계산해 결정되는 변수 파라미터 양을 크게 늘릴수록 분석‧예측 정확도 역시 비례해서 높아진다. 다만, 그 만큼의 고성능 컴퓨팅 연산자원을 소모하게 된다.

이는 2020년 오픈AI가 공표한 초거대 인공지능 GPT-3과 유사하다. 즉 딥러닝을 이용해 인간다운 텍스트를 만들어내는 자기회귀 언어 모델이다. 다만 GPT-3의 전체 버전은 1,750억개의 매개변수에 달한다는 점이 다르다. GPT-3는 그 덕분에 각종 언어 관련 문제 풀이, 랜덤 글짓기, 간단한 사칙연산, 번역, 주어진 문장에 따른 간단한 웹 코딩 등을 두루 해낼 수 있다.

일부 전문가들은 “인간의 뇌를 모방한 인공신경망 기술은 GPU의 빠른 연산 능력을 통해서 이젠 사람보다 더 정확히 고양이를 인식할 수 있게 되었다.”면서 “사람의 오류라고 할 수 있는 착시 현상도 없기에 정확도는 인간보다 높다”고 평가하기도 한다. 이는 엄청난 양의 빅데이터를 계산할 수 있는 GPU의 빠른 연산 능력과, 인공신경망 기술이 발달로 가능해진 것이다.

그러나 또 다른 전문가들은 초거대 인공지능의 한계와 위험성을 경고하고 있다. GPT-3의 경우 1,750억개의 매개변수로 인해 사전 학습에 필요한 비용과 시간이 너무나 방대하고 활용하기도 쉽지 않다. 사전학습을 시키는데도 천문학적 비용이 들어간다. 또 “입력값이 다르면 터무니 없는 결과를 도출할 수도 있는 위험이 있고, AI가 왜 그러한 결론에 도달했는지 이유를 알 수가 없는 경우도 많아서 무조건 AI에게 판단을 맡길 수는 없다”는 것이다.

더욱이 “데이터를 입력할 때부터 진실하고, 공정하며, 형평성 있는 것들을 엄정하게 선별해야 한다”면서 “인공지능을 사용할 때도 투명성과 개방성을 확보해야 하고, 인공지능이 무조건 공정하다는 편향을 가져서도 안된다.”고 경고하기도 한다.

그런 가운데 정보통신산업진흥원과 과학기술정보통신부가 이번에 시행하는 API 서비스는 초거대 인공지능 기술에 대한 국가적 지원이 본격화될 것이란 점에서 의미를 부여받고 있다. 이들 기관에 따르면 공급자가 제공하는 주요 초거대 인공지능 API 서비스는 감정분석과, 병원 진료 연결 등 두 가지로 분류된다.

지식백과형 만능박사 챗봇, 사용자 데이터 기반 커스텀 챗봇 등 ‘대화’ 기능과 자기소개서 기반 면접 질문 생성기, MBTI 백과사전 등과 같은 ‘질의 응답’, 영화 등의 줄거리를 요약하는 기능, 그리고 텍스트 생성 기능도 있다. 소설, 장면 묘사, 감성 마케팅 메시지, 자기소개서, 이메일, 보고서 등이 이에 해당된다. 또 맞춤법 교정, 상품명 교정, 문체변환(사투리, 사극톤, 캐릭터 말투 등) 등도 포함된다.

저작권자 © 애플경제 무단전재 및 재배포 금지