토종 ‘한국어 AI’, 외국산 AI솔루션에 맞선다

카이스트, 전자통신연구원, 솔트룩스(주) 등 ‘엑소브레인’ 프로젝트 성과 지난 10년 간 연구 마무리, “한국어 AI 생태계 정착, 외산 시장 잠심 막아”

2023-03-30     이보영 기자
국내의 기업의 데이터라벨링 개념도로서, 본문 기사와 직접 관련은 없음.

[애플경제 이보영 기자] GPT-4, 바드 등과 같은 초대형 생성AI가 충격을 주고있는 가운데, 국내에서도 이미 한국어 기반의 대규모 자연언어 기반(LLM)의 AI기술이 상당한 발전을 거듭해오고 있는 것으로 전해졌다.

국내 연구진의 한국형 인공지능 연구개발사업이 우리나라 인공지능(AI) 생태계를 활성화하고 한국어 AI 정착을 크게 앞당겼다는 평가다.

KAIST, 한국전자통신연구원, 그리고 민간업체인 솔트룩스는 지난 2013년부터 10년 간 산 한국어 AI 프로젝트인 ‘엑소브레인’을 개발하며, 상당한 성과를 거두었다. 이들 기관에 따르면 ‘엑소프레인’은 3개 세부과제로 분류되어 진행되었다.

엑소브레인 연구진에 의하면 이는 자연어 질문에 대해 검색된 문서에서 정답을 찾아주는 심층 질의응답 기술을 비롯해, 한국어 언어분석 기술, 딥러닝 언어모델 기반 응용 기술, 지식베이스 기반 추론 기술 등 “세계 최고 수준의 한국어 인공지능 기술”이란 설명이다.

연구진은 현재까지 18여 종의 한국어 언어처리 기술, 14종의 한국어 학습데이터, 2종의 한국어 언어모델을 공개했다.

KAIST와 한국전자통신연구원은 30일 별도 자료를 통해 “‘엑소브레인’은 일반인의 사용이 용이하고 범용성이 좋은 ChatGPT와는 다르다”면서 “법률, 금융과 같이 특정한 도메인에 특화된 자연어 기반 설명(정답)과, 그 설명의 신뢰성 있는 근거를 같이 제시함으로써 차별화된 결과를 보여줄 수 있을 것”으로 기대하고 있다.

이미 지난 2017년부터 한국전자통신연구원은 그 동안 개발된 언어지능 기술과 기계학습 데이터를 오픈 API‧데이터 서비스 포털(http://aiopen.etri.re.kr)을 통해 보급했다. “이는 외국산 AI 솔루션의 시장잠식을 방지하고, 세계적인 인공지능 선도국으로 거듭나고 있음을 보여주는 사례”라고 했다.

한국전자통신연구원(ETRI)은 ▲국내·외 논문 490편 ▲국내·외 특허출원 362건 ▲기술이전 85억원, 사업화 133억원 ▲코스닥 상장 2개 업체 등 큰 성과로 한국형 인공지능 ‘엑소브레인’ 사업이 우리나라 국산 인공지능 생태계 조성에 크게 기여했다고 밝혔다.

또 2016년 11월에는 인간 퀴즈왕들과의 장학퀴즈 <대결! 엑소브레인> 대결에서 우승함으로써 국산 초대형 AI의 성능을 대외적으로 입증한 바 있다.

'2022 국제인공지능대전'에서 한 IT업체가 자체 개발한 AI솔루션 융합기술을 게시, 안내하고 있다.

현재까지 공개된 데이터는 2022년 말 기준, 2,349개 기관에서 6천 1백만 건 이상 사용되었다. 2019년에는 구글이 개발한 언어모델 버트(BERT)에 비해 오히려 그 성능이 4.5%나 뛰어난 한국어 언어모델 코버트(KorBERT)를 개발해 국내 최초로 공개하기도 했다.

엑소브레인 연구진은 이처럼 지난 10년간 노력의 결과로 193건의 기술이전을 통해 기술료와 상용화 수익을 올린 것으로 알려졌다. 특히 “구글·IBM 등과 같은 외국산 AI 솔루션의 국내시장 잠식을 막는데 크게 기여했다.”고 자평했다.

한국전자통신연구원은 “엑소브레인 사업은 이외에도 언어지능 데이터 및 기술과 관련된 표준화와 다수의 특허, 논문 제출 등을 통해 원천기술 확보에 노력했다”면서 “지난해 4월부터는 엑소브레인 사업의 후속 과제로 자연어처리 기술에 ‘설명성’을 확장해 다양한 분야 전문가의 의사결정을 지원할 수 있는 ‘인공지능 SW’ 개발, 연구를 진행 중”이라고 전했다.