대용량 한국어․12개 언어 ‘병렬 말뭉치’ 구축, 언어음성 데이터 기반

(사진=어도비스톡)
(사진=어도비스톡)

[애플경제 김미옥 기자] 음성인식기 기술과 신경망 기반 자동번역기를 적용한 ‘한국어-12개 언어 자동통역기술’이 개발되었다. 한국어-12개 언어 자동통역기술은 심층신경망(Deep Neural Network) 기반 심층학습(Deep Learning) 기술의 고도화와, 대용량 언어음성 데이터에 기반하여 실현되는 고난이도 융복합 기술이다.

이는 한국어와 영어, 중국어, 일본어, 스페인어, 프랑스어, 독일어, 러시아어, 아랍어, 베트남어, 태국어, 인도네시아어, 말레이어간의 자동통역이 가능하도록 했다.

한국전자통신연구원 초지능창의연구소 지능정보연구본부 복합지능연구실이 개발한 이 기술은 ‘음성인식’의 경우 한국어 및 12개 언어를 쓰는 각국 사람들의 다국어 발성을 수집, 가공해 종단형 음성인식기의 훈련 리소스로 사용했다. 또 대용량의 한국어와 12개 언어의 ‘병렬 말뭉치’를 구축, 신경망 기반 자동 번역기의 훈련 리소스로 사용했다. “이 둘을 결합해 우수한 성능의 한국어-12개 언어 자동통역기술을 완성했다”는 설명이다.

한국어-12개 언어 자동통역기술의 기반 기술 중 ‘한국어 및 12개 언어 음성인식기술’의 경우 음향모델과 언어모델, 발음사전 등을 별도로 학습하는 기존의 음성인식 모델을 종단형(End-to-End) 방식으로 통합 학습하도록 개선했다. 이를 통해 음성인식 성능을 대폭 향상시켰다는 설명이다.

‘한국어-12개 언어 자동통역 기술’의 기반이 되는 ‘한국어 및 다국어 음성인식 기술’은 AI 컨택센터, 자동통역 서비스, 회의록 녹취, AI스피커, 의료, 언어 교육 등 다양한 분야에서 많은 실증과 검증을 거친 바 있다. 자동번역기술의 경우도 ‘2018 평창동계올림픽’ 자동통역서비스를 비롯, 외국어 기반 AI 스피커 서비스 등에서 ‘대화체 자동번역 서비스’ 실증과 검증을 수행한 바 있다.

연구원은 “최근 ‘코로나19’ 해제 이후 종전보다 더 많은 외국인이 방한하고, 내국인의 해외 출국이 급증하는 추세 속에서 다국어 자동통역 서비스의 확산 가능성은 매우 높다”고 기술 개발의 취지를 밝혔다.

이는 “구글, 페이스북, 마이크로소프트, 아마존 등을 필두로 한 글로벌 빅테크의 기술이 국내 자동통역 시장을 선점하기 이전에 기업에 기술을 이전해 국내 기술경쟁력을 강화하고 향후에는 국외시장까지 진출하는 것을 목적으로 한다”는 설명이다.

‘한국어-12개 언어 자동통역기술’은 일단 기업들이 대용량의 한국어 및 다국어 음성 DB 및 한국어-12개 언어 병렬 말뭉치를 근간으로 미리 훈련된 음성인식 및 자동번역 모델을 이전 받도록 한다. 이를 통해 별도의 DB나 훈련 과정 없이 각 언어별로 높은 성능의 베이스라인의 자동통역 시스템을 구현할 수 있다.

또 이를 구성하는 음성인식 기술의 경우 기존의 언어모델, 음향모델, 발음사전 등을 별도로 학습하는 방식에서 벗어나 종단형으로 통합 학습한 것이다. 자동번역기술 역시 신경망 기반으로 학습되어 높은 정밀도의 자동통역 결과를 제공할 수 있다.

이를 위해 자동통역 기술에 적용된 도메인의 음성DB 및 병렬 말뭉치를 기반으로 적응학습 등을 할 수 있게 했다. 덕분에 음성인식 및 자동번역 성능을 높일 수도 있다. 자동통역기술에 적용되는 음성인식 기술의 경우 ‘Contextual-ASR(Phrase Hint)’기능을 지원, 도메인 튜닝이 용이하도록 한 점도 특징이다.

저작권자 © 애플경제 무단전재 및 재배포 금지