전자통신연구원 등 ‘인공지능․센서 이용, 디지털 3D 휴먼 기술’ 개발
“아직 어색함 존재…텔레프레즌스는 복셀 캡처 데이터 전송, 재생 수준”
실사학습데이터 반영된 빛의 효과 활용한 ‘뉴럴렌더링’으로 가시화가 핵심
[애플경제 이보영 기자] “‘디지털 휴먼’이 언제쯤 현실화될까”. 이런 궁금증은 ICT기술에 대한 나름의 인식을 가진 사람이라면 누구나 한번쯤 가져볼만한 것이다. 전문가들에 따르면 이미 디지털 휴먼 기술은 멀지 않아 현실화가 가능할 만큼 상당 부분 진척되고 있는 것으로 전해지고 있다.
국내의 경우 한국전자통신연구원(ETRI)이나 한국전자기술연구원(KETI) 등의 연구소에서 인공지능 및 센서 등을 이용한 디지털 3D 휴먼 기술을 개발하였고, 일부 민간업체에서도 키넥트 기반의 디지털 휴먼 생성과 전송 기술을 개발한 바 있다.
이승욱 한국전자통신연구원 책임연구원은 “CG 기술로 생성된 모델은 정적일 때는 실감성이 있으나, 애니메이션으로 구동할 때는 아직은 어색함이 존재한다”면서 “텔레프레즌스의 경우 복셀 형태로 캡처된 데이터를 그대로 전송, 재생하는 수준”이라고 짚었다. 이승욱 연구원은 특히 ‘디지털 휴먼’ 기술의 현주소와 전망에 대해 매우 상세한 분석을 가한 연구보고서를 최근 공개해 관심을 끈다. 한국정보통신기획평가원에 기고한 해당 보고서는 복잡한 디지털 휴먼 기술의 현실을 대중적으로 이해하기 쉽게 풀이하고 있다는 평가다.
이에 따르면 디지털 휴먼 기술은 최종적으론 미세 표정이나 감성 표현이 가능한 생성 SW가 관건이다. 즉, 동적 환경을 분석하여 반영함으로써 실감나는 디지털 휴먼을 제어하는 기술이다. 또 “미세 표정이나 감성 표현이 가능한 실시간의 임의로운 시점에 가시화할 수 있는 기술과, 저품질 저해상도 렌더링 비디오를 실감나는 고해상도 비디오로 변환하는 기술이 핵심”이라고 했다. 이를 바탕으로 실시간의 지원을 위한 네트워크 경량화 모델도 중요하다.
이는 또 같은 카메라로 다양한 감성을 표현할 수 있는 고정밀 디지털 휴먼 생성 기술이 뒷받침되어야 한다. 즉, 동적 환경에서 실시간으로 감성을 인지하고, 1인칭 얼굴 표정을 인식 할 수 있는 기능이 그것이다. 또 “디지털 휴먼을 실시간으로 실감나게 표현하고, 그 감성이나 스타일을 변환할 수 있어야 하며, 나아가선 그 완성품에 대한 품질 평가의 표준이나 디지털 휴먼 서비스 플랫폼의 상용화가 이뤄져야 할 것”이라는 얘기다.
이 연구원에 따르면 완성단계에 이르기 위해선 3차원 자체 추정 오차가 45mm, 감정 인식 성능은 92% 수준에 도달해야 한다. 또 실감 가시화 속도는 30fps, ‘사용자 속임 비율’은 75%, ‘실감 가시화 시점’은 자유 시점을 구현해야 한다. 사람의 시선은 초당 15개 이상의 프레임이(15fps) 바뀔 때 이를 연속된 영상으로 인식한다. 그러므로 30fps는 매우 높은 해상도라고 할 수 있다.
또 다른 핵심 기술은 단일 카메라를 통한 가시성과 기능성이다. 전자는 학습 데이터 특징을 활용하고, 후자는 템플릿 모델을 활용하는 것이다. 이를 극대화하는 것이 필수적이란 지적이다. 디지털화된 3D 디지털 휴먼 모델 생성기술도 완성품을 위한 중요한 요소다. 즉, 표정이나 동작, 음성 등을 한꺼번에 인식함으로써 사용자와의 실시간 실감 인터랙션이 가능하게 한다. 즉, 보는 이가 진짜 사람과 착각하게 만들 만큼 정교한 수준에 도달하는 것이다.
뉴럴렌더링 기반 가시화 기술도 중요하다. 이는 실사된 대상에 대한 학습 데이터를 통해 반영된 모든 빛의 효과를 활용하는 것이다. 이승욱 연구원은 보고서에서 “즉, 기존의 제작 파이프라인과 호환되고, 실감 가시화에 대한 새로운 패러다임을 제시하는 것”이라며 “또 디지털 휴먼의 시각적 정체성 유지를 위해 동일 인물에 대한 얼굴 인식 신경망의 임베딩 사이의 거리를 (선명한 실감효과를 반감시키는) 손실 함수에 반영해야 한다”고 설명했다.
한편 이 연구원에 따르면 해외에선 디즈니, USC 등에서 3D 휴먼 모델 생성을 위한 시스템의 복잡도를 감소시키는 연구가 활발히 진행 중이다. 그러나 아직 비용과 시간이 소요되어 그 진척도가 느린 편이라는 얘기다. 그래서 “산업적 활용성을 높이기 위해선 고품질의 인체
모델을 적은 비용으로 손쉽고 빠르게 자동 생성할 수 있는 기술이 필요하다“는 지적이다.
