확률 기술, 강화학습, 신경망 모델링, 비선형 및 압축·생성 모델링
자율주행, AI자동화, AI로보틱스 등에 최적화된 제어기술로 등극
MLP, 딥Q-Net, 가우시안 프로세스, 오토인코더 등 ‘비선형 데이터 정량화’
[애플경제 전윤미 기자] 자율주행차량을 비롯한 자율주행기술과 AI로봇을 포함한 로보틱스, 각종 원격 디바이스 작동 등 오늘날의 모든 디지털트윈 아키텍처는 제어 기술, 특히 데이터 기반의 제어기술이 핵심요소다. 센서나 기기 등 전통적인 물리 기반 모델은 그 정확도나 각종 변수로 인해 완벽을 기할 수 없다. 이에 AI기술이 발달할수록 이를 접목한 데이터 기반 제어 방식과 기술에 관심이 집중되고 있다.
데이터 기반 제어기술은 복잡한 시스템의 작동을 효과적으로 모델링하고 제어하기 위한 첨단 기술이다. 혁신적인 접근 방식을 제공한다. 강창묵 한양대 부교수는 “기존의 물리 모델 기반 제어의 한계를 넘어 머신러닝과 확률적 기법을 바탕으로 정확한 제어시스템을 연구, 설계하고 있다.”고 최근의 관련 연구 동향을 설명했다.
즉, 머신러닝과 확률적 기법을 기반으로 한 응용 제어기술이 날로 발전하고 있다는 얘기다. 최근 이에 관한 연구보고서를 공개한 강 교수는 좀 더 구체적인 방법론을 제시했다. 그에 따르면 데이터 기반 제어 기술은 확률 기반 기술, 강화학습 기반 제어 기술, 신경망 기반 모델링, 비선형 시스템 모델링, 압축 및 생성 모델링 등이 있다. 아직은 어느 기술이 우위를 점하거나, 특별히 차별화된 장점을 인정받은 바는 없다. 단지 “각 기술은 고유한 장점을 바탕으로 빠르게 발전하고 있다”는 평가다.
통계학에 근거한 확률 기반 기술
좀더 구체적으로 보면 그 중 ‘확률 기반 기술’(Gaussian Process(GP)은 일명 ‘가우시안 프로세스’로 불리기도 한다. 통계학에서 정규 분포나 신호 처리, 이미지 처리, 열 방정식의 해 등에 사용되는 가우스 함수를 응용한 것이다. 이를 통해 비선형적이고 임의로운 데이터를 정형화 내지 정량화함으로써 제어 성능을 향상시키는 것이다.
‘가우시안 프로세스’는 이미 비선형의 임의로운 시스템의 동(動)역학을 모델링하는 강력한 도구로 자리 잡았다. 비선형이 입·출력 데이털을 탄력적으로 해석, 추정하며, 시스템의 동작을 예측함으로써 신뢰도를 높일 수 있다. 이에 “소규모 데이터셋을 갖고도 예측도의 정확성을 높이며, 특히 자율주행차량과 같은 복잡한 환경에서 도로 조건의 불확실성을 반영해 최적의 제어 기능을 설계할 수 있다”는 것이다.
스스로 추론, 응용 ‘강화학습’ 적용도
또 다른 데이터 기반의 제어 기술은 ‘강화학습’에 의한 것이다. 이는 학습을 뛰어넘어 스스로 데이터를 추론하는 등 환경과 상호작용하는 것이다. 그 때문에 “기존의 제어 원리를 뛰어넘는 혁신적인 패러다임을 제공한다.”는 평가도 따른다. 이는 특히 예측할 수 없는 변수가 많은 자율주행이나 로보틱스 등의 실행과정에서 유용하다. 그런 불확실한 환경 속에서도 유연하게 적절한 대처를 할 수 있다는 얘기다.
특히 강화학습을 적용한 대표적인 제어기술로는 ‘딥 Q-네트워크’(Deep Q-Network: DQN)와 ‘정책 경사(傾斜)법’(Policy Gradient Method)이 있다. 전자는 강화 학습과 심층 신경망을 대규모로 결합, 일부 슈퍼휴먼 수준의 과제를 해결할 수 있을 정도다. 심층 신경망을 사용한 Q-Learning이라는 고전적인 알고리즘과 경험 재현(experience replay)이라는 기법을 향상, 개발되었다. 후자는 기존의 규칙 기반 모델보다 적응력이 뛰어나며, 학습을 통해 복잡한 환경에서도 효과적인 의사결정을 수행할 수 있다는게 장점이다.
이를 통해 로봇 동작의 예측이나, 자율주행차량의 경로 최적화, 에너지 효율 개선 등에 다양하게 응용할 수 있다. 또한 “고차원 상태나 행동 공간에서도 효과적으로 학습할 수 있어, 데이터 기반 제어에서 가장 주목받는 기술 중 하나”라는 평가도 있다.
신경망으로 복잡한 동작 역학 예측
‘신경망 기반 모델링’도 유용한 데이터 기반 제어 기술이다. 특히 ‘신경망’은 복잡한 시스템 동역학을 학습하고 예측하는 데 중요한 역할을 한다. 이는 일종의 시계열 데이터 처리 및 차량 경로 예측 기술이라고 할 수도 있다.
이를 구성하는 기술 중 ‘다층 퍼셉트론’(MLP)이 있다. 이는 정적이고 비선형적인 시스템을 모델링하는 것에 효과적이다. 또 ‘순환 신경망’(RNN)니, ‘장단기 메모리’(LSTM), ‘게이트 순환 유닛’(GRU)과 같은 아키텍처는 시간적 의존성을 갖는 시계열 데이터를 처리하는데 유용하다.
특히, LSTM 모델은 자율주행차량의 경로 추적 및 횡방향 제어에 성공적으로 적용, 복잡한 환경에서도 높은 정확도를 보장하고 있다. 합성곱 신경망(CNN)도 신경망 기반 모델링의 구성 요소로서, 공간적 패턴을 분석하는데 유용하다. 또한 ‘트랜스포머’는 고차원 데이터에서 장기적인 의존성을 효율적으로 학습할 수 있다.
불가측적 비선형 시스템 모델링
‘비선형 시스템 모델링’도 데이터 기반 제어 기술의 하나다. 이는 ‘동적 모드 분해’(DMD), 쿱만 연산자(Koopman operator), 비선형 동역학의 희소 식별(SINDy), 저장소 컴퓨팅(reservoir computing) 등으로 작동한다.
그 중 DMD는 시공간 데이터를 분석, 시스템의 동역학을 선형적 가시화와 유사하게 분석한다. 쿱만 연산자(Koopman operator)는 역시 비선형적인 움직임을 고차원 공간에서 선형적으로 변환함으로써 제어 설계를 단순화한다. SINDy는 ‘희소 회귀’를 통해 시스템의 지배적인 방정식을 도출하는 방법이다. 즉 선형성이 희소 내지 적은 데이터를 두고, 독립변수와 종속변수 간에 선형적인 관계를 도출하는 것이다. 이를 통해 임의로운 변수 중에서도 하나 이상의 독립변수들이 종속변수에 미치는 영향을 분석함으로써 데이터를 효율적으로 분석할 수 있게 한다.
‘저장소 컴퓨팅’ 역시 효율적인 계산법이다. 이는 비교적 적은 량의 계산 자원으로도 복잡한 시스템의 작동원리를 효율적으로 학습할 수 있게 하는 것이다. 이는 “특히 자율주행차량의 안정성과 경로 추적 성능을 높이는데 크게 기여한다”는 설명이다.
데이터 분포, 판별 통한 압축·생성 모델링
‘압축 및 생성 모델링’도 데이터 기반 제어의 효율성을 극대화하는 중요한 기술로 꼽힌다. 이는 오토인코더(autoencoder), 변분 오토인코더(VAE), 생성적 적대 신경망(GAN)을 원리로 한다.
우선 오토인코더는 최소한의 데이터만으로도 충분한 정보를 획득할 수 있게 한다. VAE는 딥러닝 기술의 일종이자 생성모델의 한 종류다. 즉, 주어진 데이터를 바탕으로 데이터의 분포를 학습하고, 이를 바탕으로 새로운 데이터를 생성하는 모델이다. 이는 “잠재된 공간의 확률 분포를 학습, 불확실성을 해소하고 정량화할 수 있게 한다”는 설명이다.
이 외에도 ‘생성적 적대 신경망(GAN)’도 압축·생성 모델링의 일종이다. 이는 진짜 같은 가짜를 생성하는 모델과, 이에 대한 진위를 판별하는 모델의 경쟁을 이미지 등을 만들어낸다. 인간이 정제한 데이터를 바탕으로 학습하는 지도 학습 방식에서 벗어나 스스로 답을 찾는 비지도학습 방식이다. 이는 새로운 데이터를 생성함으로써 데이터 부족 문제를 해결하고 모델 학습을 강화하는 것이다.
