한국지능정보사회진흥원, '연합학습․민주화학습으로 네트워킹 구축' 인사이트 발표 ‘관심’

‘연합학습(federated learning)’과 ‘민주화학습(democratized learning)’을 바탕으로 엣지 시대에 걸맞은 AI학습 구조 기반의 ‘분산학습’ 시스템 네트워킹을 구축, 강화해야 한다는 이론이 최근 공개되어 눈길을 끈다.

한국지능정보사회진흥원이 기획한 ‘AI Network Lab 인사이트’에서 홍충선 경희대 교수는 엣지 컴퓨팅에 활용할 수 있는 AI구조를 제시하고 연합학습이나 민주화 학습과 같은 분산 머신러닝 프레임워크의 핵심 구성 요소를 규명하고 있다.

(제공=씨피프티원)
(제공=씨피프티원)

‘엣지 컴퓨팅을 위한 분산 AI학습 구조 : 연합 학습과 민주화 학습을 중심으로’라는 인사이트 제목처럼 이는 연합학습과 민주화학습이란 개념으로 AI구조의 분산학습을 설명하고 있다는 점에서 독창적인 이론 전개라는 평가다. 이를 통해 분산학습 구조를 엣지 컴퓨팅 환경에 어떻게 내재화 할 수 있을 것인가 하는 것이 해당 인사이트의 결론이기도 하다.

홍 교수에 따르면 우선 연합학습은 분산학습과도 다르다. 기존의 분산 접근 방식은 일단 로컬 데이터를 수집하고 로컬에서 학습 모델을 훈련하고 학습 매개변수를 서버로 전송한다. 그러면 서버가 수신한 각 클라이언트 노드의 학습 매개변수를 이용하여 파라미터 서버가 글로벌 모델을 도출한다. 이 글로벌 모델이 각 클라이언트에 전송되지 않는다는 점에서 연합학습 모델과 다르다는 설명이다.

즉 연합 학습은 클라이언트라고 하는 다수의 디바이스 스스로 기계학습모델을 반복 훈련하고 그 결과를 협력적으로 통합하는 분산기계학습 접근법이다. 다시 말해 일단 글로벌 학습모델을 구축하기 위해 로컬 모델을 중앙 서버(파라미터 서버)가 통합하되, 학습에 참여하는 다수의 모바일 기기가 온-디바이스 학습을 통해 학습된 로컬모델을 공유하는 분산 학습 프레임워크다.

이때 중앙 서버는 반복적으로 학습된 모델의 평균을 사용하여 각 디바이스의 확률적 경사값(stocasitc gradient)을 통합하는 ‘Federated Averaging’(FedAvg, 연합평균) 학습 알고리즘이 사용된다. 즉 연합학습 구조는 하나의 중앙 서버와 클라이언트 집합으로 구성되며, 각 클라이언트는 고유한 로컬 데이터셋을 가지고 있는 형태다.

연합학습은 특히 학습에 참여하기 위한 클라이언트 집합이 선택되고, 로컬 학습을 위하여 중앙 서버로부터 글로벌 모델의 가중치(Weight) 정보가 공유된다는 점이 특징이다.

글로벌 모델의 가중치가 공유되면 각 클라이언트는 자체 CPU 및 에너지 자원을 사용하여 공유 매개변수를 기반으로 로컬 데이터셋에서 로컬 모델 학습을 수행한다. 그 다음 각 클라이언트는 로컬 데이터셋으로 학습된 로컬 모델의 가중치를 파라미터 서버로 전송하고, 파라미터 서버는 현재의 글로벌 모델과 로컬 모델 업데이트를 통합하여 새로운 글로벌 모델을 생성하는 것이다. 말 그대로 ‘연합’한 학습에 의한 모델이다.

이같은 연합학습 프로세스는 글로벌 모델이 목표하는 정확도를 갖출 때까지 파라미터 서버와 클라이언트들 간에 수 차례 학습된 모델을 반복(communications rounds) 전송하게 된다.

그런 점에서 홍 교수는 “연합 학습 시나리오는 일단 ‘로컬 모델 업데이트’와 ‘글로벌 모델 통합’이라는 두 가지 주요 단계로 요약할 수 있다”고 밝혔다. ‘로컬 모델 업데이트’ 단계는 로컬 데이터에 대한 ‘기본 손실 함수’(loss function)를 최소화하기 위해, 클라이언트 장치에 의한 ‘경사하강’(gradient descent)을 계산하는 과정을 말한다.

모델을 위해 계산된 가중치의 한계오류값을 추정, 산입하는 것으로 이해되는 대목이다. 반면에 ‘글로벌 통합(global aggregation)’은 서버가 서로 다른 클라이언트 장치로부터 업데이트된 모델 매개 변수를 수집하는 것이다. 수집된 매개 변수를 다시 통합한 다음 클라이언트로 다시 보내게 되는 것이다.

연합학습과 함께 분산구조 네트워킹의 양대 요소로 꼽히는게 민주화 학습 시스템이다. 홍 교수는 이에 대해 “우리 사회의 의견 수렴 모델에 기반한 민주화 학습 (Democratized AI: Dem-AI) 구조”라면서 세 가지의 하위 학습 메커니즘을 제시했다. 즉 병합 군집 (Agglomerative Clustering), 계층적 일반화(Hierachical Generalization), 개인화(Personalized)된 학습 메커니즘 등이다. 이를 기반으로 하는 자율 조직화 계층구조 메커니즘으로 구성된 새로운 분산 학습 접근 방식이 곧 민주화 학습 시스템의 역할이라는 설명이다.

홍 교수에 따르면 연합학습과는 달리, 민주화 학습 혹은 민주화 AI 학습(Democritized AI: Dem-AI)은 다시 계층 구조의 세 가지 요소로 구성된다. 생물학적 지능의 일반화(generalization) 및 전문화(specialization)능력, 대규모 학습 시스템에서 복잡한 과제를 해결하기 위한 사회 및 집단 지성 시스템의 계층 구조가 그것이다.

이를 바탕으로 한 분산학습 프레임워크가 민주화 학습이다. 다시 말해 민주화 머신러닝 구조라고 할 수도 있다.

이는 계층구조를 갖는 분산학습시스템으로 최대한 많은 클라이언트가 참여하여 채택한 학습모델이 상대적으로 적은 수의 클라이언트가 참여하여 도출된 학습모델보다 더 좋은 학습 성능을 갖는다는 것이다. 그야말로 민주화 사회에서 채택하고 있는 다수결의 원칙을 준용하여 계층적으로 구성한 구조와도 흡사하다.

홍 교수는 그러나 “연합학습과 민주화학습 기반의 분산학습 네트워킹을 완수하기 위해선 해결해야 할 기술적 과제도 많다”고 지적하면서 “데이터 확대, 능동학습, 멀티태스크 학습, 전이 학습, 매개변수 조정, 지식증류, 가중치 최적화, 데이터압축, 신뢰 및 평판, 다중 목적 최적화, 강화 학습 등”을 예로 들었다.

이런 기술적 현안들을 해결함과 동시에 “분산학습 구조를 엣지 컴퓨팅 환경에 내재화함으로써 효율적인 미래 인터넷 솔루션을 설계하는 것이 궁극의 목표”라고 강조했다.

저작권자 © 애플경제 무단전재 및 재배포 금지