연산기술‧빅데이터‧장단기 기억 네트워크 등부터 잘못된 학습 과정

최근 한 국내 IT업체가 여성을 모델로 만든 인공지능 챗봇 ‘이루다’가 성희롱 논란에 휩싸이거나 성소수자를 혐오하는 언동을 재현하면서 사회 문제가 되고 있다.

이는 또 도덕률 학습이 덜 된 인공지능의 상용화에 대한 논란을 불러 일으키고 있다. 결국은 개발자의 잘못이 크며 그런 오류로부터 인공지능은 아예 인간의 통제를 벗어나 스스로 돌발행동을 하며 학습할 수도 있다는 우려도 낳고 있다.

이를 막기 위해선 인공지능 개발과 학습 과정에서 동원되는 기술이나 프로세싱에서부터 오류의 소지를 없애야 한다는 지적이다.

 

AI, 사람의 두뇌 연산 수행 모방‧개발

최근엔 그래서 AI 개발과 학습 과정에서 동원되는 신경망기술 등에 새삼 관심이 쏠리고 있다. 퍼셉트론, 활성함수 등의 연산기술, 빅데이터와 장단기 기억 네트워크 등에서부터 잘못된 정보나 학습 과정 등을 차단해야 한다는 지적이다.

애초 인공지능은 ‘사람의 두뇌’가 복잡한 연산을 수행하는 것을 모방해 뉴런과 유사하게 연결한 퍼셉트론을 이용해 연산 로직을 처리하는 방식으로 개발된다. 이때 퍼셉트론은 인간의 뉴런을 수학적으로 모방한 알고리즘을 의미한다. 인공지능을 구현하기 위해서는 퍼셉트론을 이용해 입력 값에 가중치를 부여하고 활성함수를 거쳐 ‘1’ 또는 ‘0’을 출력하는 과정을 반복한다. 이에 적용되는 활성함수는 특정 시점에서 값이 증가하는 함수로 연산이 쉽고 미분이 간편하다.

 

MLP 이용, 분석 로직과 인공신경망 모델링

한편 퍼셉트론을 중첩한 다층(Multi-Layer) 퍼셉트론(MLP)은 복잡한 방정식을 표현할 수 있기 때문에 MLP를 이용해 분석 로직과 인공신경망을 모델링하고 있다. 인공신경망은 기계학습에서 신경망과 유사한 형태로 학습하는 통계학적 학습 알고리즘이다.

즉 인공지능을 고도화하고 복잡한 기계학습을 수행하기 위해 MLP의 층을 늘리고 고성능 컴퓨터를 활용하며 데이터 추상화와 빅데이터 분석 기술을 활용하는 것이 필요하다. 특히 데이터 추상화와 빅데이터 분석 단계에서부터 잘못되거나 편견에 휩싸이기 좋은 정보나 학습을 경계해야 한다는게 전문가들의 경고다.

데이터 추상화는 복잡하고 많은 데이터에서 핵심적인 내용과 기능을 요약하는 작업이다. 인공지능이 무기로 삼는 정보 집적의 핵심기술이라고 할 수 있다. 또 데이터 추상화는 MLP의 다층화와 함께 인공지능을 고도화하는 중요 기술이다.

즉 다층 퍼셉트론 다층화와 데이터 추상화가 얼마나 도덕적이고 정당한 정보로 이뤄지느냐에 따라 인공지능의 오류나, 비도덕적, 반사회적 행태의 출몰 여부가 결정된다고 해도 과언이 아니다. 이런 데이터 추상화 과정에서 편견을 갖기 쉬운 왜곡된 데이터가 입력되거나, 학습될 경우 ‘이루다’와 같은 부작용이 생기기 쉽다.

특히 다층 퍼센트론(MLP)은 단기 기억 네트워크(LSTM)와 함께 데이터 추상화의 정확도나 품질을 가름하는 정보 처리와 기계학습의 핵심 기술이다. MLP는 다층화될수록 그 연산량이 급증하므로 데이터의 추상화를 통해 MLP를 연산량이 적은 단층 퍼셉트론의 조합으로 구현할 필요가 있다는게 전문가들의 얘기다. MLP를 다층화하여 2개 이상의 은닉층으로 구성될 때 이를 심층신경망(Deep Neural Network; DNN)이라고 한다. 데이터의 추상화를 위한 알고리즘이 발전하면서, 인간 뉴런의 뎁스(Depth, 약 15층 수준)보다 뛰어난 100층 이상의 인공신경망이 구현되기도 했다.

 

데이터 추상화에 의해 인공지능 품질 좌우

데이터를 어떻게 추상화하느냐가 곧 정상적이고 건강한 인공지능 개발 여부를 좌우한다. 이는 영상이나 이미지 분석에 활용되는 합성곱 알고리즘과 자연어 처리에 활용되는 순환신경망 및 장단기 기억 네트워크 알고리즘이 핵심 수단이다.

합성곱 알고리즘은 입력된 이미지를 합성곱 필터를 통과시켜 특징을 추출하고 활성함수에 대입한 뒤 결과를 결합하는 알고리즘이다. 이때 필터링이란 사전에 정의한 특징이 입력 데이터에 있는지 없는지를 검출하는 단계로 각기 다른 특징을 추출하는 필터를 조합하고 활성함수에 대입하여 정보의 성격이나 특징을 판별한다. 즉 정보가 얼마나 합리적인지, 혹은 유용한지 등을 나름대로 판별하는 것이다.

순환신경망은 기준 시점과 다음 시점에 네트워크를 연결하여 시간에 따라 변화하는 데이터를 학습하는데 사용된다. 이는 그러나 시점간 간격이 크면 데이터간의 연관성이 작아져 상호 연관성이나 정확도가 떨어진다.

순환신경망은 자연어처리에 적합한 알고리즘이다. 흔히 한 가지 언어는 그 직전에 사용한 문장이나 단어와의 연관성이 큰 법이다. 순환신경망은 이런 특성을 이용해 과거에 사용한 문장을 이용하여 정보를 처리하는 알고리즘임이다. 예를 들어 자칫 오용될 경우 성소수자나 여성, 유색인종 등의 단어가 갖는 선입견을 심어줄 수도 있는 것이다.

 

인간의 뇌 기능을 AI에 심어줘

이런 정보 오류 여부가 판가름나는 장단기 기억 네트워크는 본래 순환신경망의 장기의존성 학습 능력이 떨어지는 점을 개선하기 위해 개발된 것이다. 이는 장기간의 정보를 기억하는 것이 핵심이다.

모든 순환신경망은 사슬 형태로 반복되는 신경망 모듈을 포함하는데 장단기 기억 네트워크는 모듈에 하나의 신경망층 대신 상호 작용하는 3개의 계층을 구성하는 것이 특징이다. 그래서 장단기 기억 네트워크는 게이트(Gate)라 불리는 구조를 이용해 정보의 취득, 새로운 정보의 저장, 셀 상태의 갱신, 출력값 결정 등 셀의 상태로 정보를 저장하는 것이다. 말하자면 인간의 뇌와 같은 기능을 인공지능에게 심어준 것이다.

저작권자 © 애플경제 무단전재 및 재배포 금지