‘표현학습’, ‘머신러닝’, ‘신경망 원리’ 등 난해한 원리로 구성
서울대 이원종 교수, 유튜브로 “알기 쉬운 딥러닝” 강의 눈길
전문가들 “AI자동화, VR․AR․XR, 메타버스 기술 등의 원천기술”
[애플경제 진석원 기자] 딥러닝은 어떤 원리일까. 이는 AI기술의 작동 원리임에도 불구하고, 아직도 그 개념조차 낯설어하는 사람들이 많다. 최근 서울대학교 이원종 교수가 컴퓨터나 AI 전문가가 아닌, 평범한 일반인들도 이해하기 쉬운 언어로 자신의 유튜브를 통해 소개하고 있어 관심을 끈다. 그중에서 특히 핵심기술인 ‘표현학습’과 ‘머신러닝’의 뜻과 개념, 원리를 알기쉽게 들려주고 있다.
그에 따르면 표현학습이란 입력된 정보에서 정리된 정보를 추출하는 과정을 말한다. 이러한 표현학습은 딥러닝 기술의 핵심이다. 딥러닝을 거치면 데이터가 변형되어 입력된 것과는 확연히 다른 방식으로 표현이 되면서 활용이 쉬워지는 것이다.
쉽게 말해 딥러닝은 컴퓨터가 사람처럼 생각하고 학습할 수 있도록 하는 인공지능 기술이다. 머신러닝의 분야 중 하나로 이해된다. 여기서 다시 머신러닝이란 무엇인가. 이는 컴퓨터의 학습에 필요한 데이터를 수동으로 제공받는 기술을 말한다. 반면에 딥러닝은 사람이 학습할 데이터를 입력하지 않아도 컴퓨터 스스로 학습하고 예측하는 것이다. 인간의 사고방식과 유사한 패턴을 지니고 있으며, 이러한 모델은 인간의 신경망을 본떠 발전했다. 머신러닝보다 한층 차원이 높은 인공두뇌인 셈이다.
딥러닝 기술이 발달하기 이전에는 인간이 대상의 특징을 일일이 추출해서 기계에게 학습시켜야 했다. 예를 들어 고양이 사진이 있다고 했을 때 “귀는 뾰족하고, 몸이 털로 덮혀있다”는 등 사람이 미리 습득한 정보를 기계에 하나하나씩 입력하는 방식이다. 그러나 딥러닝 기술은 다르다. 스스로 사진 속에서 중요한 특징을 자동으로 추출해낸다.
딥러닝 이전(의 머신러닝 시절)에는 각 분야에서 전문가의 역할이 중요했다. 학문간 장벽이 높고 인간이 추출한 데이터 특징은 데이터가 바뀌면 새로운 수작업이 필요하곤 했다. 그러나 딥러닝 기술이 발달한 이후에는 전문가의 수작업이 주를 이루던 데이터 추출 작업이나 마이닝(분류와 분석) 분야에서 알고리즘이 스스로 작동하며, 중요한 특징을 거의 완벽에 가깝게 정리해 주기 시작했다.
이 교수는 이처럼 딥러닝에 대해 쉽게 설명하며 일반의 이해를 도왔지만, 실상 딥러닝의 작동 방식이나 응용분야는 매우 복잡하면서도 다양하다. 또 다른 전문가들은 “이러한 딥러닝은 음성 인식, 사물 인식, 언어 번역, 의료 산업, 로봇&자율주행 등 매우 다양한 분야에서 활용되고 있다.”고 그 범용성을 강조하고 있다.
딥러닝은 이제 디지털 시대를 사는 생활인에게 필수 불가결한 도구로 부상하고 있다. 실제 우리 주변에서 몇 가지 사례만 봐도 이를 실감할 수 있다. 대표적으로 스마트폰 등 여러 전자 기기의 음성 인식 시스템은 이제 우리 일상에서 가장 쉽게 접할 수 있는 기술이다. 시리, 빅스비 등 인공지능 비서의 음성 인식 성능은 몇 년간 눈에 띄는 발전을 보였다. 음성만으로 문자메시지를 전송하거나 확인할 수 있고, 원하는 장소로 길을 안내해 주기도 한다. 구체적인 날짜나 시간, 날씨를 물어보기도 하고 음식 주문도 음성인식을 통해 할 수 있다.
컴퓨터가 자동으로 사진을 분류하는 것도 이미 우리에게 낯익은 것이다. 스마트폰 사진첩에 저장된 사진을 시간과 장소, 함께한 사람 등에 따라 자동으로 분류하거나 사진 속의 인물, 물건 등 모든 구성요소에 대해 설명한다. 자동차 번호판을 인식하거나 ‘하늘은 파란색, 잔디는 초록색을 띤다’는 것을 스스로 학습하여 흑백사진을 컬러사진으로 바꿔주기도 한다.
구글번역기나, 네이버 파파고 등 번역 시스템도 딥러닝을 활용한다. 딥러닝을 통해 컴퓨터는 수많은 언어 패턴을 분석하고 학습하며, 언어를 번역해주거나 사람이 이해하기 어려운 문자 패턴을 해석한다. 번역 시스템의 성능도 눈에 띄는 성장을 보이고 있어, 조만간 기계번역이 사람의 번역 능력을 완전히 대체할 것이라는 전망도 있다.
특히 최근 딥러닝 기술이 꽃을 피우는 대표적인 분야 중 하나는 자율 주행이다. 자율주행차는 안전한 주행을 위해 정확한 주변 환경 인식능력과 판단 능력, 제어능력이 필수적이다. 자동차는 도로를 주행하며 다양한 센서를 통해 빅데이터를 형성하고 그 데이터는 클라우드로 공유된다. 이는 자율주행차의 딥러닝 학습에 활용된다.
로보틱스도 앞서 언급된 모든 기술들이 접목되는 분야다. 스스로 학습하는 능력, 음성과 사물을 인식하는 능력, 인지된 정보를 바탕으로 스스로 판단하고 제어하는 능력 등 각종 인공지능 기술의 집합체이기 때문이다. 딥러닝을 통해 로봇은 특정 패턴을 학습하여 여러 기능과 행동을 하도록 학습할 수 있다.
최근 ‘디지털대전환 2021’에 참가했던 데이터 라벨링 전문업체인 클라우드웍스사의 한 관계자는 “빅데이터를 기반으로 한 딥러닝은 IT세계의 핵심이라고 해도 과언이 아니다”면서 “이는 GAN과 같은 고도의 신경망 기술로 진화하면서 AI 자동화는 물론, VR․AR․XR, 메타버스 기술에 이르기까지 그 원천이 되고 있는 기술”이라고 의미를 부여했다.
