인간 ‘인지 구조’ 모사, 구체적 행위 위한 ‘기능적 기능’ 결합
기호기반AI, 하이브리드 뉴럴AI, 강화・전이・메타학습 등 ‘인지 모사’
자연어 처리, 로보틱스, 추론·의사결정, 감정적·사회적 지능으로 ‘행동’
“인간 수준의 AI와 유사, 인간 뛰어넘는 ‘초지능’ 전 단계”

사진은 '2024 국제인공지능엑스포' 참가업체 부스로서, 본문 기사와는 직접 관련이 없음. (사진=애플경제)
사진은 '2024 국제인공지능엑스포' 참가업체 부스로서, 본문 기사와는 직접 관련이 없음. (사진=애플경제)

[애플경제 엄정원 기자] 생성AI를 넘어선 ‘범용’의 AI로 알려진게 AGI다. 아직 기술 개발단계이다 보니, 개발 주체마다 그 정의가 각기 다르다. 현재까지 대체로 합의된 개념은 사람의 인지구조를 본딴 후, 이를 바탕으로 자연어 처리와 추론, 감정적·사회적 지능을 갖춘 범용의 AI로 인식되고 있다.

특히 최근 국내에서도 이에 관한 나름의 개념 규정과 함께, 연구 개발을 위한 구체적 기술과 실체를 규명하는 작업이 이뤄지고 있다. 그 중 디지털 기술 분야의 대표적인 공공연구기관인 한국지능정보원은 “인지구조 모사기술과 기능적 기능” 두 가지를 핵심으로 개념과 세부적인 기술을 설명하고 있어 눈길을 끈다.

한국지능정보원, “AGI의 명료한 개념과 기술 분석”

이는 여지껏 국내외에서 제기된 AGI 개념을 가장 명료하게 요약, 분석한 것으로 평가된다. 이에 따르면 AGI는 현재의 AI(혹은 ANI, 좁은 개념의 AI)와 인간과 유사한 AI를 뛰어넘은 인간 수준의 AI와 비슷한 역량을 갖추고 있다. 나아가선 AGI나 인간 수준보다 더 뛰어난 ‘초지능’도 예상하고 있다.

한국지능정보원에 의하면 AG는 우선 ‘인지구조 모사 기술’을 기반으로 한다. 이는 인간의 사고 과정과 (인간 뇌의) 학습 메커니즘을 모사하는 것이다. 예를 들어 인지 아키텍처, 기호기반 인공지능, 신경망・딥러닝, 하이브리드 뉴럴 심볼릭 인공지능, 강화・전이・메타 학습 등이 포함된다. “이런 기술들은 ‘지능이 어떻게 작동하는가’를 구현하는 기반을 제공한다”는 설명이다.

AGI는 또 ‘기능적 지능’을 기반으로 삼는다. 인간 수준의 지능을 발휘하기 위한 능력이다. 즉, 자연어 처리, 시각 인식, 로보틱스, 추론 및 의사결정, 감정적·사회적 지능 등이다. 앞서 인간의 ‘인지구조 모사’가 ‘어떻게 작동하는가’에 역점을 둔다면, 이는 ‘지능이 무엇을 할 수있는가’를 규정하는 것이다.

‘인지적 모사 기술’과 ‘기능적 지능’은 상호보완적 관계에 있다. 이를 통해 AGI가 완전한 구현된다는 설명이다.

인간 ‘두뇌’가 정보 처리하는 방식에서 영감

본래 AGI의 인지 구조는 인간의 두뇌가 정보를 처리하는 방식에서 영감을 받은 것이다. 지능정보원은 이를 ‘계층적 지능 구조’로 표현했다. 이는 크게 지각, 기억, 주의, 추론, 행동 등 5가지 요소로 구성되어있다. 이들은 상호작용을 통해 통합적 지능을 가능하게 한다.

그 중 ‘지각’은 외부로부터 입력되는 시각, 청각, 언어 등 멀티모달 정보를 통합, 상황을 인식하고 의미를 구성한다. 이는 AGI가의 환경을 이해하고, 적응하는 출발점이기도 하다. 추론과 의사결정 과정을 가능하게 하는 입력 과정이라고 할 수 있다.

‘기억’은 단기기억과 장기기억으로 구성되어있다. 지각된 정보를 저장・관리하고 과거의 경험을 현재의 판단 근거로 활용한다. 이는 학습된 지식을 재활용하고, 맥락의 일관성을 유지할 수 있는 핵심적 역할을 한다.

‘주의’는 다양한 정보들의 중요도를 판단하는 능력이다. 이를 위해 인지적 자원을 효율적으로 분배하고, 환경적 변화 속에서도 맥락적 일관성을 유지하도록한다. 그래서 “복잡한 정보환경에서 목표 지향적 사고를 가능하게 하는 핵심 제어 모듈”이란 설명이다.

‘추론’은 논리적・확률적 판단을 하게 한다. 관찰된 정보와 기억된 지식을 기반으로 문제 해결 경로를 구성한다. 이는 상황 해석과, 목표 설정, 의사결정의 중심이기도 하다. ‘행동’은 추론 결과를 바탕으로 외부 환경에 대한 구체적 행위를 수행하는 것이다.

수행한 결과를 다시 지각과 기억 모듈로 피드백, 학습하거나 개선한다. 특히 ‘행동’은 AGI의 ‘지각 추론 행동 루프’를 완성, 시스템이 지속적으로 자기 개선을 할 수 있도록 한다. 이런 인지구조는 또한 각 모듈 간 순차적 연결이 아닌, 상호작용과 순환을 통한 정보 흐름을 통해 작동하게 된다.

사진은 본문과 직접 관련이 없음. (사진=애플경제)
사진은 본문과 직접 관련이 없음. (사진=애플경제)

‘인지구조 모사 기술’의 3가지 프레임워크

지능정보원에 의하면 이같은 ‘인지구조 모사 기술’엔 ▲전통적 인지구조모델, ▲신경 기반 인지모사 기술, ▲학습 확장형 인지모사기술 등이 있다.

전통적 인지구조모델 중 ‘인지 아키텍처’는 인간의 기억과 학습, 추론 과정을 통합적으로 모사하는 프레임워크다. ‘ACT-R’, ‘SOAR’, 이카루스(ICARUS) 시그마(Sigma), 클래리온( CLARION0 등이 대표적이다.

또 ‘기호 기반 인공지능’도 있다. 이는 규칙과 논리를통해 지식을 표현하고 추론 하는 방식이다. MYCIN, DENDRAL, STRIPS 등이 그런 아키텍처다.

‘신경기반 인지모사기술’의 경우 신경망・딥러닝을 바탕으로 한다. 인간 뇌신경망을 모방, 대규모 데이터로 학습하고 패턴을 인식한다. CNN, RNN, 트랜스포머 등이 그런 경우다.

‘뉴로 심볼릭 인공지능’ 프레임워크도 있다. 이는 신경망의 학습과 표현능력 기호 기반 추론의 논리적 일관성을 통합한 ‘하이브리드 인공지능 접근법’이다. 학습된 뉴럴 표현을 기반으로 추론・설명・지식일반화를 수행한다. 딥마인드, 뉴로-심볼릭, 콘셉트 러너(Concept Learner (NS-CL)), IBM 뉴로 심볼릭AI, MITNS-VQA 등이 있다.

‘학습 확장형 인지모사’ 기술은 강화・전이・메타학습, 보상 기반 상호작용, 지식 전이, 학습효율성 강화접근법 등이 있다. 알파고(RL)나 버트(BERT), 파인 튜닝(Transfer), MAML(메타) 등이 그런 경우다.

‘기능적 지능’의 요소들

‘기능적 지능’은 ‘인지적 모사 기술’과 상호보완적 관계에 있다. 즉 인지모사 기술을 바탕으로 구체족인 행동과 작동이 가능하게 하는 것이다.

그 중 ‘인식 지능’은 자연어처리(NLP), 즉 인간과 기계가 언어로 소통할 수 있도록 하는 기술이다. BERT, GPT등이다. 또 ‘시각인식’(Computer Vision)은 외부 세계를 인지・이해하는능력으로 ‘비전 트랜스포머’(ViT)의 일종이다.

‘기능적 지능’의 핵심 요소로서 ‘물리적 지능(Physical Intelligence)’도 중요하다. 대표적으로 ‘로보틱스’는 물리적 세계와 직접 상호작용하는 능력이다. DDPG, PPO, SLAM 등이 있다. 또 ‘임베디드 AI’도 발달하고 있다. 이는 지각・행동・인지가 통합된 형태다. 물리적 또는가상환경에서 학습하고 추론하는 지능으로, 로봇뿐 아니라 시뮬레이션 기반 지능형 에이전트를 포함한다. NeRF, Habitat Simulator, IsaacGym, MineDojo 등이 이에 해당하는 아키텍처다.

‘사고 및 추론지능’(Cognitive Intelligence)의 경우 추론・의사결정을 가능하게 한다. 즉, 복잡한 문제를 분석하고 최적의 선택을 도출하는 능력이다. GNNs, Chain-of-Thought, Self-Consistency, Meta-CognitiveThinking 등이 이에 해당한다.

‘사회 및 감성지능’도 ‘기능적 지능’의 핵심이다. 그 중 ‘감정지능’은 인간의 감정 상태를 인식・해석하고, 상황에 맞게 공감적 반응을 생성한다. ‘AffectiveComputing’이나, ‘EmpatheticResponse’, ‘Generation’, ‘Emotion2Vec’ 등이 있다.

‘사회적 지능’은 사회적 맥락에서 협력・소통하며 윤리적 판단과 가치정렬을 수행하는 능력이다. ‘Value Alignment’, ‘Ethical Reasoning’, ‘Theory of Mind Models’등이 이에 해당한다.

저작권자 © 애플경제 무단전재 및 재배포 금지