걷거나 물건 집어 올리는 등 복합동작에 단일 AI모델 적용
보스턴 다이내믹스 개발, “범용 로봇 알고리즘 향한 시발점”
LBM으로 더욱 자연스런 동작 ‘인간형 로봇’ 제어
[애플경제 이지향 기자] 단 하나의 AI 모델만으로 걷고 뛰고 물건을 집어들거나 춤을 추는 등 인간과 유사한 다양한 동작을 해낸 휴모노이드 로봇이 등장, 눈길을 끈다.
보스턴 다이내믹스의 춤추는 휴머노이드 로봇 ‘아틀라스’가 그것이다. 아틀라스는 걷거나 물건을 잡거나 집어 올리는데에 단일 AI모델만을 적용한 것이다. 그래서 “이는 범용 로봇 알고리즘을 향한 중요한 전환점”이란 평가도 나오고 있다.
이전에도 휴머노이드 로봇 아틀라스는 파쿠르와 댄스 동작으로 크게 유명해졌다. 최근엔 그보다 훨씬 미묘하고 섬세한 동작을, 훨씬 더 중요한 기술로 구현한 것이다. 단일 인공지능 모델을 사용하여 걷고 물건을 잡는 법을 모두 학습한 것이다. 게다가, 이 로봇의 단일 학습 모델은 훈련받지 않은 동작, 즉 물건을 떨어뜨렸을 때 본능적으로 다시 집어드는 등 놀라울 정도로 ‘창발적인’ 기술을 보여주고 있다.
아틀라스를 개발한 보스턴 다이내믹스는 이처럼 다양한 예시 동작을 통해 “팔과 다리를 모두 제어하는 법”을 익힌 범용 모델을 개발했다. 이는 분명 일반적인 로봇과는 다르다. 보통의 로봇들은 걷기와 점프에 하나의 모델을 사용했다면, 물건을 잡거나 들어올리기 위해선 또 다른 AI 모델을 적용해야 한다.
이번에 아틀라스를 제어하는 데 사용되는 단일 모델은 다양한 기능을 포함하고 있다. 이미지를 식별하는 시각 센서와 처리 기능, 신체 센서를 통한 데이터 감각 능력, 다양한 동작과 관련된 언어 신호 등을 한꺼번에 지니고 있다. 데이터 감각 능력의 경우 로봇 스스로 자신의 위치와 움직임을 지속적으로 감지하게 된다.
단일 AI모델은 원격 조작, 시뮬레이션, 데모 비디오 기능을 혼합, 아틀라스가 다양한 작업을 수행하도록 해준다. 그 결과 생성된 ‘대형 행동 모델’(LBM)은 인간형 로봇을 더욱 자연스럽게 동작하도록 제어한다. 예를 들어, 상자에서 물건을 꺼낼 때 로봇은 사람처럼 다리를 움직여 아래로 손을 뻗으면서 균형을 다시 잡는다. LBM은 또한 몇 가지 기본적인 ‘창발’ 행동을 보인다. 예를 들어, 로봇이 물건을 떨어뜨리면 몸을 굽혀 집어 올리는 새로운 ‘복귀’ 기술을 보여준다.
이는 지금까지의 그 어떤 로봇 기술도 능가하는 것이다. 방대한 텍스트 데이터를 기반으로 하는 ‘대규모 언어 모델’(LLM)이 최근엔 코딩 능력과 같은, 미처 예상히지 못했던 능력을 발휘하는 것과도 같다. 로봇 연구자들은 이처럼 로봇 역시 미처 의도하지 않았던, 놀랍고 새로운 기술을 많이 보여주는 로봇을 기대하고 있다. 그런 기대 속에서 등장한게 이번 단일 AI모델 기반 아틀라스인 셈이다.
하긴 아틀라스뿐 아니다. 보스턴 다이내믹스는 자체 블로그를 통해 “로봇들은 더욱 일반화된 학습의 징후를 보이기 시작했다”면서 “채소를 썰거나 쏟아진 커피콩을 쓸어 담는 등 다양한 작업을 수행하도록 훈련된 다양한 종류의 로봇 팔을 실험하고 있다.”고 밝혔다.
이처럼 로봇 공학의 발전을 가늠하는 것은 더욱 어려워졌다. 휴머노이드 로봇이 냉장고에 짐을 넣거나 쓰레기를 버리는 것처럼, 겉보기엔 쉬워보이지만 복잡한 작업을 수행하는 모습을 보여주는 비디오 클립도 등장했다. 물론 그 중엔 기만적인 유튜브 영상도 있을 수 있다. 휴머노이드 로봇이 사실은 원격 조종되거나, 사전에 신중하게 프로그래밍되거나, 통제된 환경에서 단일 작업을 수행하도록 훈련되는 편법을 쓰는 등 속임수를 쓸 수도 있다.
그러나 이번 새로운 아틀라스의 경우는 다르다. “생성 AI 분야에서 챗GPT를 탄생시킨 일반 언어 모델과 같은 수준의 ‘로봇 공학 발전’을 예고하는 중요한 신호”라는 평가다. 나아가선 “광범위한 환경, 즉 파이프 용접부터 에스프레소 제조에 이르기까지 다양한 작업을 특별한 재교육 없이 빠르게 학습할 수 있는 로봇을 제공할 수 있다”는 것이다.
특히 “‘로봇의 새로운 행동’이라는 개념은 신중하게 다루어야 한다”는 의견이다. 버클리대 로봇 과학자인 켄 골드버그는 ‘와이어드’에 “대규모 언어 모델의 놀라운 능력이 훈련 데이터에 포함된 것처럼, 로봇은 실제보다 더 참신해 보이는 기술을 보여줄 수 있다”고 했다.
따라서 “로봇이 실험 중에 얼마나 자주 성공하고, 어떤 방식으로 실패하는지에 대한 세부 정보를 아는 것이 도움이 된다”는 것이다. 다만 “로봇 모델 훈련에 사용되는 데이터의 단순한 확장만으로 더욱 새로운 행동이 나타날지는 미지수”란 얘기다.
