GPU 대체, “국내 기업들, 글로벌 빅테크 못지않아”, 이미지․자연어 모두 처리
저전력 ‘엣지’용보다는 고성능 ‘서버’용 NPU 많아, 국제 벤치마크 기술 인정
삼성․LG 외, 사피온, 리벨리온, 퓨리오, 딥엑스, 모빌린트 등 스타트업
[애플경제 전윤미 기자] NPU(신경망처리장치, Neural Processing Unit)는 생성AI시대를 맞아 기존 CPU나 GPU를 대체할 것으로 예상되고 있다. 특히 기존에 인공지능 네트워크 연산에 사용되던 GPU와 달리, 범용이 아닌 AI기술에 특화, 연산 효율을 높이거나 에너지 효율 을 증가시키는 것이다. 글로벌 빅테크들은 이 분야 기술에 매진하는 가운데, 최근엔 국내 기업들도 이 분야 기술 개발에 적극 나서고 있다.
많은 국내기업들이 이미지 처리나 자연어 처리를 위한 AI 분야에서 저비용․고효율 극대화를 위해 GPU를 대체하기 위해 치열하게 기술 개발을 하고 있다. 사피온과 함께 NPU의 일종인 ‘AB9(알데바란9)’을 개발한 바 있는 한국전자통신연구원은 “삼성전자, 사피온, 리벨리온, 퓨리오사 등 대기업과 강소 스타트업 중심으로 NPU 기술 개발이 활발히 진행되고 있다.”고 밝혔다.
대부분 생산 기업들, 2024년 중 양산 목표
이에 따르면 현재 국내에서 개발 중인 NPU는 대부분 이미지 처리 분야에 집중하고 있다. 그러나 생성AI가 활발히 보급되면서 점차 자연어 처리 분야로 확장하고 있다. 특기할 점은 ‘저전력’에 집중한 ‘엣지’용 NPU보다는 ‘고성능’에 집중한 서버용 NPU가 많이 개발되고 있다는 사실이다.
이들 대부분 제품은 금년 중 양산을 목표로 하고 있다. 이에 따라 2024년 하반기에는 국산 NPU들이 얼마나 경쟁력을 가질 것인지 가늠할 수 있다는 전망이다.
이처럼 국내 기업들은 현재 단순히 NPU를 공개하는 것을 넘어 양산에 들어가거나, 상용화를 위해 성능을 검증하는 단계에 도달하고 있다. 특히 해외 기업 중에서도 국산 NPU를 활용하는 사례가 나오고 있을 정도다. 이는 “기술 성숙도에 대한 인정이라는 점에서 매우 고무적인 일”이란 평가다.
“국산 NPU, 글로벌 시장의 한 축 차지” 기대
전문가들은 수년 내에는 국내외적으로 NPU 시장이 크게 확대될 것이며, 국산 NPU가 한 축을 차지할 수 있을 것이라고 조심스레 전망하기도 한다. 다만, “미래 NPU 시장을 선점하기 위해서는 국내 NPU 기술의 보다 빠른 실서비스 적용을 통한 경쟁력 확충이 중요하다”는 주장이다.
성낙명 한국전자기술연구원 책임연구원 등은 “최근 국산 NPU가 MLPerf 등 벤치마크에서 성능 면에서는 약진하고 있으나, 아마존의 AWS나 알렉사, 구글의 클라우드 플랫폼과 같이 예상치 못한 다양한 상황이 발생하는 대규모 AI서비스에서의 검증은 다소 뒤처지고 있다”면서 “여러 NPU 스타트업들이 KT 클라우드, SKT 등과 연계해 고객사 검증을 수행하는 등 대규모 AI서비스에 NPU를 적용하기 위한 노력을 하고 있어 기대를 걸어볼 만하다”고 했다.
삼성전자 ‘엑시노스’, LG전자 ‘신규 NPU’ 개발
이에 따르면 대기업 중에는 대표적으로 삼성전자에서 모바일용 NPU 시장 선점을 위한 지속적인 투자를 통해 최신 기술을 확보하는데 성공했다. 지난 2018년 공개한 엑시노스 9820 이해 업그레이드를 계속한 끝에 2020년부터 출시된 엑시노스 10시리즈(엑시노스 1080, 1380), 20시리즈(엑시노스 2100, 2200, 2400)에 모두 NPU가 탑재되었다.
최근 현대차와 협업, 개발한 차량용 프로세서인 엑시노스 오토 V920도 NPU를 탑재한 것이며, 2025년 상용화를 계획하고 있다.
엘지전자는 2019년 가전 등에서 온디바이스 AI를 수행할 수 있도록 LG8111 AI SoC 솔루션을 개발,, 2022년 자사 냉장고 등 스마트 가전에 이를 도입했다. 2023년부터는 신규 NPU를 개발, 스마트 TV의 알파10 칩에 적용될 것이라고 밝혔다.
사피온코리아 국내 최초 상용화, 리벨리온 ‘금융권 특화’
SK텔레콤에서 분사한 사피온코리아는 NPU 펩리스 기업답게 국내 최초로 NPU 상용화를 달성했다. 2020년 고정소수점 연산 기반의 추론 전용 가속기로서, 8비트 정수 연산 환경에서 최대 100 TOPS(Tera Operations Per Second) 성능, 최대 65W 전력을 소비하는 국내 최초 서버용 AI상용 반도체인 X220을 출시했다 2023년 11월에는 “세계 최고의 AI반도체”임을 강조하면서 추론 및 학습이 가능한 고성능 NPU X330을 개발하는데 성공했다.
서버용 NPU를 개발하는 펩리스 기업인 리벨리온도 지난 2021년 금융권의 하이 프리퀀시 트레이딩에 특화된 NPU인 아이온(ION)을 출시했다. 아이온은 응답시간의 최소화와 높은 처리량을 탑재, 매우 빈번하게 일어나는 금융권의 매매에 AI 기반 퀀트 기법을 적용한 금융권 전용 NPU다. 2023년에는 데이터센터용 NPU인 ‘아톰’(ATOM)을 출시했다.
아톰은 쌍방향 언어모델인 트랜스포머 계열 BERT를 지원하며 이미지 처리를 위한 CNN(계열의 모델도 지원한다. 이는 “공신력 높은 벤치마크인 MLPerf를 통해 퀄컴 및 엔비디아보다도 성능이 월등한 것으로 인정받았다”는 설명이다. 현재 KT 등과 협업, 상용화를 추진하고 있다.
퓨리오 ‘데이터센터’용, 딥엑스 ‘엣지’와 ‘서버’용
퓨리오사는 데이터센터를 타깃으로 한 서버용 NPU HW 및 SW 기술을 집중 개발하고 있다. 2022년 하반기에 최대 64 TOPS의 데이터 처리 속도의 이미지 및 비디오 분석, 자율주행 도메인 등을 위한 ‘워보이’(Warboy)를 출시했다. 역시 벤치마크 MLPerf를 통해 우수한 성능을 인정받았다. 퓨리오사는 “소프트웨어 개발 키트(SDK)와 실제 활용을 위한 문서를 오픈소스로 배포, 시장을 점유하기 위해 노력하고 있다”고 전했다.
또 2세대 칩 개발에도 주력하고 있다. 챗GPT-3 등 언어 모델을 지원하는 고성능 저전력 반도체 ‘레니게이드’(Renagade)를 개발하고 있으며, LG AI 연구원과 협력, 생성AI 기술 탑재를 검증하고 있다.
엣지 및 서버용 NPU를 개발하는 팹리스 기업인 딥엑스도 나름대로 세계 최고 수준을 자신하면서 높은 전성비․정확도를 갖춘 다양한 신규 알고리즘 기반의 NPU를 개발하고 있다. 이 회사는 2023년 1600 TOPS급을 비롯한 4가지 NPU를 발표, 2024년 양산을 목표로 하고 있다. 그 중 ‘DX-L1’, ‘L2’는 ‘초 저전력’으로 동작, 지능형 CCTV 등을 타깃으로 출시되었다. ‘DX-M1’은 엣지용, ‘DX- H1’은 서버용으로 출시되었다.
딥엑스의 NPU는 현재 이미지 모델만 지원하지만, 2024년부터 DX-M1에서 언어 모델을 지원할 것으로 알려졌다.
모빌린트 ‘엣지 컴퓨팅’용, 전자통신연구원 ‘AB9’
엣지용 NPU 팹리스 스타트업 기업인 모빌린트도 엣지 컴퓨팅 분야에서 활용하는 고성능 NPU를 개발하고 있다. 2023년 첫 상용화 제품으로 80 TOPS의 고성능 NPU ‘에리스’(Aries)를 ‘CES 2024’에서 에서 발표했다. ‘에리스’는 PCIe 카드 형태의 ‘MLA100’과 엣지 AI 컴퓨팅 시스템 구축을 위한 다양한 인터페이스가 탑재된 ‘MLX-A1’에 탑재되어 판매될 예정이다. 특히 “생태계 구축을 위해 관련 SDK인 모빌린트 큐비(MOBILINT qubee)도 제공하며, 2024년 내 고객사 검증을 끝내고 양산에 들어갈 것”이란 설명이다.
한편 공공연구기관인 한국전자통신연구원도 2020년 사피온사와 협력, AB9(알데바란9)를 개발한 바 있다. AB9는 연산 성능 40 TFLOPS와 15~40W의 소모전력 특성을 지닌 ‘IEEE754 Half Precision’ 부동소수점 연산기 기반의 학습용 NPU다. 이는 서버와 자율주행차량을 목표로 한 것이다. 연구원은 또 2021년 12월에는 AB9를 탑재한 ‘ABrain-S 보드’를 개발, 기술이전을 통한 상용화를 추진하고 있다
