“엔비디아 독무대, 이대론 안돼” 공감대, 독점 깨기 위해 ‘연대’
AI 개발 SW ‘쿠다’ 대체할 모델 개발 박차, ‘엔비디아 생태계’ 공격
구글, 인텔, 삼성전자, 퀄컴, AMD, ARM, 네이버, 오픈AI, MS 등
[애플경제 전윤미 기자] AI칩이나 소프트웨어 부문을 망라한 AI반도체 생태계를 독점하다시피 하는 엔비디아에 맞선 빅테크들의 움직임이 갈수록 활발해지고 있다. 엔비디아 제품은 늘 물량 부족 등 공급난을 빚는데다, 가격도 부담하기 어려울 만큼 비싸지면서 AI업계에 큰 부담이 되고 있다.
이에 구글, 인텔, 퀄컴, 삼성전자 등 빅테크를 중심으로 한 연대와 동맹 움직임이 가속화되고 있다.
엔비디아의 독점은 AI 모델 구축과 서비스 개발에 필요한 AI 칩(GPU) 분야뿐 아니다. AI개발에 필수적인 프로그래밍 모델이자 플랫폼인 ‘쿠다’(CUDA)를 통해 자사의 AI반도체 독점 구도를 더욱 공고히하고 있다. 이에 구글·인텔·퀄컴과 삼성전자, 네이버, 그리고 중국 기업들까지 가세해 엔비디아 독점 구도를 깨기 위한 노력을 기울이고 있다.
우선 구글과 삼성전자, 인텔, 퀄컴 등은 엔비디아에 대항하기 위한 UXL 재단을 설립했다. 또 인텔과 네이버도 칩 경쟁력을 높이고 AI서비스를 개발하기 위해 협력키로 했다. 중국의 AI스타트업인 ‘무어 스레드’ 등도 ‘쿠다’에 대항한 AI 컴퓨팅 센터를 구축하고 있다.
빅테크 연대한 UXL 재단 중심, R&D 열기
또 오픈 AI는 최대 7조 달러(약 9,400조 원) 투자를 유치, 자체 반도체 공급망을 구축한다는 계획을 추진하고 있다. 소프트뱅크도 1,000억 달러(약 134조 원)의 자금을 투입하는 ‘이자나기(Izanagi) 프로젝트’를 실행하고 있다. AMD도 지난해 12월 엔비디아의 H100에 버금가는 강력한 AI 칩 ‘MI300X’를 출시했다. 아마존과 구글 역시 자체 데이터센터용 AI 반도체를 제작하고 있다.
엔비디아의 강점은 단순히 GPU뿐 아니라 AI를 구동하는 SW, 즉 ‘쿠다’를 통해 관련 시장까지 장악하고 있다는 사실이다.
AI기술을 개발하려면 부득히 엔비디아가 생산하는 AI 반도체(GPU)뿐 아니라, AI 관련 프로그램을 만들기 위한 소프트웨어 ‘쿠다’를 쓸 수 밖에 없다. 쿠다는 엔비디아 GPU에서 일반적인 프로그래밍 언어로 병렬 처리를 수행할 수 있도록 하는 탁월한 프로그래밍 모델이자 소프트웨어 플랫폼이다. 즉 “GPU 칩과 이를 구동하는 프로그래밍·플랫폼 등 SW를 함께 개발하며 시스템을 최적화할 수 있어 더 높은 성능을 갖춘 것이 쿠다의 경쟁력”이란 설명이다.
이를 통해 이른바 ‘쿠다 플랫폼’ 커뮤니티가 광범위하게 형성된다. 커뮤니티를 중심으로 다양한 개발도구와 라이브러리 등이 구축되고, 개발자들은 이를 통해 쿠다를 쉽게 배우고 활용할 수 있는 환경이 조성되는 것이다. 모든 AI 기업들의 엔비디아 의존도는 커질 수밖에 없는 상황이다.
엔비디아 의존 탈피 위한 AI SW 구축에 박차
구글·인텔·퀄컴 등이 지난해 9월 설립한 UXL 재단은 ‘쿠다’에 대항하는 오픈소스 프로젝트를 한창 구축하고 있다. 이들에 의하면 이 프로젝트는 “모든 반도체 칩이나 하드웨어 기반의 컴퓨터에서 구동하는 소프트웨어와 도구, 제품군을 구축하는 것이 목표”라는 설명이다.
10여 년의 노하우를 지닌 ‘쿠다’는 엔비디아의 GPU에서만 구동할 수 있다. 구글 등은 이런 점을 노려 범용의 AI SW를 구축한다는 계획이다. 일단 “2024년 상반기까지 기술 사양을 확정하고 연말에는 기술적 세부 사항을 ‘성숙한’ 상태로 개선할 계획”이다. 또 개발된 SW가 모든 칩이나 하드웨어에 배포될 수 있도록 다른 칩 제조사와 마이크로소프트(MS), 아마존 등 클라우드 컴퓨팅 회사의 동참을 요청하고 있다.
이들은 ‘쿠다’를 겨냥한 다양한 GPU 프로그래밍 기술을 한창 개발하고 있다. 엔비디아 ‘쿠다’는 엔비디아의 병렬 컴퓨팅 플랫폼이자 API로서, C 프로그래밍 언어 기반의 이미지 처리, 딥러닝 등 다양한 분야에서 활용되고 있다.
이에 AMD도 자사의 GPU를 위한 프로그래밍 플랫폼 ‘ROCm’을 개발했다. 이는 C++ 프로그래밍 언어 기반의 SYCL(병렬 프로그래밍을 위한 개방형 표준)를 지원, 엔비디아와 AMD GPU 벤더와 호환이 되게 했다. 인텔도 자사 CPU와 GPU를 위한 통합 프로그래밍 모델 ‘oneAPI’를 개발했다. C++ 프로그래밍 언어, 그리고 SYCL 기반으로 엔비디아와 AMD GPU도 지원한다.
구글이 개발한 ‘TensorFlow XLA’은 TensorFlow의 Just-In-Time (JIT) 컴파일러다. 모델 자동 분석 및 최적화, CPU, GPU, TPU 등 다양한 하드웨어 플랫폼을 지원한다. ARM 역시 자사의 Mali GPU를 위한 개발 툴킷인 ‘Mali-C SDK’를 개발했다. 역시 C++ 프로그래밍 언어 기반으로 리눅스와 안드로이드 운영 체제에서 일반적인 그래픽과 컴퓨팅 API를 지원한다.
빅테크, 중국 스타트업 등 GPU 프로그래밍 기술경쟁
인텔은 또 네이버와도 손을 잡았다. 두 회사는 엔비디아 없이 AI 생태계 구축 작업에 나섰는데 “구체적 내용은 이르면 4월 중 공개할 것”이라고 한다.
현재 알려지기론 인텔이 자체 개발한 AI 가속기 ‘가우디’와, 네이버의 거대언어모델(LLM) ‘하이퍼클로바X’를 기반으로 다양한 생성 AI 서비스를 개발하고, 데이터센터 운영 등 AI 플랫폼 생태계를 공동 구축한다는 목표다.
특히 “엔비디아 의존도를 탈피하는 별도의 개발 플랫폼도 구축해 AI 서비스를 구동할 것”이란 설명이다.
그런 가운데 중국의 독자적인 추격도 맹렬하다. 대표적으로 꼽히는게 중국의 GPU 스타트업 ‘무어 스레드<Moore Threads>’라는 회사다. 이 회사는 엔비디아 중국 사업 총괄 매니저 출신 장젠중이 2020년 설립한 후 GPU 칩과 게임용 그래픽카드를 잇따라 선보이고 있다. 또 지난해 연말엔 LLM 수요에 부응하기 위한 ‘콰어(KUAE) 인텔리전트 컴퓨팅 센터’를 소개하기도 했다.
이는 GPU의 다기능 컴퓨팅 이점을 활용, 반도체부터 그래픽카드, 클러스터까지 스마트 컴퓨팅 생산 라인을 구축한 것으로 알려졌다. 무어 스레드의 호언처럼 과연 이 센터가 엔비디아의 ‘쿠다’에 필적할 수 있을지는 두고볼 일이다.
“독점 붕괴시, AI반도체 가격도 크게 하락” 예상
이처럼 AI개발업계에서 가장 널리 사용하는 ‘쿠다’를 대체할 기술개발이 활기를 띠면서 AI 반도체 개발 경쟁도 더욱 치열하게 전개될 전망이다. 엔비디아의 독보적 경쟁력은 AI칩 뿐 아니라 ‘쿠다’의 영향력이 컸기 때문이다. 그러나 소프트웨어 부문에서 다른 경쟁사들이 자체 개발 등으로 따라잡을 경우, 시장 판도는 달라질 수도 있다는 분석이다.
월스트리트저널은 “현재 세계적으로 수요가 폭증하고 있는 엔비디아 AI 반도체는 늘 공급이 딸리면서, 다른 수요업체들은 ‘울며 겨자먹기’로 비싼 값에 이를 구매할 수 밖에 없다”면서 “그러나 ‘쿠다’를 대체하는 SW가 개발되고, 이를 기반으로 한 또다른 고성능 AI 반도체가 출현할 경우, 엔비디아 독점 체제가 무너질 수도 있고, AI 반도체 가격도 크게 하락할 가능성이 크다”는 전망을 내놓고 있다.
