AI반도체 시장, CPU․GPU 등 “영역 구분없는 난투극”

인텔, 엔비디아, 구글, 메타, MS 등 ‘각자 주력분야 너머 공략’ 기존 빅테크도 CPU, GPU 개발, 독자적 ‘생성AI 생태계’ 구축

2024-04-25     전윤미 기자
반도체 생산시설. (사진=셔터스톡)

[애플경제 전윤미 기자] AI 반도체 시장 경쟁이 심해지면서, 관련 기업들 간에 CPU나 GPU 등 영역을 넘나드는 개발 경쟁도 치열하다. 인텔·엔비디아, MS, 구글, 메타 등이 각자의 주력 분야를 넘어서며, 경쟁적으로 반도체 기술을 개발하고 있다.

D램, 낸드, CPU, GPU 등 한 분야만 아니라, 영역을 파괴한 글로벌 반도체 업계의 기술개발, 투자전략, 포트폴리오 다변화가 이어지고 있다. 이에 기존 프로세서 강자가 어려움에 처하며, 새로운 전략과 제품으로 대응하고 있는 양상이다.

엔비디아, 인텔 장악 CPU시장 적극 진출

특히 스마트폰AP의 강자 퀄컴과 GPU를 대표하는 엔비디아가 지난해 하반기 인텔이 장악하고 있는 CPU 시장에 적극 진출하고 있다. 퀄컴은 지난해 10월 연례행사 ‘스냅드래곤 서밋’에서 PC를 혁신할 강력한 CPU 솔루션 ‘스냅드래곤X 엘리트 플랫폼(Snapdragon X Elite platform)’을 발표했다.

엔비디아는 또 ARM 기반 마이크로소프트 윈도에서 구동하는 CPU 설계를 시작해 전력 소모량에 비해 성능이 우수한 제품을 2025년 출시한다는 목표다.

구글·인텔·메타․MS 등 빅테크, 앞다퉈 새로운 칩 발표

4월 들어선 구글·인텔·메타 등 빅테크들도 앞다퉈 새로운 칩을 발표하면서 경쟁은 더욱 치열해질 전망이다.

구글은 자사 첫 ARM 기반 CPU 액시온과, AI 전용 텐서처리장치(TPU) 후속 제품 ‘v5p’을 출시했다. 인텔은 엔비디아 GPU H100 성능을 넘어서는 가우디3, 메타는 AI반도체 후속 버전인 MTIA(Meta Training and Inference Accelerator) 등을 공개했다. 또한 생성AI 주도권을 강화하기 위해 MS·애플 등 거대 플랫폼 기업의 자체 AI 칩 개발도 활기를 띠고 있다.

MS는 지난해 11월 ‘Microsoft Ignite 2023(11.15)’에서 자체 개발한 AI용 GPU ‘애저 마이아’와 클라우드(가상서버)용 CPU ‘애저 코발트’를 공개했다. 아마존도 ARM 기반 자체 서버용 프로세스 ‘그래비톤’을 개발한 바 있다. 그 다음으로 이를 업그레이드한 AI칩 ‘트레니엄2’를 공개했다. 애플은 PC용 M 시리즈, 모바일용 A 시리즈 등 독자 생태계를 강화했다.

기술매체 익스트림테크는 “‘CPU=인텔’, ‘GPU=엔비디아’의 공식을 벗어나 자체 칩 역량을 높이며, 생성AI 주도권을 확보하기 위한 경쟁이 격화하고 있다”며 “AI 반도체 시장은 경계가 흐려지는 ‘빅블러’ 시대를 맞고 있다.”고 밝혔다.

'인텔 비전 2024' 행사에서 펫 갤싱어 CEO가 신제품을 소개하고 있다. (출처=인텔, 정보통신기획평가원)

인텔, ‘가우디3’로 엔비디아 아성 공격

특히 인텔은 ‘인텔 비전 2024’에서 가우디3를 공개, 엔비디아 H100과 경쟁을 예고했다. 가우디3는 단일 칩, 7나노 공정인 전작 가우디2와 달리, 2개의 동일한 실리콘 칩을 하나로 패키징한 형태이며 5나노 공정으로 생산된 것이다.

이는 64개의 프로그래밍 가능한 텐서 프로세서 코어(TPC)와 8개 MME(Matrix Multiplication Engine)를 탑재했다. 메모리는 128기가바이트(GB) HBM2e로 대역폭은 3.7TB/s에 달한다. 이미 메타의 오픈AI 모델인 ‘라마’와 아랍에미리트가 개발한 오픈소스 대형 언어모델인 ‘팔콘’ 등에서 ‘가우디3’ 성능을 테스트한 것으로 알려졌다. “가우디3를 메타의 라마2와 오픈AI GPT-3를 활용해 테스트한 결과, 모델 학습 시간에서 가우디3가 엔비디아 H100보다 더 빨랐다”는 설명이다.

이는 특히 메타 ‘Llama2-13B’ 훈련 기준으로 1.7배나 빠르고 ‘GPT 3 – 175B’에서는 1.4배나 빠른 것으로 나타났다. 또한 ‘라마2’ 모델만을 상대로 한 테스트에선 H100보다 추론 처리량 50%, 추론시 전력 효율은 40%나 우수하다는 얘기다. 또한 기존의 인텔 제품에 비해 계산력을 뜻하는 BF16용 AI 컴퓨팅이 4배나 더 커졌다. 기억력을 뜻하는 메모리 대역폭은 1.5배나 향상했다.

인텔은 2분기에 델 테크놀로지스, 휴렛팩커드 엔터프라이즈, 레노버, 슈퍼마이크로 등에 가우디3을 공급할 예정이다. 일반 고객은 3분기 중 제품을 구매할 수 있을 것으로 전망된다. 인텔은 “경쟁력 있는 가격과, 차별화된 개방형 통합 네트워크 온 칩, 그리고 업계 표준 네트워크 기술인 이더넷을 사용하는 ‘가우디3’야말로 엔비디아 최신 칩과의 경쟁에서 이길 수 있다”고 장담했다.

한편 인텔과 네이버는 ‘가우디’를 토대로 작동하는 오픈 플랫폼 소프트웨어 생태계를 확대한다는 목표로 협업키로 해 주목을 끈다. 두 회사는 공동 재원을 투자해 네이버 사옥에 ‘AI 칩 연구소’을 구축키로 했다. 인텔은 AI 전문 계열인 하바나랩이 참여하고, 네이버는 반도체 설계 연구진이 참여키로 했다.

구글, CPU 액시온, TPU v5p 등 비전 제시

구글은 최근 ‘구글 클라우드 넥스트 2024’에서 ‘생성AI 생태계’ 비전을 제시하며, CPU 액시온, TPU v5p 등 다양한 신제품 라인업을 공개했다.

특히 ARM 기반 데이터센터용 CPU 액시온(Axion)과, AI 전용 반도체 텐서처리장치(TPU) 신제품 ‘v5p’에 시선이 집중되었다. 이 밖에 제미니 ‘코드 어시스트’ 추가, 워크스페이스의 생성AI 도입, 버텍스 AI 에이전트 빌더, 보안 도구 등도 출시했다.

액시온은 데이터센터용으로 자체 설계한 ARM 기반 CPU다. 동급의 현세대 x86 CPU보다 최대 50%나 상향된 성능과, 60% 향상된 에너지 효율성을 갖추고 있다. 웹 서비스나 데이터 분석, 마이크로서비스에서 AI 훈련에 이르기까지 다양한 목적의 범용 인스턴스를 위한 프로세서다.

특히 ARM의 최신 Armv9 아키텍처를 사용하는 ‘네오버스(Neoverse) V2’ 기반으로 설계되었다. ‘티타늄(Titanium)’ 마이크로컨트롤러를 함께 구성한 점도 특징이다. ‘티타늄’은 클라우드 환경에서 기존에는 프로세서가 처리해야 했던 네트워킹이나 보안, 하이퍼디스크(Hyperdisk) 블록 스토리지 서비스 입출력(I/O) 등을 프로세서 대신 처리한다. 이를 통해 프로세서와 시스템, 서비스 성능 최적화를 기한다.

AI반도체로서 본문 내용과 직접 관련은 없음.

“구글, 서버용 CPU 출시는 처음있는 일”

정보통신기획평가원은 “구글은 지금까지 ARM 설계를 바탕으로 스마트폰 두뇌 역할을 하는 AP 칩 ‘텐서’ 시리즈를 선보여왔지만 서버용 CPU를 내놓은 것은 이번이 처음”이라며 “기존 칩 구성만으로는 AI 연산 효율을 끌어올리는 데 한계에 직면하면서 자체적으로 맞춤형 칩을 도입하게 된 것”이라고 밝혔다.

구글은 구글 컴퓨트 엔진(Compute Engine)이나 쿠버네티스 엔진 등 다양한 구글 클라우드 서비스에서 ‘액시온’을 사용할 수 있도록 할 예정이다. 또 “앞으로 신설할 데이터센터는 온전히 AI에 집중할 계획이며 이는 AI 모델을 트레이닝하고 발전시키기 위한 노력의 일환”이라고 설명해 관심을 끌었다. 특히 데이터센터 설계에도 AI를 활용하여 공기 흐름, 전력 사용, 냉각, 방수 등 최적화를 기하고 있다.

구글은 또 AI 반도체 TPU(텐서처리장치)의 새로운 버전인 ‘TPU v5p’를 정식으로 출시했다. 또 AI 모델 제미니를 개발하기 위해 만들어진 v5p는 거대언어모델(LLM)을 학습시킬 수 있는 최신 칩으로 AI 훈련 속도가 이전보다 3배나 증가했다. 구글은 이 제품을 탑재한 ‘AI 하이퍼컴퓨터(AI Hypercomputer)’을 구성해서, 오픈AI에 맞서 자체 AI ‘제미니’를 고도화하겠다는 전략이다.

그런 가운데 가트너에 따르면 글로벌 AI 반도체 시장은 2022년 약 423억 달러에서 2027년 1,370억 달러로 동기간 연평균성장률(CAGR) 26.5%의 성장률을 달성할 전망이다.