2024년 반도체 시장, “추론용 FPGA 크게 증가”
학습용 GPU와 함께 AI반도체 두드러진 증가세, 전체 반도체 시장 견인 생성 AI 적합한 추론형 FPGA 급증, ‘학습용 SoC’ 경쟁도 치열
[애플경제 이윤순 기자] 2024년 이후는 특히 학습용 GPU를 넘어선, 추론용 AI반도체인 FPGA(범용 비메모리 반도체)로 반도체 시장의 무게 중심이 쏠릴 것이란 예측이다.
글로벌 반도체 시장조사기관인 세계반도체시장통계기구(WSTS)는 특히 생성AI의 발달에 힘입어 반도체 시장이 전반적으로 회복되는 가운데, 이런 현상이 두드러질 것으로 예상했다.
흔히 기계 학습용으로는 GPU가 적합하다. 그 동안 컴퓨터 연산 처리를 위해 CPU가 사용되어 왔지만, 딥러닝(심층학습) 등의 학습 프로세스를 위해 GPU를 사용함으로써 처리 속도를 높여왔다. 이때 GPU는 병렬 처리에 능하기 때문에 방대한 수의 계산을 반복하는 학습 프로세스 구조에 적합하다는 얘기다.
기계 학습용으로는 그래서 GPU가 주류를 이루고 있다. 그러나 앞으로 추론 등 로직 분야를 위해선 더욱 특화된 반도체가 개발되고 있다.
즉, 범용의 비메모리 반도체인 FPGA를 활용하는 학습용 SoC(System on Chip)를 개발, 서버의 고속 처리와 함께 전력 효율을 향상시키는 노력을 기울이고 있다. 특히 로직 기업들은 SoC의 성능을 향상시키기 위해 M&A 등을 통해서도 제품 라인업을 확충하는 상황이다. 여러 가지 기능을 가진 시스템을 하나의 칩으로 구현한 기술집약적 반도체인 SoC의 성능이 그 만큼 중요하다는 뜻이다.
‘엣지 AI 시장’ 확대도 예상
AI반도체는 탑재되는 디바이스에 따라 필요한 처리 능력이 각기 다르다. 특히 저지연, 저소비전력이 학습용보다 더 많이 요구되는 추론용 AI 반도체에서는 FPGA가 가장 적합하다. FPGA는 메모리 반도체와는 달리, 대상이 되는 AI 모델 용도에 맞춰 회로를 구성할 수 있다. 또 저지연 및 저소비전력도 실현할 수 있기 때문이다.
특히 엣지AI는 추론용 AI 반도체를 엣지에 탑재하여 처리함으로써 원격으로 오감으로써 인해 빚어지는 통신 지연이나, 클라우드의 부담을 줄여준다. 이를 통해 고도의 추론과 로직이 가능해지는 것이다.
예컨대, 감시 카메라나 스마트폰에 탑재된 엣지 AI는 얼굴 인증 등의 AI 처리를 통해 특정 인물만 잠금을 해제할 수 있다. 특히 자율주행기술은 엣지 AI가 가장 활발히 적용되는 분야로서, 이와 관련된 AI 반도체가 경쟁력의 핵심으로 부상하고 있다.
이에 2024년에는 전에 없는 속도로 생성형 AI에 필요한 FPGA 반도체가 빠르게 늘어날 것으로 전망된다. 또 이를 탑재한 스마트폰이나 컴퓨터의 판매도 회복될 것으로 예상한다. WSTS에 따르면 컴퓨터 연산에 사용되는 로직 반도체는 9.6%가 증가하고, 카메라에 사용되는 이미지 센서 등의 반도체는 1.7%가 증가할 것으로 보인다.
애초 기계학습은 대량의 학습 데이터를 통해 학습이 끝난 AI 모델을 만들어 내는 ‘학습 프로세스’와, 학습이 끝난 AI 모델에 따라 데이터를 식별 및 분석하는 ‘추론 프로세스’로 나뉜다.
이러한 두 가지 프로세스에서 요구하는 성능이 다르기 때문에, 각각에 맞는 반도체가 필요하다. 주로 클라우드(서버) 측에서 사용되는 학습용 AI 반도체에는 대량의 데이터를 처리하기 위한 높은 연산 능력이 필요하다.
클라우드만이 아니라 스마트폰이나 감시 카메라 등의 엣지 측에도 탑재되는 추론용 AI 반도체는 일반적으로 학습용에 비하면 연산 능력을 크게 필요로 하지 않는다. 디바이스에 따라서는 저지연, 저소비전력 등이 한층 더 요구된다.
한편 WSTS는 2024년의 전체 반도체 시장 규모는 전년 대비 13.1% 증가한 5,883억 달러가 될 것이라고 예측했다. 특히 생성 인공지능(AI)을 대상으로 하는 반도체 수요 등이 확대되면서 FPGA를 중심으로 추론형 AI반도체가 크게 증가할 것으로 예상되었다.