엔비디아, AI칩 이어, ‘슈퍼컴’도 ‘강적’ 맞닥뜨려
“슈퍼컴 ‘DGX Spark’보다 AMD ‘Strix Halo’ 미니 PC ‘가성비’ 우수” 앞서 구글 고성능·대용량 TPU 칩 등장, 엔비디아 ‘블랙웰’ 위협 일부 사용자들 “‘DGX’는 잊고, 절반 가격에 ‘Strix’ 구입해야” 주장도
[애플경제 엄정원 기자] 구글의 ‘아이언우드’ AI 칩에 이어 이번엔 가성비 높은 AMD 고성능 미니 PC가 등장하면서 엔비디아가 연속해서 경쟁자들의 도전을 받고 있다. 앞서 구글의 최신 7세대 아이언우드TPU(TPU v7 ‘아식’(ASIC)가 지난 주 선보이면서 자사의 AI칩의 진짜 ‘강적’이 등장한 셈이다.
그로부터 며칠이 지난 후 이번엔 다시 엔비디아의 개인용 AI 슈퍼컴퓨터 ‘DGX Spark’의 ‘적수’가 나타났다. AMD가 개발한 ‘Strix Halo’ 미니 PC가 그것이다.
“‘Strix Halo’ PC APU 엔비디아의 GB10보다 우수”
앞서 엔비디아는 개인용 AI 슈퍼컴퓨터 ‘DGX Spark’를 출시, 큰 관심을 모았다. 이는 엔비디아의 고성능 ‘GB10 그레이스 블랙웰’ 슈퍼칩을 적용한 것이다. 그러나 최근엔 AMD가 자체 기술로 개발한 ‘Strix Halo’ 미니 PC가 ‘DGX’와 성능은 같으면서도 가격은 절반 수준이어서 주목받고 있다. 소위 ‘가성비’ 측면에서 엔비디아보다 훨씬 낫다는 뜻이다.
일부 사용자 커뮤니티에선 “엔비디아의 DGX Spark, 소위 ‘슈퍼컴퓨터’는 잊어버리세요. AMD의 Strix Halo 미니 PC는 절반 가격에 동일한 성능을 제공한다”라는 문구가 등장할 정도로 호평을 받고 있다.
앞서 엔비디아는 ‘기념비적 출시’임을 강조한 미니 슈퍼컴퓨터 ‘DGX Spark’를 출시했다. AMD 역시 이에 대응, 온디바이스 AI 분야에서 나름의 경쟁력을 지닌 APU(Accelerated Processing Unit, 가속처리장치) 시리즈를 개발했다. APU는 차세대 통합 프로세서로서, CPU와 GPU가 하나의 다이(die) 안에 통합되어 있다.
그런 까닭에 “‘Strix Halo’ PC의 APU는 다양한 AI 워크로드에서 엔비디아의 GB10 칩보다 우수하다”는게 AMD의 주장이다. 적잖은 사용자들도 “엔비디아 DGX 스파크가 처리량 측면에서는 뛰어난 제품이지만, (성능과 비용) 가성비 최고의 플랫폼은 Strix Halo’”라는 평가도 이어지고 있다.
“‘DGX 스파크’ 4천달러, 성능 비해 너무 비싸”
분명 ‘DGX 스파크’ 시스템은 엔비디아가 AI 워크로드를 위한 소형 기기 개발에 처음으로 착수했다는 점에서 독보적인 성과로 인정되고 있다. 이는 엔비디아의 자체 개발 칩인 GB10의 개발 성과이기도 하다.
엔비디아 GB10 슈퍼칩은 ‘1 PFLOP(페타플롭) FP4 AI 컴퓨팅’을 탑재한 Blackwell GPU다. 1초당 1천조번 연산 처리를 하는 속도다. 또 ‘20 Arm 코어’와 128GB 저전력 DDR5X를 탑재한 고대역폭 통합 메모리, Wi-Fi, 블루투스, USB 등의 연결 인터페이스 등이 특징이다.
그러나 문제는 ‘가격’이다. 고성능을 자랑함에도 불구하고, 소비자들은 DGX 스파크의 “터무니없는 4,000달러(한화 약 560만원)라는 가격”을 지적하며, “그에 비하면 DGX 스파크의 매력은 한참 떨어진다”고 비판하고 있다.
이에 비해 AMD의 대표적인 미니 PC 제조업체 중 하나인 ‘GMKtec’은 ‘DGX 스파크’의 거의 절반 가격에 비슷한 성능의 제품을 출시한 것이다.
제조업체인 ‘GMKtec’은 10일 공식 블로그 게시물을 통해 엔비디아의 ‘DGX Spark’ 미니 슈퍼컴퓨터의 문제점을 지적하며, “AMD ‘Strix Halo’ APU를 탑재한 본사의 ‘EVO-X2’ 미니 PC야말로 ‘토큰 생성 속도와 응답’ 시간 측면에서 한층 성능이 우수하다”고 강조했다.
이 업체는 라마 3.3 70B, Qwen3 Coder, 오픈AI의 GPT-OSS 20B, Qwen3 0.6B와 같은 오픈소스 모델을 사용, 테스트했다. 그 결과는 두 제품이 거의 비슷하거나, 한 종목에서 AMD가 약간 앞서는 결과가 나왔다.
예를 들어 라마 3.3 70B를 사용한 경우 생성 속도는 AMD, 첫 토큰 응답 시간(초)은 엔비디아가 우세했다. Qwen3 Coder를 사용한 경우 생성 속도는 엔비디아, 첫 토큰 응답 시간은 AMD가 더 나았다. 오픈AI GPT-OSS 20B를 사용한 결과는 생성 속도와 첫 토큰 응답 시간 모두 AMD가 우수했다. Qwen3 0.6B 모델을 사용한 경우는 생성 속도에서 엔비디아, 첫 토큰 응답 시간(초)에선 AMD가 우수한 것으로 나타났다. 가격 대비 성능을 따져보면 결국은 AMD가 한 발 앞서는 셈이다.
4가지 오픈소스 모델로 테스트, “AMD 판정승”
또 ‘Strix Halo’ 프로세서, 특히 AMD의 라이젠 Al Max+ 395는 대용량 매개변수 모델에서 엔비디아 GB10 칩보다 우수한 성능을 보였다. 반면엔 Qwen3 0.6B와 같은 모델의 경우는 그 차이가 줄어들었다. 이는 즉, 첫 토큰 응답 시간 측면에서 AMD가 대부분 확실한 우위를 점하고 있음을 보여주는 것이다. 또 “CPU+GPU+NPU 레이아웃이 출력을 시작하면 지연 시간을 단축하고, XDNA 2 엔진이 뛰어난 AI 성능을 제공하기 때문”이란 해석이다.
엔비디아가 우위를 점한 대목에선 “테스트 중인 모델이 메모리 지연 시간보다 처리량을 어떻게 선호하는지”가 관건이 되었다. ‘DGX Spark’는 “높은 처리량과 대용량 모델”을 원하는 소비자에겐 이상적인 제품임은 의심의 여지가 없다. GB10 슈퍼칩이 FP4에서 무려 1 PFLOP를 선보이기 때문이다.
“하지만 AMD 플랫폼 전반의 실시간 추론 워크로드에서는 훨씬 저렴한 비용으로 (엔비디아와) ‘유사한’ 성능을 제공하며, 특히 지연 시간에 민감한 워크로드의 경우 더욱 그렇다”는 설명이다.
특히 가격경쟁력 측면에선 비교가 안 된다. ‘Strix Halo’ 최상위 모델(128GB + 2TB)이 2,199달러인 반면, ‘DGX Spark’는 4,000달러에 판매된다. 사전 주문할 경우 더 높은 가격에 판매되고 있다. 이는 “‘Strix Halo’와 GB10의 가격 대비 성능 차이가 엄청남을 보여준다”는게 제조사의 주장이다.