엔비디아, “‘블랙웰’ 너머 ‘베라 루빈’ 시대” 선언

젠슨 황, GDC에서 공개 ‘내년 하반기 출시’, 기존 ‘블랙웰’보다 월등 ‘루빈’, ‘블랙웰’ 성능의 2배, 메모리 4배, ‘루빈 울트라’는 14배 성능 ‘블랙웰 울트라 GB300’도 함께 공개, “‘루빈’ 이후엔 ‘파인만” 예고도

2025-03-19     전윤미 기자
젠슨 황(사진 오른쪽 아래)이 GDC 무대에서 엔비디아 AI칩 로드 맵 이미지를 소개하고 있다. (이미지=엔비디아)

[애플경제 전윤미 기자] 수 개월 전부터 말로만 떠돌던 ‘루빈’ 칩(베라 루빈, Vera Rubin)이 마침내 그 모습을 드러냈다. 엔비디아 젠슨 황은 19일 GDC 기조연설에서 차세대 AI ‘슈퍼칩’인 ‘블랙웰 울트라 GB300’과 함께 ‘루빈’ 칩을 공개했다 함께 공개된. 블랙웰 울트라는 기존 블랙웰의 강화된 버전이다.

올해 하반기에 출시될 블랙웰 울트라 GB300, 내년 하반기에 출시될 ‘베라 루빈(Vera Rubin)’, 그리고 2027년 하반기에 출시될 ‘루빈 울트라’(Rubin Ultra) 등으로 업계 최강자의 입지를 확고히 굳힌다는 전략이다.

‘루빈 울트라’는 ‘루빈’ GPU 2개 연결

알려지기론 ‘루빈’은 블랙웰의 20페타플롭에서 50페타플롭의 FP4를 제공한다. ‘루빈 울트라’는 실제로 두 개의 ‘루빈’ GPU를 서로 연결한 칩이다. 이는 100페타플롭의 FP4에서 성능이 2배, 1TB에서선 메모리가 거의 4배에 달한다.

또 ‘루빈 울트라’의 전체 NVL576 랙은 “FP4 추론에서 15엑사플롭, FP8 트레이닝에서 5엑사플롭을 제공한다”고 주장했다. 엔비디아에 따르면 이는 올해 출시할 ‘블랙웰 울트라’ 랙 성능의 14배로 알려졌다.

올해 ‘블랙웰 울트라’는 엔비디아가 작년에 “새로운 AI 칩을 매년 생산하기 시작할 것”이라고 밝힌 것과 일맥상통한다. 그러나 “예상했던 것과 달리 블랙웰 울트라는 그다지 새로운 아키텍처가 아니디”는 평가도 따른다.

블랙웰 울트라 서버 이미지. (출처=엔비디아)

정작 이번에 스폿라이트를 받은 것은 ‘블랙웰 울트라’의 틀에서 한층 진화된 아키텍처인 ‘베라 루빈’이다. 해당 아키텍처의 전체 랙은 블랙웰 울트라보다 3.3배 더 높은 성능을 지닌 것으로 전해졌다.

그러나 와이어드 등 일부 매체는 “엔비디아는 ‘블랙웰 울트라’가 원래 블랙웰보다 얼마나 더 나은지를 확실히 보여주지 못하고 있다”는 평가도 내놓았다. 이를 의식한 듯 엔비디아는 기자들과의 사전 브리핑에서 “단일 ‘울트라’ 칩은 기존 블랙웰과 동일한 20페타플롭의 AI 성능을 제공하지만, 192GB가 아닌 288GB의 HBM3e 메모리를 제공한다”고 한층 우수함을 강조했다.

이에 따르면 블랙웰 울트라 DGX GB300 ‘Superpod’ 클러스터는 블랙웰 버전과 동일한 288개 CPU와, 576개 GPU, 11.5엑사플롭의 FP4 컴퓨팅을 제공한다. 다만 240TB가 아닌 300TB의 메모리를 제공한다.

데스크톱 컴퓨터 ‘DGX Station’도 공개

특히 엔비디아는 새로운 블랙웰 울트라를 자사의 신화적 상징인 2022년 칩인 H100과 비교했다. 이에 따르면 ‘울트라’는 FP4 추론 성능이 (H100보다) 1.5배 더 뛰어나다. 또한 NVL72 클러스터를 강조했다. 이는 H100의 1분30초와 달리 단 10초 만에 답변을 제공할 수 있는 ‘DeepSeek-R1’ 671B의 대화형 사본에 필적하는 ‘AI 추론’ 능력으로 가속화한 것이다. “초당 1,000개의 토큰을 처리함으로써 H100의 10배에 달한다”는 것이다.

엔비디아는 또한 ‘DGX Station’이라는 데스크톱 컴퓨터를 발표했다. 이 컴퓨터는 단일 GB300 블랙웰 울트라, 784GB의 통합 시스템 메모리, 내장 800Gbps 엔비디아 네트워킹, 20페타플롭의 AI 성능을 탑재했다. Asus, Dell, HP는 Boxx, Lambda, Supermicro와 함께 이 데스크톱 버전을 판매할 것으로 알려졌다.

젠슨 황이 새로 출시한 데스크 톱이 마더보드를 공개학 있다. (사진=엔비디아)

엔비디아는 또한 GB300 NVL72라는 단일 랙을 제공할 것으로 알려졌다. 이는 1.1엑사플롭의 FP4, 20TB의 HBM 메모리, 40TB의 빠른 메모리, 130TB/초의 NVLink 대역폭, 14.4TB/초의 네트워킹을 제공한다.

하지만 ‘Vera Rubin’과 ‘루빈 울트라’가 정작 2026년과 2027년에 출시될 즈음엔 그 성능이 한층 고도화될 것으로 예상된다.

엔비디아는 그 동안 이미 110억 달러 상당의 ‘블랙웰’을 출시했으며, 구글, 애플, MS, 메타 등 상위 4개 구매자만 2025년에 지금까지 180만 개의 Blackwell 칩을 구매했다.

오늘 열린 엔비디아 GPU 기술 컨퍼런스에서 설립자 겸 CEO인 젠슨 황은 “수요를 충족하기 위해선 작년 이맘때보다 100배 더 많은 것이 필요하다”면서 “2028년에 출시될 ‘베라 루빈’ 이후의 아키텍처는 ‘파인만’”이라고 공개했다. 이는 유명한 이론 물리학자 리처드 파인만의 이름을 따서 지은 것으로 보인다. 이번에도 그 선구적인 천문학자 베라 루빈의 이름을 딴 ‘베라 루빈’을 발표한 자리에 그의 가족 중 일부가 참석했던 것으로 알려졌다.