자오신, 96코어 x86 CPU 칩렛 설계, AMD EPYC나 인텔 제온 겨냥
‘카이셩 KH-50000’, 프로세서당 칩렛 13개, 384개 마더보드 코어
96코어 AMD EPYC 9004와 동일 성능? “中 기념비적 CPU 기술”
[애플경제 전윤미 기자] 중국의 칩렛 전략은 대규모 코어와 효율적 생산이다. 그러나 이런 전략이 여의치 않음에도 불구, 최근 중국의 팹리스 업계에선 96코어 x86 CPU를 설계, AMD EPYC 및 인텔 제온에 도전했다. 이는 프로세서당 13개의 칩렛으로 단일 마더보드에서 최대 384개의 코어를 제공하지만, 전력 소비량은 공개되지 않았다.
복수 칩렛 구조로 ‘결함 코어 재활용, 수율 극대화’
이같은 복수 칩렛 구조는 결함 있는 코어를 재활용하거나, 각 칩렛의 생산 수율을 높여 전체 수율을 극대화할 수 있다는게 장점이다. 이를 설계한 중국의 대표적 팹리스 업체인 자오신(Zhaoxin)은 이 점을 AMD Ryzen과 EPYC, 그리고 Intel Xeon과의 경쟁에서 핵심적인 차별화 요소로 간주한 것이다.
탐스하드웨어 등에 따르면 자오신은 최고의 게임용 CPU라곤 할 수 없지만, 중국을 대표하는 팹리스 반도체 기업으로서 매우 강력한 서버 칩을 출시할 것으로 보인다. 이 회사가 공개한 차세대 카이셩(Kaisheng) KH-50000 프로세서가 대표적이다.
KH-50000은 자오신이 자체 개발한 ‘센추리 애비뉴’(Century Avenue) 아키텍처를 사용한 것이다. 현재 주력 제품인 KaiXian KX-7000 프로세서에도 ‘Century Avenue’ 아키텍처를 사용하고 있다. 따라서 최신 서버 프로세서를 해당 아키텍처에 맞춰 개발하는 것은 당연한 수순으로 보인다.
이 회사는 KH-50000에 AMD의 Ryzen 및 EPYC 프로세서와 유사한 칩렛 설계를 적용했다. 그러나 코어 수가 많은 EPYC 프로세서에 더 중점을 두고 있다. 칩렛 설계를 통해 자오신은 KH-50000의 코어 한계를 뛰어넘어 최대 96코어를 탑재한 AMD EPYC 9004(코드명 제노아) 시리즈와 사실상 동일한 성능을 낼 수 있게 될 것으로 기대하고 있다.
KH-50000은 두 가지 변형 모델이 출시될 것으로 예상된다. 플래그십 96코어 SKU와 더 저렴한 72코어 SKU가 있다. 두 모델 모두 동시 멀티스레딩(SMT) 기능이 없다. KH-50000은 기존 KH-40000보다 코어가 3배 더 많은 것으로 알려졌다. 익스트림테크는 이를 두고 “자오신과 중국 CPU 기술로선 기념비적 도약”이라고 해석하기도 한다.
KH-50000 클럭 속도 “보통의 서버 칩 수준”
자오신이 공개한 KH-50000 사진을 보면, 칩셋 레이아웃이 AMD와는 미세한 차이를 보인다. 그러나 코어 디자인은 변함없이 일관성을 유지하고 있음을 알 수 있다. 거대한 I/O 다이는 프로세서 중앙에 위치하며, 4개의 컴퓨트 다이 클러스터로 둘러싸여 있다. 각 클러스터는 3개의 컴퓨트 다이로 구성되어 총 12개에 달한다. 각 다이는 8개의 코어와 32MB의 L3 캐시를 포함한다. 조립 후 최종 프로세서는 384MB의 L3 캐시를 갖춘 96코어 구성으로 구성되어있다.
KH-50000의 클럭 속도는 그다지 나쁘지 않으며 보통의 서버 칩에서 기대하는 수준이란 평가가 지배적이다. 96코어 모델은 2.2GHz의 기본 클럭과 3.0GHz의 부스트 클럭에 달한다. 72코어 칩은 코어 수가 적기 때문에 기본 클럭을 2.6GHz로 높일 수 있지만, 부스트 클럭을 동일하게 유지할 것으로 보인다.
이번엔 KH-50000의 출시를 공개했지만, 곧 출시될 서버 칩의 TDP나 기타 전력 측정 기준은 공개하지 않았다. 칩렛 설계의 장점은 KH-50000에 이 회사의 기존 공정 노드를 효과적으로 활용할 수 있다는 것이다. “전력 소비에 신경 쓰지 않는다면 (미국의 대중) 제재는 큰 문제가 되지 않는다”는 해석이다.
이에 비해 AMD는 전통적으로 최고급 EPYC 칩을 300~350W 범위에 두었다. 이는 SMT(표면실장기술)를 적용한 경우다. 그럼에도 불구하고, AMD는 최근 전력 한계를 500W로 끌어올렸는데, EPYC 프로세서가 최대 192코어에 불과하다는 점을 고려하면 당연한 결과로 해석된다.
자오신으로선 코어 수 외에도 KH-50000을 통해 중국 서버 프로세서 개발을 촉진할 수도 있다. 최대 12채널의 DDR5-5200 RAM을 지원함으로써 최대 3TB의 메모리를 사용할 수 있다. 이는 KH-40000의 DDR4-3200이 2TB에 그친 것과 대조적이다. 자오신은 또 CXL(Compute Express Link) 상호 연결 기능을 추가했다. 또한, KH-50000의 확장된 기능도 눈길을 끈다. 즉 “KH-40000의 128개 PCIe 3.0 레인에 비해, 이는 128개의 PCIe 5.0 레인과 16개의 PCIe 4.0 레인으로 업그레이드되었다”는 설명이다.
中 암호화 표준 충족, 최신 EPYC 칩과 같은 크기
KH-50000은 KH-40000에 비해 (빠른 데이터 전송을 위한) 사타(SATA) 및 USB 포트 수는 약간 감소했다. 그러나 KH-40000을 최신 USB 3.2 Gen 2 사양을 지원하도록 업그레이드했다는 점에서 의미가 있다.
KH-50000은 또 SSE4.2, AVX, AVX2를 포함한 x86 32비트와 64비트 명령어를 지원한다. 가상화 기능도 지원한다. 특히 중국의 보안 지침을 준수하기 위해 KH-50000은 중국 고유의 SM2, SM3, SM4 암호화 표준을 지원한다. 특히, KH-50000 아래에 내셔널 테크놀로지의 4세대 신뢰 컴퓨팅 칩(아마도 NS350)을 통합하기도 했다. 이 칩은 중국의 암호화 모듈 표준의 보안 요건을 충족하는 것으로, 국제 TPM 2.0(SPEC 1.59) 표준도 준수하는 것으로 알려졌다.
KH-50000의 크기는 72x76mm로 KH-40000보다 꽤 크다. 이는 SP5 소켓과 호환되는 AMD 제노아 및 베르가모 프로세서와 같은 크기다. 따라서 KH-50000의 크기는 AMD의 최신 EPYC 칩과 정확히 같은 크기라고 할 수 있다.
또한 KH-50000은 랜드 그리드 어레이(LGA) 디자인의 소켓에 장착되는데, 이는 핀이 프로세서가 아닌 마더보드에 위치한다는 것을 의미한다. 이는 또 AMD의 EPYC 및 인텔의 제온 칩처럼 확장성이 뛰어나다. 2S 및 4S 시스템을 지원하는데, 4S 시스템에서는 최대 384개의 코어를 탑재할 수 있다. 칩 간 통신을 위해선 자체 ZPI(Zhaoxin Processor Interconnect) 5.0을 개발하기도 했다.
모놀리식 설계 한계 극복, 효율과 가격 경쟁력 확보
자오신은 자체 블로그에서 “AI GPU와는 달리, 중국 기업들은 여전히 서버 칩을 큰 어려움 없이 확보할 수 있지만, 비용이 증가할 가능성이 있다.”면서 “그럼에도 불구하고 자오신은 국내 시장에서 상당한 진전을 이루고 있으며, KH-50000이 AMD나 인텔의 최신 서버 칩에 (필적하지 못하더라도) 성공을 거둘 것”이라고 밝혔다.
그러나 AMD EPYC와 Intel Xeon은 클라우드 서버 시장에서 이미 확고한 위상을 차지하고 있다. 이에 자오신 96코어 x86 CPU는 기존 모놀리식(통합형) 설계의 한계를 극복하고, 생산 효율과 가격 경쟁력을 동시에 확보하려는 전략적 선택으로 해석된다. 그 결과는 알 수 없지만, 이처럼 중국은 칩렛 설계 기술을 도입해 AMD EPYC, Intel Xeon과 직접 경쟁할 수 있는 고성능 x86 CPU 개발에 박차를 가하고 있다.
