데이터센터 신·증설 필요없이 하나로 묶어 엄청난 ‘컴퓨팅 파워’
‘스펙트럼-XGS’ 이더넷 기술로 매머드급 ‘기가 클러스터’ 구축
광융합 ‘실리콘 포토닉스 네트워크 스위치’도 출시, 관련 분야 장악?
[애플경제 엄정원 기자] 데이터센터를 짓거나 확장하는 것은 여간 힘든 일이 아니다. 이미 가동 중인 기존 데이터센터의 컴퓨팅 용량을 증설하는 것 역시 간단한 문제가 아니다. 엄청난 비용과 함께 주변 환경에 미치는 영향 등을 두루 고려해야 한다.
데이터센터 비용, 리스크 해소
그러나 최근엔 엔비디아가 이런 애로 사항을 해결할 수 있는 기술(스펙트럼-XGS, pectrum-XGS)를 출시, 주목을 받고 있다. 이를 적용하면 많은 비용과 리스크를 부담하며, 데이터센터를 확장하거나 증설할 필요가 없다. 대시에 여러 데이터센터를 연결, 하나의 거대한 ‘기가 클러스터’로 통합, 지금껏 전례가 없는 엄청난 컴퓨팅 파워를 구축한다는 설명이다.
그저 아키텍처 발전을 통해 AI 컴퓨팅 파워를 확장하는 것은 결코 바람직한 대책이 아니란게 대다수 전문가들의 공통된 생각이다. 이런 방식은 얼마 안가 언젠가는 한계에 부딪히기 마련이다. 바로 이런 점을 감안해 엔비디아는 ‘스펙트럼-XGS’ 기술을 개발했다.
그렇게 되면 대형 데이터센터를 여러 곳에 지을 필요가 없다. 각지에 흩어져있는 기존 데이터센터를 통합된 기가 규모의 AI 슈퍼팩토리로 구축할 수 있다.
앞서 엔비디아는 이미 강력한 AI GPU를 상호 연결, 그 기능을 극대화하는 기술을 선보인 바 있다. 이번엔 이를 더욱 발전시켜, 아예 여러 데이터센터를 연결, 대규모 컴퓨팅 파워를 제공하는 솔루션을 공개한 것이다.
문제의 ‘스펙트럼-XGS’ 이더넷 기술은 AI 클러스터를 위해 설계된 강력한 인터 커넥트(Inter Connect) 기술이다. 이 기술만 있으면 굳이 무리를 해서 새로 데이터센터를 짓거나, 기존 시설을 늘릴 필요가 없다.
여러 AI 클러스터 상호 연결, 엄청난 ‘AI 성능’
‘스펙트럼-XGS’는 단일한 데이터센터 확장이 갖는 단점이나 제약을 극복할 수 있다. 특히 데이터센터를 신설하는데 필요한 넒은 부지나 시설이 필요없게 된다. 한 군데 시설에서 대규모 시스템을 냉각하는 데 드는 비용 문제를 해결한다. 여러 AI 클러스터를 상호 연결함으로써 엄청난 AI 성능을 기할 수 있다.
특히 ‘스펙트럼-XGS’ 이더넷의 백미는 ‘스케일 어크로스 투 스케일 업&스케일 아웃’ 기능이다. 이를 통해 공간을 뛰어넘어 거의 광범위하게 기능을 확장할 수 있다. 이를 추가하면, 모든 도시나, 국가, 대륙에 걸쳐 있는 데이터센터를 하나의 거대한 기가급 AI 슈퍼팩토리로 연결, 구출할 수 있게 되는 것이다.
‘스펙트럼-XGS’는 엔비디아의 최초 스펙트럼 기술에서 파생된 것이다. AI 컴퓨팅의 기반이 되는 기술이기도 하다. 엔비디아 블로그 게시물에 따르면, ‘스펙트럼-XGS’는 여러 GPU 노드를 상호 연결하는 유사한 구현 방식인 NCCL보다 훨씬 뛰어나다. 그 보다 최소 2배 이상의 성능을 자랑한다는 얘기다.
더욱 중요한 것은, 이 기술에는 자동 조정 원격 혼잡 제어 기술과, 지연 시간 관리와 같은 기능이 포함되어 있다는 점이다. 즉, 상호 연결된 데이터센터 간의 거리가 멀어도 성능이 결코 떨어지지 않는다는 의미다.
데이터센터 전문 코어위브사 최초 도입, 상용화
이 기술은 최근 코어위브사가 가장 먼저 도입해 관심을 끈다. 글로벌 AI데이터센터 전문업체로서, 가장 먼저 그 필요성을 느낀 셈이다. 코어위브는 자사의 대형 데이터센터들을 ‘스펙트럼-XGS’ 이더넷과 통합하는 최초의 기업이 되었다.
사측은 “이를 통해 데이터센터 산업 분야에서 획기적인 발전을 가속화할 것”이라고 기대하고 있다. 이전에는 결코 불가능했던 수준의 매머드급 컴퓨팅을 실현할 수 있게 될 것이란 얘기다.
한편 엔비디아는 “앞으로 ‘실리콘 포토닉스 네트워크 스위치’와 같은 기술이 완성되어 출시되면 상호 연결 메커니즘이 새로운 차원으로 도약할 것”이라고 이 분야 선두 주자로서 의욕을 보였다. 이는 전자 회로와 광통신 기술을 대규모로 융합한 네트워킹 솔루션이다.
