클라우드 통해 AI 슈퍼컴퓨팅 기반 훈련 모델, 대량으로 보급
엔비디아 ‘AI 2023용 엔비디아 DGX 클라우드’가 대표적

 엔비디아 ‘AI 서비스형 훈련 모델’ 이미지. (출처=엔비디아)
 엔비디아 ‘AI 서비스형 훈련 모델’ 이미지. (출처=엔비디아)

[애플경제 김향자 기자] 생성AI가 출현한 이후 IT업계에선 이를 활용한 AI모델이나 파운데이션 모델 개발 붐이 일고 있다. 그런 가운데 이들 개발업체들을 고객으로 겨냥한 ‘AT a a S’(AI Training as-a-Service)’도 등장하고 있다.

글로벌 기업 엔비디아(NVDIA)가 자체 DGX 클라우드를 통해 이같은 AI 슈퍼컴퓨팅 기반의 AI의 서비스형 훈련 모델을 대량으로 보급하고 있는 사례가 대표적이다.

특히 스타트업들은 AI 기반의 혁신적인 제품과 비즈니스 모델을 만들기 위해 경쟁하고 있다. ‘DGX 클라우드’는 이같은 소비자들에게 글로벌 규모의 클라우드를 통해 엔비디아 AI 슈퍼 컴퓨팅에 즉각적으로 접근할 수 있게 한다.

DGX 클라우드 인프라는 생성AI 모델을 훈련하는데 적합한 슈퍼 컴퓨팅 하드웨어에 필요한 ‘스페이스’를 기업 등에 임대할 수 있다. 이는 현재까지론 최고의 ‘AT a a S’으로 평가받고 있으며, 단지 같은 엔비디아의 DGX 서버에 버금가는 성능이다.

엔비디아 HW 원격 엑세스 버전 'DGX 클라우드'

DGX 클라우드는 오라클 클라우드 인프라의 수천 개 엔비디아 GPU를 포함한 엔비디아 하드웨어의 원격 액세스 버전이다.

DGX AI 시스템은 챗GPT가 애초부터 훈련시킨 하드웨어다. 이에 엔비디아는 생성 AI 모델을 개발하기를 원하는 기업들에게 안성맞춤의 제품을 공급할 역량을 갖추고 있는 셈이다. 본래부터 챗GPT를 훈련시킬 때, 마이크로소프트는 필요한 전력을 얻기 위해 수만 개의 엔비디아의 A100 그래픽 칩을 함께 연결했다. 이제 엔비디아는 AI 훈련을 서비스로 제공함으로써 그 과정을 훨씬 더 쉽게 만들고 있다.

엔비디아 측은 “자연어 처리와 AI 챗봇을 활용한 제약사, 제조사, 금융기관 등이 DGX 클라우드의 기존 고객 중 하나”라고 ‘테크리퍼블릭’에 밝혔다.

DGX AI 클라우드의 특장점

DGX Cloud for AI 플랫폼은 나름의 특장점을 지니고 있다. 이는 상호 연결된 시스템의 클러스터 전반에 걸쳐 워크로드를 확장할 수 있는 고성능, 낮은 지연 시간로, 그리고 여러 인스턴스를 모두 하나의 GPU의 일부인 것처럼 수행할 수 있다.

AI개발업체들은 이를 통해 8개의 NVIDIA 80GB 텐서 코어 GPU 공간을 임대, 웹 브라우저에서 액세스할 수 있는 노드당 640GB의 GPU 메모리를 획득할 수 있다. 고객 업체들은 NVIDIA의 사용자 인터베이스(B.C.P, Base Command Platform) 소프트웨어 대시보드를 통해 워크로드를 관리하고 모니터링할 수 있다.

엔비디아는 “DGX 클라우드 사용자 인터페이스(B.C.P)를 통해 고객기업은 AI개발을 위한 별도의 기본 인프라 구축에 대한 걱정 없이 모델 개발을 신속하게 실행하고 관리할 수 있다”고 밝혔다.

기업들은 이 플랫폼의 소프트웨어인 ‘NVIDIA AI Enterprise’를 사용할 수 있다. 이는 100개 이상의 종단 간 AI 프레임워크와 사전 훈련된 모델의 라이브러리를 제공하여, 운영 AI의 개발과 배치를 비교적 간단하게 만든다.

즉, “기존 컴퓨팅이 전용 리소스를 많이 제공하지 않기 때문에 이미 DGX 클라우드를 사용하는 고객들은 다시 이를 재구매하고 있다”는 엔비디아 측의 설명이다.

생성 AI가 더 보편화됨에 따라, GPT-4와 같은 검증된 공개적 생성AI는 물론, 자신들만의 데이터를 통해 독자적인 활용법을 개발할 수 있는 개인 인스턴스에 이르기까지 AI 사용 방식이 크게 변화되고 있다.

엔비디아는 이같은 추세를 겨냥하며 DX 클라우드를 통한 ‘AT a a S’를 공급하고 있다. “엔비디아 DGX 클라우드는 거의 실시간의 액세스와 함께, 새로운 AI 슈퍼 컴퓨팅 리소스 풀을 제공하고 있다”는 얘기다.

저작권자 © 애플경제 무단전재 및 재배포 금지