클라우드로 가상화된 GPU 공급, 비용절감, 효율적 이용
탄력적 ‘온디맨드’, GPU자원 확장, 보안·안정성, “운영·유지관리도 부담없어”
글로벌 GPUaaS 시장 급팽창, 국내서도 대기업 중심 급성장 중
[애플경제 이윤순 기자] AI 연구 개발이나 게임의 핵심 요소인 GPU는 날로 ‘귀하신 몸’이 되고 있다. 특히 엔비디아 블랙웰의 라인업인 RTX50시리즈는 출시 직후부터 재고 부족이나, 성능 하자 등으로 제때 공급이 안되고 있다. 이런 현상은 AI붐이 가속화될수록 더욱 심해지고 있다. 이에 최근엔 아예 클라우드 환경에서 GPU(정확히는 GPU의 기능)를 잠시 빌려쓸 수 있는 GPUaaS(GPU as a Service)가 확산되고 있다.
이는 비용을 절감하고, 용도와 필요에 따라 선택하는 등 장점이 많아서 많은 기업들이 이를 선호하고 있다. 클라우드 서비스 제공업체(CSP) 중엔 이를 위해 GPU를 가상화해 사용자에게 제공하고 있다. 구하기 힘든 GPU이지만, GPUaaS를 이용하면 비록 실물은 아니지만, 사용자가 필요한 만큼의 ‘GPU 자원’만을 빌려 쓸 수 있다. 비용은 사용한 만큼만 지불하면 된다. 이를 통해 실물 GPU와 다름없이 각종 시뮬레이션이나 데이터 분석, AI 학습 등 고난도의 다양한 용도에 이를 한결 자유롭게 사용할 수 있다.
GPUaaS, “실물과 다름없는 장점 많아”
이에 관해 최근 보고서를 공개한 한상기 테크프론티어 대표는 “GPUaaS 서비스는 AI 분야 뿐 아니라, 과학 시뮬레이션 등 고성능 컴퓨팅(HPC), 그래픽 렌더링, 블록체인 등의 영역에서도 활용성이 높다.”며 나름의 GPUaaS의 효용을 강조해 주목을 끈다.
이에 따르면 GPUaaS는 ‘온디맨드’ 수요, 즉 사용자 필요에 따라 GPU 리소스를 탄력적으로 할당받거나, 자유롭게 해제할 수 있다. 기업들로선 특히 사용량이 불규칙하거나 변동이 심한 워크로드에 맞춰 사용할 수도 있어 좋다. 이에 GPUaaS 제공업체는 다양한 성능의 GPU 모델과 종류를 제공할 수 있다. 기업 고객들이 자체 요구사항에 맞는 최적의 조건을 선택할 수 있도록 하는 것이다.
앞서 언급했듯이, GPUaaS는 필요에 따라 GPU 리소스를 손쉽게 확장하거나 축소할 수 있다. 갑작스럽게 회사의 작업가 업무량이 늘어나거나, 반대로 줄어들 때도 탄력적으로 대응할 수 있다. 이처럼 필요한 만큼만 GPU 리소스를 사용하고, 사용한 만큼만 비용을 지불하다보니, 비용을 절감할 수 있다. 특히 중소기업으로선 초기 투자 비용을 절감하고, 총소유비용(TCO)을 낮출 수도 있다.
또한 운영이나 유지 관리 측면에서도 장점이 많다. 하드웨어 관리나 드라이버 업데이트, 보안 패치 등의 운영을 클라우드 제공업체가 맡아한다. 덕분에 사용자, 특히 개발자는 애플리케이션 개발에만 집중할 수 있다. 이는 또한 다양한 소프트웨어나 프레임워크를 처리할 수 있다. 예컨대 딥러닝, 머신러닝, 고성능 컴퓨팅, 그래픽 렌더링 등의 소프트웨어 및 프레임워크를 처리할 수 있다.
특히 보안이나 안정성에서도 한결 낫다. 보통 클라우드 제공업체들은 나름대로 믿을만한 클라우드 보안 인프라와 안정적인 운영을 책임지고 있다. 또한 개발자들은 비교적 익숙한 인터페이스, 즉 ‘RESTful API나 다양한 프로그래밍 언어용 SDK를 통해 손쉽게 GPU 리소스를 프로비저닝하고 관리할 수 있다. 예를 들어 도커나 쿠버네티스와 같은 컨테이너 오케스트레이션 도구와 통합하거나, 클라우드 네이티브 애플리케이션과 원활하게 연동할 수도 있다.
GPUaaS 선택 요소...국내외 시장 급속히 발전
다만 이런 장점을 충분히 살리기 위해선 GPUaaS의 컴퓨팅 파워나, 메모리 용량과 대역폭 등 성능을 가장 먼저 살펴봐야 한다. 또 과연 얼마나 비용을 효율적으로 절감할 수 있는지, 가성비는 어떤지 등도 면밀히 분석해야 한다. 특히 GPU리소스를 얼마나 탄력적으로 이용할 수 있는지, 그리고 다중 GPU 지원도 가능한지 등도 선택 조건이다. 이 밖에 프레임워크나 개발 도구와의 호환성 등도 중요하다.
현재 글로벌 리서치 기업인 스카이퀘스트(SkyQuest)에 따르면 세계의 GPUaaS 시장은 지난 2022년 50억 달러에 달할 만큼 크게 성장했다. 앞으로 2024년부터 2031년까지는 매년 32%로 성장, 2023년 66억 달러에서 2031년엔 무려 9배 가량인 608억 3,000만 달러로 성장할 것으로 보인다.
‘포춘 비즈니스 인사이트’도 2024년 43억 달러 시장에서 2032년엔 12배 가량인 498억 달러 시장으로 연평균 35.8% 성장할 것으로 보고 있다.
실제로 AWS, 마이크로소프트, 구글 클라우드 등 세계 클라우드 ‘빅3’를 비롯한 많은 빅테크들도 다양한 형태의 GPUaaS를 공급하고 있다. 비단 이들 뿐 아니라, 명망있는 중견 혹은 중소기업들도 이 사업을 본격화하고 있다.
특히 세계적으로 유명한 전문 GPUaaS 사업자들도 많다. 디지털오션/페이퍼스페이스, 람다 랩스, 코어위브, 배스트(Vast.ai), 하이퍼볼릭, 키네시스, 런포드 등은 여느 빅테크 못지않은 양질의 GPUaaS를 제공하고 있다. 이들은 약정 기간, GPU 개수와 메모리, 선불형의 과금 형태 등에 따라 각기 다양한 가격을 탄력적으로 책정하고 있다.
국내에서도 주요 대기업을 중심으로 GPUaaS 사업이 본격화되고 있다. SK텔레콤(SKT)이 미국의 람다와 손잡고 2023년 12월부터 GPUaaS를 제공하며, 이 분야 선두를 달리고 있다. 삼성SDS도 엔비디아 GPU 기반의 서비스를 하고 있다. 카카오엔터프라이즈도 국내 주요 MSP와 협력을 확대, 사업을 본격화하고 있다.
현재 알려지기론 SKT는 3년 내 수천 대의 GPU를 확보할 예정이고, 최신 GPU H200도 도입할 계획이다. 이에 비해 카카오엔터프라이즈는 A100 위주의 사업을 진행하고 있다.
