구글 클라우드, 맞춤형 AI가속기로 ‘다용도의 쉽고 확장 가능한 클라우드’
MS, 생성AI와 클라우드 솔루션 가동, 각국 파트너 기업 AI혁신 가속화 지원
[애플경제 전윤미 기자] 생성AI가 발달하면서 빅테크 클라우드 시장에도 큰 변화가 예고되고 있다.
특히 선두를 달리고 있는 AWS와 그 뒤를 좇고 있는 MS, 이들 두 선발주자들에게 상대적으로 뒤진 구글 클라우드가 심상찮은 움직임을 보이고 있다. 클라우드 생태계에 AI를 접목, 현상 변화를 적극 꾀하고 있는 모양새다.
구글 클라우드는 최근 자체 개발한 AI용 반도체로 비용 절감과, 범용성, 확장성 등을 꾀하고 있다. R&D 리서치 사이트인 IT FIND 등에 따르면 우선 구글은 맞춤형 AI 가속기를 접목, 사용하기 쉽고 다용도의 확장 가능한 클라우드를 시도하며, AWS, MS 애저에 대한 추격에 본격 나서고 있다.
구글, 클라우드 TPU v5e로 최적 효율성
단일 클라우드 TPU(Tensor Processing Unit) 플랫폼을 통해 대규모 AI 훈련과 추론을 모두 실행하고 있다. 클라우드 TPU v5e는 수만 개의 칩으로 확장 가능하며 최적의 효율성을 기할 수 있다. 이는 클라우드 TPU v4e와 비교해 단위 비용당 훈련 성능이 최대 2배에 달하며, 추론 성능은 최대 2.5배에 달하는 것으로 알려졌다.
구글 클라우드는 또 AI 반도체를 통해 가장 까다로운 필수 AI/ML 워크로드에 필요한 멀티 클러스터의 수평적 확장을 기하고 있다. 사용자들은 이를 통해 생산성을 45% 늘리고, 소프트웨어 배포 시간이 70%나 단축된다. 또한 자동확장, 워크로드 오케스트레이션, 자동업그레이드 등의 기능이 클라우드 TPU v5e와 함께 제공된다.
구글은 또 오는 10월 중에 엔비디아 AI 반도체 H100을 탑재한 AI 훈련용 가상머신을 출시한다. 이는 구글이 맞춤 설계한 200기가바이트(Gbps) 인프라 처리 장치(IPU)를 엔비디아 H100과 결합한 슈퍼컴퓨터다. 또 A3는 고성능 네트워킹이나 기능 고도화를 통해 까다로운 생성AI나 대규모 언어모델(LLM)을 구현할 수 있도록 설계되어 있다.
이는 “A2 시스템보다 3배나 기능이 향상된 최대 26엑사플롭(EP)의 AI 성능과, 맞춤형 IPU을 갖추고 있다”면서 “그로 인해 최대 10배나 더 많은 네트워크 대역폭을 제공할 수 있다”고 밝혔다.
워크로드에 최적화된 클라우드 컴퓨팅
구글은 또 워크로드에 최적화된 클라우드 컴퓨팅을 위한 강력한 기반을 구축하고 있다. 즉, 워크로드 최적화 방식을 통해 인프라를 구축하고, 전용 하드웨어와 소프트웨어 구성 요소를 결합, 계속 증가하는 워크로드 요구사항을 충족시킨 것이다.
구글 클라우드는 또 에지나 데이터센터에서 워크로드를 실행하고자 하는 기업의 고유한 요구사항을 충족할 수 있도록 설계되었다. 차세대 하드웨어와 신규 보안 기능 외에도 버텍스 AI 통합과 함께, GDC 호스티드(Hosted)에서 알로이DB옴니(AlloyDB Omni)의 새로운 관리형 서비스를 제공한다. 즉 “AI를 에지에 구현하기 위해 GDC 포트폴리오를 강화한 것”이다.
구글 클라우드는 특히 ‘크로스-클라우드 네트워크’가 비장의 무기다. 이는 고객이 클라우드 환경 전반에서 애플리케이션을 연결하고 보호할 수 있도록 지원하는 글로벌 네트워킹 플랫폼이다. 개방형으로서 워크로드에 최적화되어 있으며, 제로트러스트를 구현하는 ML 기반 보안을 제공한다. 고객이 어느 클라우드 환경에서든 구글 서비스에 보다 쉽게 접근할 수 있도록 설계되었고, 네트워크 지연 시간을 최대 35%나 단축시켰다.
MS, 생성AI 기반 클라우드 솔루션 적극 보급
이에 맞서 역시 세계 클라우드 업계 2위인 마이크로소프트(MS)는 구글을 뿌리치고, AWS를 따라잡기 위해 다양한 노력을 기울이고 있다.
역시 생성형 AI와 클라우드 솔루션을 가동하는 한편, 각국의 파트너 기업과 고객에 대한 AI 혁신을 가속화하고 있다.
예를 들어 다국적 회계 및 컨설팅 기업, KPMG에게 MS 클라우드 및 애저 오픈AI 서비스 (Azure OpenAI Service) 등 AI 기술을 제공하고 있다. PWC에 대해서도 애저 오픈AI 서비스를 활용한 AI 역량을 제공한다. 데이터 플랫폼 전문기업, 스플렁크가 애저에서 클라우드 솔루션 시스템을 구축, 유연하게 AI 보안 솔루션을 배포할 수 있도록 했다.
LG CNS와도 전략적 협업을 통해 생성형 AI 서비스와 솔루션을 개발하고 있다.
MS는 금융․의료 산업에도 적극 진출하고 있다. 신용평가기업 무디스(Moody’s)는 자사의 데이터 및 분석 기능과 애저 오픈AI 서비스를 결합, 기업 인텔리전스와 리스크 평가에 대한 인사이트를 강화하고 있다. 헬스케어 소프트웨어 기업 에픽(Epic)은 뉘앙스(Nuance)의 ‘닥스 익스프레스(DAX Express)’ 솔루션을 탑재한 전자 건강 기록(EHR: Electronic Health Record) 시스템을 구축하고 있다.
특히 에픽의 경우 ‘에픽 모듈’ 내에서 AI 기반의 임상 인사이트와 관리 도구에 대한 보안 액세스를 확대, 효율적인 운영을 지속하고 있다. 또한 긴급 인력 배치, 재정, 임상 액세스 등 헬스케어 시스템이 직면한 문제를 해결하기 위해 ‘코파일럿(Copilot) 솔루션’을 적용하고 있다.
금융․모빌리티, 의료 등의 AI 혁신 견인
이 밖에 메르세데츠-벤츠도 생성 AI가 적용된 깃허브 코파일럿(GitHub Copilot)을 제공, 개발자 역량을 강화하고 전체 소프트웨어 개발 프로세스를 혁신하고 있다. 제너럴모터스(GM) 역시 해당 기술을 활용해 개발 도구 체인을 재구상하고, 안전한 환경에서 코드를 생성하고 있다.
타이어 제조 전문 업체 굿이어(Goodyear)는 마이크로소프트 365 코파일럿(Microsoft 6365 Copilot)을 통해 생산성을 높이고 있다. 카맥스(CarMax)는 애저 오픈AI 서비스와 대형언어모델(LLM)을 활용해 웹사이트에 대한 고객 트래픽을 높이고, 수익 창출과 비용 절감 효과창출하고 있다.
