각국, 생성 AI솔루션 개발 홍수 속, 대형 모델링에 수많은 AI칩 수요
엔비디아 고급 GPU 등 “턱없이 공급 부족, 최대 6개월 이상 대기도”
전문가들 “생성AI 개발 ‘붐’ 지속되는 한 공급난 쉽게 해결안돼”

생성AI를 위한 고급 GPU 칩을 나타내는 이미지. (출처=엔비디아, 로이터통신, 월스트리트저널)
생성AI를 위한 고급 GPU 칩을 나타내는 이미지. (출처=엔비디아, 로이터통신, 월스트리트저널)

[애플경제 김향자 기자] 생성 AI가 붐을 일으키면서 이를 개발하거나 응용하기 위한 컴퓨팅이 폭주하는 바람에 전세계적인 AI칩 공급 부족으로 인한 혼란이 빚어지고 있다. 이로 인해 한켠에선 “생성AI 개발을 자제하고, 컴퓨팅 성능을 제한해야 한다”는 목소리까지 나오고 있다.

특히 AI 개발을 위한 그래픽 칩, 즉 GPU는 ‘챗GPT’ 선풍적인 인기를 끈 이후 폭주하는 수요를 공급이 제대로 뒷받침하지 못하고 있다. 그 바람에 엔비디아(NVDIA) 등 공급업체들의 주가는 크게 뛰었지만, 제대로 수요를 감당하지 못하는 상황이다.

AI개발, 운영 위한 대형 서버 용량도 태부족

이같은 상황에 대해 29일 ‘월스트리트 저널’(WSJ)은 “아마존, 마이크로소프트와 같은 클라우드 서비스 제공업체(CSP)도 오픈AI와 같은 클라이언트에 제공할 수 있는 컴퓨팅 처리 능력에 한계를 보이고 있다”면서 “특히 AI 개발업체들은 날로 복잡한 모델을 개발, 운영하면서 다른 회사의 AI 서비스 구축을 지원하기 위해 더욱 큰 서버 용량이 필요한 실정이어서 더욱 문제가 심각해지고 있다”고 지적했다.

이에 오픈AI의 CEO인 샘 앨트먼은 지난 16일 미 의회 청문회에서 “차라리 프로세서 병목 현상 때문에 챗GPT를 사용하는 사람이 줄어들면 더 좋겠다”고까지 술회했을 정도다.

매사에 자신만만한 일론 머스크조차 지난 23일 WSJ가 마련한 ‘전미 CEO 평의회 서밋’에서 “지금으로선 GPU는 마약보다 구하기가 어렵다”고 하소연했다. 물론 일론 머스크는 그 어떤 기업들, 특히 스타크업이나 중소기업에 비할 바는 아니다.

이른바 ‘특권’이라고 할까. 이미 GPU 대란의 조짐이 보이던 이달 초, 일부 스타트업들이 ‘오라클’ 측에 “컴퓨터 용량을 좀더 늘려줄 수 없느냐”고 요청했지만, “어떤 구매업체가 서버의 여유 공간 대부분을 휩쓸어갔다”는 대답이 돌아왔다. 나중에 알고보니 그 ‘어떤 구매업체’는 다름 아닌, ‘X.AI’로 이름붙여진 또 다른 생성AI를 개발하는 일론 머스크였다.

사진은 AI솔루션 개발에 필요한 레티스 반도체.
사진은 AI솔루션 개발에 필요한 AI반도체.(출처=한국레티스반도체)

“GTP-3.0 수준, 고급 AI칩 1만개 필요”

원본 텍스트를 정밀하게 분석, 생성할 수 있는 대규모 AI 모델을 훈련하기 위해선 수만 개의 고급 그래픽 칩이 필수적이다. 그러므로 이를 적시에 차질없이 공급받는 것이야말로 무엇보다 중요할 수 밖에 없다. 특히 엔비디아의 고급 그래픽 칩의 경우 대형 AI 모델링을 위한 대규모 연산 기능이 탁월해서 더욱 수요가 폭주하고 있다.

스위스 연방은행(UBS)의 일부 애널리스트들에 따르면 버전 3.0~3.5 수준의 챗GPT에 약 1만개의 엔비디아 그래픽 칩이 필요한 것으로 추정된다. 일론 머스크가 현재 개발 중인 X.AI의 경우는 한층 업데이트된 버전으로서, 그보다 고급 칩이 3~5배 더 필요할 것으로 예상된다.

그렇다보니 AI개발사나 투자자들, 그리고 스타트업들은 여분의 컴퓨팅 용량을 물색하기 위해 모든 네트워크를 샅샅이 뒤지고 있다. 또 다른 기업들은 AI 스타트업 간에 프로세서와 대규모 서버 용량을 주문, 공유하는 방안을 모색하기도 한다.

일부 AI 개발사들은 AI 모델을 할 수없이 축소하고 있으며, 칩 대란이 해결될 때까지 관련 그래픽 칩이 포함된 물리적 서버를 아예 구입하거나, MS 애저나 AWS 대신, 오라클 등과 같은 클라우드 제공업체로 전환하고 있는 모습도 잇따르고 있다.

블룸버그 통신도 이같은 AI칩 대란에 동의하면서 “엔비디아측은 폭주하는 수요를 충족시키기 위해 공급을 확대하고 있다고 밝혔지만, 많은 AI 스타트업들은 이런 칩 부족 현상이 적어도 내년까지 지속될 것으로 예상하고 있다”고 내다보기도 했다.

그 바람에 엔비디아는 이달 들어 주가가 무려 약 167%나 상승했다. 칩 가격도 천정부지로 뛰어올랐다. 엔비디아의 고급 AI칩의 일부 소매갸격은 약 3만3,000달러에 판매되고 있다.

오픈AI도 곤혹스런 처지, ‘뾰족한 해법’ 없어

그렇다보니 많은 서버 제조업체와 고객사들 중엔 엔비디아의 최신 그래픽 칩을 구입하기 위해 6개월 이상 기다려야 하는 경우도 속출하고 있다. 대표적인 글로벌 서버 제조업체 중 하나인 슈퍼마이크로사측은 “그래픽 칩을 중심으로 한 수주 물량이 역대 최고 수준으로, 이에 맞는 생산 능력을 조속히 증설하기 위해 서두르고 있다”고 블룸버그 통신에 밝혔다.

게다가 ‘IT프로포탈’은 “더욱이 첨단 칩의 2차 시장, 즉히 디지털 통화 시장의 호황기에 대규모 채굴을 하느라 칩을 대량으로 사들였다가, 이젠 시장이 침체된 처지인 암호화폐 회사들도 칩 물량 부족을 부추긴 셈”이라고 지적했다.

이같은 상황에서 생성AI 성능을 빨리 개선하지 않고 있다는 AI플랫폼 업체들의 불만도 오픈AI사에 쏟아지고 있다.

WSJ가 사례로 든 의사의 의료행위를 위한 AI 비서 개발업체인 미국의 ‘나블라’사가 대표적이다. 이 회사 관계자는 “본사 고객들은 AI를 사용하여 자동으로 임상 노트나, 추천서, 임상 추천서를 실시간 생성해 줄 것을 기대한다”면서 “그러나 실제 오픈AI의 소프트웨어는 질문에 응답하는 데 최대 2분이나 걸린다”고 개선을 촉구하고 있다.

이에 오픈AI사는 “최대 투자자이자 데이터 센터 제공업체인 마이크로소프트와 협력, 이 문제를 해결하기 위해 노력하고 있다”고 밝히곤 있으나, 사실상 현재로선 뾰족한 대책이 나오지 않고 있는 실정이다.

저작권자 © 애플경제 무단전재 및 재배포 금지