인재 넘쳐도 GPU·TPU·AI스토리지 등 인프라 부족, AI개발 한계
직접 개발·실행 부서에 AI인프라 집중 투입, 나머지 AI부서 ‘감원’
메타 사태 계기, AI인재들 “연구’와 ‘응용’ 결합 능력 중요” 인식
[애플경제 전윤미 기자] 의욕적으로 ‘AI 패권’ 경쟁에 뛰어든 메타가 갑자기 인공지능 연구 부서에서 수백 명의 직원을 해고하기로 결정하면서 기술 업계의 이목이 쏠리고 있다. ‘1억달러 연봉’까지 제시하며 인재 유치에 공을 들였던 태도와는 정반대다. 앞서 유통을 비롯한 다양한 직종에 걸쳐 전세계적으로 3만여명의 해고를 예고한 아마존과도 성격이 다르다.
이를 두고 시중에선 여러 추측과 분석이 오가고 있다. 최근 일부 외신을 통해 흘러나온 얘기에 따르면 문제의 근본 원인이 실적 부진이나 혁신 부족은 아닌 것으로 알려졌다. 그 보단 “풍부한 AI인프라의 부족과, 그로 인한 연산 능력의 한계”라는 얘기가 설득력을 얻고 있다. 이는 ‘메타’라는 특정 기업만이 문제가 아니다.
뛰어난 인재와 자금, 최고의 자원을 갖춘 기술 기업조차도 AI 혁명을 헤쳐나가는 데 직면한 어려움을 엿볼 수 있는 사례로 꼽힌다. 갈수록 컴퓨팅 파워나, 인재, 시장 우위를 차지하기 위한 경쟁이 치열해지고 있다. 그럴수록, 자원을 어디에 투자할지에 대한 엄격한 선택이 중요함을 보여주는 대목이다.
“똑똑한 사람뿐 아니라, 프로젝트 수행 인프라 중요”
이는 ‘AI 3대 강국’을 꿈꾸는 한국을 포함, AI경쟁에 올인하고 있는 모든 국가와 기업들이 특별히 주목해야 할 내용이다. 메타의 이번 구조 조정은 “성공적인 AI 연구에는 훌륭한 아이디어를 가진 똑똑한 사람들뿐만 아니라, 야심찬 프로젝트를 수행할 수 있는 인프라도 중요하다”는 사실을 여실히 보여준 셈이다.
페이스북의 기본 AI 연구팀인 ‘FAIR’에서 연구 과학자 책임자로 오래도록 메타에서 근무한 ‘티안 위안동’이 최근 ‘실리콘 밸리 101’과 가진 팟캐스트 인터뷰도 이를 뒷받침하고 있다. 그는 “AI 경쟁이 전 세계적으로 치열해짐에 따라 메타의 AI 연구 부서는 점점 더 불안정한 상황에 처했다”고 털어놓았다. 사실상 이는 사내 한정된 AI 인프라와 자원을 둔 여러 부서 간의 ‘갈등’을 암시하는 셈이다. 부서마다 꼭 필요한 인프라를 높고 서로 쟁탈전이 치열해진 것이다.
이런 연산 자원 부족은 메타 AI 연구 부서 내부에서 심각한 내부 갈등을 야기했다. 결국 한정된 자원과 인프라를 둔 그런 갈등은 부서 전체를 재편하는 결정으로 이어졌다. 그래서 “ 문제의 근본 원인이 실적 부진이나 혁신 부족보다는 훨씬 더 현실적인 데 있다”는 티안의 고백이다.
메타 AI 연구 부서, 연산 부족으로 내부 갈등과 해고 사태
AI 인프라는 AI 모델 학습과 실행을 위해 대규모 데이터를 처리·저장·분석하는 하드웨어나, 소프트웨어·네트워킹 리소스다. AI 작업에 최적화된 GPU·TPU·AI칩과 프레임워크·라이브러리·툴, 클라우드와 분산 컴퓨팅 환경 등이다. 특히 메타로선 GPU, TPU가 가장 중요한 요소다. 물론 메타는 AI 인프라 투자 비용 절감과 기술 자립을 위해 자체 칩 개발에 집중하고 있다. 2025년부터 자체 AI칩 ‘MTIA’를 본격 도입하고, 대규모 데이터센터를 구축할 계획이다. 이를 통해 엔비디아 의존도를 낮추는게 목적이다. 이 밖에 데이터 스토리지·데이터 관리·최적화 소프트웨어 등도 강화하기로 했다.
그러나 아직 이 정도론 메타가 목표한 ‘메타 AI’ 르네상스에 턱없이 부족하다. AI모델 구동의 효율성과 지속가능성, 최신 하드웨어로의 빠른 교체엔 못미친다는 지적이다.
챗GPT와 같은 대규모 언어 모델의 등장은 기술 기업들이 AI의 힘을 활용하는 방식을 극적으로 변화시켰고, 메타도 예외는 아니었다. 그러나 이러한 고수준 모델을 훈련하고 개발하려면 엄청난 연산 능력이 필요하다. 즉, GPU와 막강한 컴퓨팅 용량이다. 어떤 기업이든 이를 통해 충분한 연산 능력이 확보되어야 고도의 AI개발이 가능하다.
메타는 바로 그 점에서 기업 역량이 부족했고, 결국은 AI관련 부서의 인력감축을 시도하며, ‘인프라 수요’를 줄일 수 밖에 없는 처지가 된 것으로 보인다.
사실 이런 상황은 많은 AI 기업들이 직면하고 있다. 그러나 공개적으로 드러내놓고 논의되는 경우는 드문 현실이다. 그렇다보니 상당한 자원을 보유한 메타와 같은 거대 기술 기업조차도 AI 개발에 필요한 연산 능력 부족으로 어려움을 겪는게 상식이 되다시피한다.
이번 AI관련부서 인력 감축으로 인해 앞서 ‘티안’ 본인을 포함해 연구 부서에서 약 600명이 해고당했다. 이는 일회성 사건이 아니라, 이 회사의 전략적 방향 전환의 일환으로 받아들여직 있다. 그럼에도 이번 해고는 Meta가 AI 전략을 전환하고, 데이터 처리 기업을 인수하고, 경쟁사 AI 연구소에서 대대적으로 인력 스카웃을 벌인지 몇 달 만의 일이어서, 예외적 사건으로 주목받고 있다.
“AI개발 위해 ‘선택과 집중’방식 투자”
이같은 AI인프라 부족은 결국 ‘선택과 집중’ 방식의 특정 AI개발 부서에 자원 집약적인 지원 전략으로 돌아서게했다. 수백 명의 직원이 일자리를 잃었음에도 불구하고 메타가 새로 설립한 슈퍼인텔리전스 랩(SIL, Super Intelligence Lab)은 이런 구조조정 영향을 거의 받지 않았다. 이 부서는 세계 최대 규모의 데이터 레이블링 회사 중 하나인 ‘스케일 AI’의 CEO 겸 설립자였던 알렉산더 왕이 최근 메타의 최고 AI 책임자로 합류하면서 운영되고 있다.
SIL 지원에 집중하고, 다른 부서의 인력을 감축하기로 한 결정은 메타로선 AI인프라 부족을 타개하기 위한 가장 효율적 전략인 셈이다. 동일한 자원을 두고 경쟁하는 여러 개별 연구 프로젝트는 대거 포기했다. 대신 AI 개발에 대한 보다 집중적이고 중앙 집중화된 방식으로 투자하기로 한 것이다.
티안 역시 누구 못지않은 최고의 AI전문가다. 티안은 중국 상하이 교통대학교와 미국 카네기 멜론 대학교를 졸업한 AI 분야에서 높은 평가를 받는 인재다. 그의 연구 포트폴리오에는 오늘날 AI 분야에서 가장 주목받는 두 분야인 대규모 언어 모델과 강화 학습에 대한 광범위한 연구가 포함되어 있다. 그런 그가 해고 대상이 되었다는 점에서 메타는 현 상황을 ‘AI인프라’ 부족으로 인한 위기 상황으로 간주한 셈이다.
이번 메타의 “뜻하지 않은 해고 사태”는 또한 많은 AI 인재들에게도 새로운 경각심을 불러일으키고 있다. 즉, ‘혁신적인 연구’와 ‘실용적인 응용’ 분야가 결합된 기회를 신중하게 선택, 결정하는 것이다. “단순히 이론적인 연구가 아닌, 실제적인 적용에도 능숙해야 한다”는 것이다.
