김남주 대기자
김남주 대기자

오늘을 우리가 살아갈 수 있는 건 경험에서 축적한 경험자료, 즉 데이터가 있기 때문이다. 데이터는 정보다. 단편적인 정보다. 흩어져 있으면 별다른 힘을 발휘하지 못하지만 연결되면 힘이 솟는다. 우리 두뇌에는 수많은 정보 파편, 즉 데이터가 쌓여있다. 이 데이터를 중심으로 사리분별을 하고, 인지하고, 판단하고, 예측하고, 대비한다. 인간의 두뇌를 흉내 내고 있는 컴퓨터도 결국 데이터에 기반해서 능력을 발휘한다. 인공지능(AI)이 놀라운 건 광범위하게 수집된 데이터를 기반으로 작동하기 때문이다. 집대성된 데이터를 기반으로 연산하고, 판단하고, 전망한다. 데이터를 누가 많이 가지고 있느냐에 따라 승패도 엇갈린다. 미국과 중국이 틱톡을 놓고 벌인 싸움도 결국 데이터 전쟁으로 귀결된다. 틱톡을 통해 미국인들의 광범위한 데이터가 중국으로 흘러 들어가기 때문에 생긴 거다. AI 발전은 데이터에 달려있다 해도 틀린 말이 아니다. 데이터를 처리함으로써 결과치가 나오기 때문이다. 데이터가 허술하면 답변도 허술하게 된다.

AI를 둘러싼 경쟁이 데이터 몰이로 비화되고 있다. AI 시장의 선점 드라이브를 강력하게 걸고 있는 마이크로소프트(MS)와 오픈AI가 데이터 쌓기에 분주하다. 이들 기업이 기존에 없던 AI 전용 데이터센터 구축 프로젝트인 ‘스타게이트’ 추진에 나섰다고 외신들은 전한다. 스타게이트는 30년 전인 지난 1994년에 개봉한 MGM 제작 영화다. 뒤이어 Showtime 등 채널에서 방영한 드라마가 있다. 초공간 이동장치 스타게이트를 발견한 미합중국 공군이 비밀리에 게이트를 작동하고, 이를 통해 도착한 외계 세계에서 외계인들과 교류한다. MS와 오픈AI는 방대한 정보 집적을 통해 미지의 AI 세계로 들어갈 모양새다.

스타게이트 프로젝트에는 1000억 달러를 투자한다고 한다. 실로 어마어마하다. 이곳에는 범용 인공지능(AGI) 개발에 활용할 슈퍼컴퓨터를 설치할 예정이다. 투자 규모로만 보면 현재 가장 큰 데이터센터의 100배에 달할 것으로 알려졌다. MS와 오픈AI, 양사 경영진들은 오픈AI 서비스 구동을 위해 특수 AI반도체를 탑재한 데이터센터를 구축하는 프로젝트 진행에 나선 것이다. 데이터센터의 핵심은 슈퍼컴퓨터로, 특별히 제작한 수백만 개의 서버 칩이 들어간다. AI반도체는 여러 공급업체의 제품을 사용하도록 설계할 예정이다.

AI모델이 순조롭게 작동하기 위해선 천문학적 용량의 데이터를 저장하고, 이를 최대한 빨리 학습시킬 수 있는 인프라가 필수적이다. 양사는 오는 2028년에 스타게이트 구축을 일차로 끝내고, 2030년까지 성능을 확대할 계획이다. 대부분 비용은 MS가 부담한다. 데이터센터는 그래픽처리장치(GPU) 등이 탑재된 서버로 데이터를 저장하고 분석, 처리하는 곳이다. 스타게이트는 전력·성능 등 모든 면에서 현존하는 모든 데이터센터를 압도할 전망이다. 시간당 5기가와트(GW)의 전력을 사용한다. 성능은 현존 데이터센터의 수십 배 이상이 될 것이라는 전망이 나온다. 이에 따라 스타게이트가 성공적으로 구축된다면 AI 모델 개발 속도는 획기적으로 빨라질 것이다.

AI 전쟁터에서 데이터 확보와 처리를 위한 경쟁이 더욱 거세지고 있다. 사람도 머리에 데이터가 많이 차 있어야 한다. 머리에 든 게 없으면 무식한 사람이 된다. 데이터는 AI모델의 식량이다. 사람이 배고프면 힘이 없듯이 AI도 데이터가 받쳐주지 않으면 제대로 힘을 못 쓴다. 이에 AI 개발에 엄청난 양의 데이터가 필요해지자 고성능 GPU를 장착한 AI 데이터센터가 세계 곳곳에서 지어지고 있다. 일각에선 MS·오픈AI 연합이 추진하는 초대형 AI 데이터센터인 스타게이트의 등장을 예의 주시하고 있다. AI 개발의 핵심 인프라를 특정 기업이 독점하는 셈이기 때문이다. 이를 토대로 인간 능력을 뛰어넘어 인류를 위협할 수 있는 AGI를 개발한다 하니, 스타게이트는 인류에게 또 다른 세계로 안내하는 통로가 되는 셈이다. 빅데이터를 가득 안고 이를 영양분 삼아 무소불위의 힘을 발휘할 AI 시대가 성큼 다가오는 느낌이다.

저작권자 © 애플경제 무단전재 및 재배포 금지