세계 5번째 크기의 슈퍼컴퓨터, 탄소제로 전력과 수자원
인근 수력발전소 전기, 수많은 호수의 신선수를 냉각수로 활용
남는 ‘열’은 지역 난방으로 공급, 지역사회에 피해없이 ‘이로움’ 선사
[애플경제 김예지 기자] 데이터센터나 고성능 컴퓨팅의 가장 큰 문제는 막대한 에너지와 수자원이 든다는 점이다. 이로 인해 최근엔 소형 원자로 등 다양한 해결방안을 찾느라 분주하다. 특히 점차 실용화되고 있는 슈퍼컴퓨터의 경우 그야말로 ‘에너지를 잡아먹는 하마’나 다름없다. 그런 가운데 북극권에서 200마일도 안 되는 곳에 위치한, 유럽 최대이자, 가장 빠른 슈퍼컴퓨터 ‘루미’(Lumi)는 고강도 작업 부하와, 고성능 AI를 어떻게 지속가능하게 조화시킬 수 있는지를 보여주는 사례다.
“미래 친환경 슈퍼컴퓨터 구축의 모델”
핀란드에 들어선 ‘루미’는 에너지 소모와 탄소배출을 최소화한 미래지향의 친환경적인 모델로 주목받고 있다. 외신을 종합하면, 이른바 ‘북쪽의 여왕’이란 뜻의 ‘루미’는 핀란드의 작은 도시 카야니 시 외곽에 자리 잡고 있다. 한때 임업과 제지 산업으로 유명했으나, 이젠 ‘루미’가 들어서면서 카야니는 핀란드 IT산업의 중요한 거점이 되고 있다.
루미는 세계에서 가장 친환경적인 슈퍼컴퓨터로 꼽힐 만하다. 다른 슈퍼컴퓨터와 마찬가지로 루미도 엄청난 양의 에너지가 필요하다. 그러나 기존에 있던 수력 발전소에서 전기를 공급받으므로 적어도 에너지 관점에서 볼 때는 탄소 중립적이다. 물론 여기엔 핀란드 특유의 지리적 위치, 인프라, 기후 등이 작용하고 있다. 그럼에도 불구하고 전 세계 다른 곳에서 미래의 슈퍼컴퓨터를 구축하는 데 참고해야 할 교훈을 주고 있다는 평가다.
흔히 대규모 데이터 센터와 슈퍼컴퓨터는 특히 막대한 물이 필요하다. 블룸버그에 따르면 세계에서 가장 빠른 슈퍼컴퓨터인 ‘프론티어’(Frontier)는 냉각을 위해 분당 6,000갤런(약 2만3천톤)의 물을 시스템에 공급해야 한다. 다만 가능한 한 불순물이 적은 신선한 물이어야 한다. 이로 인해 특히 건조한 지역에 있는 대규모 데이터 센터와 가까운 마을이나 도시의 수자원에 피해를 끼치고 있다. 또한 클라우드 컴퓨팅 시설, 슈퍼컴퓨터, 데이터 센터를 통과한 물은 뜨겁다. 시설마다 다르지만 평균 약 40ºC이며, 이는 루미도 마찬가지다.
그러나 루미는 특유의 지리적 위치 덕분에 여느 슈퍼컴퓨터와는 또 다르다. 핀란드는 흔히 “1천개 호수가 있는 나라”로 알려졌다. 물론 이는 다소 과소평가된 표현으로 실제로는 187,000개의 호수가 있다. 즉, 늘 충분한 양의 신선한 물이 있으며, 근처에 슈퍼컴퓨터가 있어도 카야니 주민들의 식수엔 전혀 영향을 끼치지 않는다.
“난방용 등 도시 인프라에 기여도”
오히려 루미는 도시 인프라에 기여하기도 한다. 생산되는 40ºC의 물은 같은 산업 부지에 위치한 생산시설 등의 난방 보일러로 공급된다. 그곳에서 더 가열되어 겨울철 난방을 위해 도시의 주택으로 전해진다. 그래서 직접 전기로 난방되는 주택이 있지만, 사실상 모든 아파트와 카야니의 주택들 대부분은 지역 난방을 사용한다. 또 1년 중 6개월 동안 평균 기온이 1ºC에서 –11ºC 사이다보니, 도시를 돌며 식은 물의 일부는 루미로 다시 돌아와서 피드백된다.
슈퍼컴퓨터 루미가 위치한 건물도 재활용된 것이다. 한때 이 건물은 제지 공장이었으나, 지난 2008년에 가동이 중단되었고, 2년 후에 완전히 해체되었다. 또한 루미가 완공되기까지 9년 이상 걸렸지만, 새로 콘크리트를 붓지 않았다.
그럼에도 루미가 수행하는 작업은 엄청나다. “가장 작은 규모의 물질과 입자의 시뮬레이션을 수행하고, 그들 간의 상호작용이나, 속성, 은하계 규모에서 우주에서 일어나는 일까지 모든 것을 구축할 수 있다”는 설명이다. 또한 암을 치료하는 방법, 건강 문제 등 사회적 문제를 해결하는 프로젝트도 진행한다.
특히 이곳에선 또 하나의 ‘지구 복제본’을 만드는 ‘Destination Earth’ 프로젝트를 진행하고 있다. 이른바 지구의 ‘디지털 트윈’을 만드는 야심 찬 프로젝트다. 월스트리트저널은 “이는 과학자들에 따르면 매우 높은 정확도로 기후와 극한 기상 현상을 모델링할 수 있다”면서 “2030년까지 ‘지구의 완전한 디지털 복제본’을 만드는 것”이라고 설명했다.
또 이곳 CPU 사이클의 50% 조금 넘는 부분은 신경망을 훈련하는 데 사용된다. 물론 대규모 언어 모델(LLM)이 포함될 수도 있다. 이들 50%의 사이클은 대학교 연구자들이 사용하기도 한다. 이들은 소수 언어로 LLM을 교육하고 있는데 핀란드어를 비롯해 다른 북유럽어, 그리고 영어와 코드로 옮기곤 했다. 또한 유럽 연합의 모든 공식 언어를 구사하는 LLM을 만드는 AMD의 프로젝트에도 참여하고 있다.
그 중에서 특히 LLM과 생성AI가 차지하지 않는 사이클은 ‘순수 고성능 컴퓨팅(HPC)’으로서, 물리학, 기후 과학 등을 위한 부동 소수점 64비트 워크로드로 알려져있다. 이는 시뮬레이션 데이터를 생산한 다음, 시뮬레이션을 대체하거나 과학을 가속화하기 위해 신경 네트워크를 훈련하기도 한다는 설명이다.
CPU 사이클 50%는 대학 등의 신경망 훈련에 제공
루미는 핀란드 정부가 70%, 핀란드 고등 교육 기관이 30%를 소유한 회사가 운영하지만, 사실상 범유럽 프로젝트다. 이탈리아의 레오나르도사와 스페인의 ‘Marenostrum 5’로 구성된 ‘EuroHPC’ 프로젝트의 일부다. 공공-민간 파트너십인 EuroHPC는 루미 컨소시엄을 구성하는 11개 유럽 국가와 함께 운영 자금 중 일부를 제공한다.
현장을 둘러본 과학자들에 의하면 루미는 약 2층 높이에 길이가 약 50m인 홀의 대부분을 차지하고 있다. 그 내부는 세계에서 다섯 번째로 강력한 슈퍼컴퓨터다. ‘HPE Cray Supercomputing EX4000’ 시스템 캐비닛의 통로 5개로 구성되어 있으며, 내부에는 8개의 컴퓨팅 섀시가 있다. 또한 각각 8개의 컴퓨팅 블레이드, 8개의 HPE 슬링숏(Slingshot) 스위치 블레이드 슬롯, 1개의 전원/신호 미드플레인을 위한 공간이 있다.
루미의 처리 능력은 AMD에서 제공하며 약 12,000개의 MI250x GPU와 262,000개의 AMD Epyc Milan CPU 코어가 포함되어 있다. 이를 작동케 하도록 각기 다른 전문성을 가진 8개의 파티션이 있다.
