개인정보 보호 취약한 중국, 수 십억명의 방대한 데이터 수집
무차별 데이터 덕분, 값싼 구식 H800칩, 화웨이 ‘어센드’ 칩으로 AI 개발
美·유럽·日 등 사용 제한…한국 개보위도, 딥시크에 개인정보 수집 적법성 질의
[애플경제 김예지 기자] 중국 AI 스타트업 딥시크(DeepSeek)가 개발한 AI 모델이 개인정보 유출 위험을 초래할 수 있다는 우려가 커지고 있다. 특히, 중국의 느슨한 개인정보 보호법을 바탕으로 방대한 데이터를 확보할 수 있다는 점이 논란의 핵심이다. 이로 인해 미국, 유럽, 일본, 호주 등 각국 정부는 딥시크의 개인정보 처리 방식에 대해 조사를 진행하거나 사용 제한 조치를 내리고 있다.
개인정보 보호 취약한 중국, AI 기업의 방대한 데이터 활용 가능
딥시크가 개인정보 보호에 취약한 가장 큰 이유는 중국의 규제 환경 때문이다. 중국 내 개인정보 보호법이 상대적으로 느슨한 만큼, AI 기업들이 방대한 데이터를 활용하는 것이 용이하다. 특히, 중국 내 14억 인구 중 상당수가 글로벌 소셜미디어 플랫폼을 사용하고 있으며, 이들로부터 생성되는 데이터는 엄청난 규모에 달한다. 이는 AI 모델의 학습에 유리한 환경을 제공하는 동시에, 개인정보 유출 가능성도 높이는 요인이 된다.
딥시크가 수집하는 데이터의 범위는 방대하다. 사용자의 대화 내용뿐만 아니라 기기 정보, 위치 데이터, 클라우드 문서까지 접근할 가능성이 제기됐다. 특히, 사용자의 타이핑 패턴과 입력 리듬을 분석해 개별 사용자를 식별할 수 있다는 지적도 나온다.
AI 모델의 지속적인 개선을 위해 데이터 학습이 필수적이지만, 딥시크는 불필요하게 광범위한 개인정보를 수집한다는 의혹을 받고 있다. 게다가 중국의 데이터 보안법에 따라, 중국 기업이 수집한 데이터는 정부와 공유될 가능성이 높아 보안 우려를 더욱 증폭시키고 있다.
세계 각국, 딥시크 사용 제한 조치…한국도 규제 검토
글로벌 규제 당국은 딥시크의 데이터 처리 방식에 대해 강경한 입장을 보이고 있다. 미국 해군은 보안 및 윤리적 문제를 이유로 딥시크 AI 앱 사용을 금지했으며, 텍사스 주 정부는 중국 공산당의 데이터 수집 가능성을 들어 주 차원의 사용 금지 조치를 내렸다.
일본 정부는 공무원들에게 딥시크 사용을 자제하라는 지침을 내렸으며, 호주 정부는 국민들에게 딥시크 사용 시 주의를 당부했다. 영국과 이탈리아의 개인정보 보호 당국은 딥시크의 데이터 처리 방식을 조사 중이며, 독일 역시 규제 조치를 검토 중이다. 유럽연합(EU) 차원에서도 개인정보 보호 강화를 위한 논의가 진행되고 있다.
한국 정부도 이에 대응하고 있다. 개인정보보호위원회는 1월 31일 딥시크 본사에 개인정보 수집 및 처리 방식에 대한 공식 질의서를 발송하기로 했다. 질의서에는 한국 이용자의 개인정보가 어떻게 수집되고 저장되는지, 중국 서버로 전송되는지 여부 등이 포함됐다.
개인정보위 관계자는 "딥시크의 개인정보 수집 방식이 한국 개인정보 보호법을 위반하는지 철저히 점검할 것"이라며 "필요할 경우 실태 점검 및 조사를 진행하겠다"고 밝혔다.
딥시크의 개인정보 보호 문제는 단순히 기술적인 논란을 넘어, 글로벌 보안 환경에 중대한 영향을 미칠 수 있는 문제로 확산되고 있다.
특히, 중국의 국가정보법 7조는 모든 조직과 시민이 정보기관의 요청에 협조해야 한다고 명시하고 있어, 딥시크가 수집한 개인정보가 중국 정부에 넘어갈 가능성에 대한 우려를 키우고 있다. 이는 개인정보 유출 위험을 더욱 부각시키며, 딥시크와 같은 AI 기업들이 데이터 보안에 더욱 책임감을 가져야 한다는 점을 다시 한 번 일깨운다.
무별 데이터수집으로 획기적 비용 절감
AI 모델 개발에서 가장 비용이 많이 드는 요소는 데이터 수집과 컴퓨팅 자원이다. 글로벌 빅테크 기업들이 엔비디아의 고성능 H100 GPU를 대량으로 사용하는 것과 달리, 딥시크는 비교적 저렴한 가격으로 일반 게이밍 GPU인 H800을 활용하며 비용을 절감했다. 딥시크의 V3 모델 개발 비용은 약 81억 원(557만 6000달러)으로, 수천억 원이 소요되는 글로벌 AI 기업들의 투자 규모와 비교하면 현저히 낮다.
딥시크는 또한 중국 화웨이(반도체 설계)와 SMIC(반도체 생산)가 공동 개발한 AI 반도체 ‘어센드(Ascend)’ 시리즈를 대량으로 활용해 AI 모델을 구축했다. 훈련(training)에는 엔비디아의 H800을 사용했지만, 추론(inference) 단계에서는 화웨이의 어센드 910C를 사용한 것이다. 어센드 칩은 엔비디아 A100 대비 80%의 성능을 유지하면서도 가격은 30% 수준에 불과해, AI 개발 비용을 크게 낮추는 데 기여했다.
또한, 딥시크는 전문가 혼합(MoE·Mixture of Experts) 기술을 적용하여 필요한 매개변수만 활성화하는 방식으로 메모리 사용량을 줄였다. 딥시크의 기술 보고서에 따르면 R1 모델의 총 매개변수는 6710억 개에 달하지만, 실제 작업에서는 340억 개만 활성화하여 효율성을 극대화했다. 이러한 기술적 전략 덕분에 비교적 낮은 비용으로도 강력한 AI 모델을 개발할 수 있었다.
