‘딥시크의 사람들’

2025-02-09 박경만 주필

‘딥시크’는 그야말로 ‘날벼락’이었다. 억만금의 돈을 들여야 했던 고성능 AI모델을 불과 우리 돈 80억원 정도에 만들어냈으니 그럴만 했다. 그 성능은 현존 최고의 AI모델이라는 클로드3, 라마3.1, GPT4-o1(o1) 등에 버금간다고 했다. 이에 전세계 AI생태계는 충격을 애써 추스르면서 요즘 한창 ‘절치부심’하고 있다. 전열을 새롭게 다지며 ‘딥시크’처럼 가성비 높은 AI문법을 찾느라 다들 분주하다. 딥시크는 잉태와 생성 모두가 ‘일탈’의 연속이다보니 흠잡을데도 많다. 약탈에 가까운 무차별적 정보 수집, 허술한 보안체계, 그리고 개인의 타이핑 습관으로 그 신상을 파악해내는 위험하고 도발적인 근성까지 갖췄다. 우리나라를 포함한 서방세계 대부분이 공공부문에서 아예 접속을 막고 있는 것도 그런 이유다.

그렇다고 딥시크의 존재감이 희석될 리는 없다. “기존 AI패러다임을 깬 희대의 걸작”이라는 중국 측 자랑이 아니라도, 가성비만 따지면 최고의 인공지능 모델이라고 해도 무방하다. 실제로 기계에 지능을 주입하고, 재구성하고, 조직한 방식을 뜯어보면 그야말로 정상과학에 대한 비정상과학의 도전이다. 기존 AI 공학의 고정된 개념틀에 반기를 든 것이다. 수학과 계산언어학, 데이터 과학의 원리를 ‘수작업’으로 기계에 이식했나 싶을 정도다. 미국과 서방세계 AI기업들로선 낯설 수 밖에 없다. 그래서 경계심과 뒷담화는 더욱 무성하고, 일말의 적개심마저 감추지 않는다. 딥시크는 그렇게 정상과학을 대체할 수도 있는 비정상과학의 아우라를 유감없이 보여주고 있다.

정작 눈에 띄는 건 ‘딥시크의 사람들’이다. 애초 딥시크는 미국 기업들의 무지막지한 컴퓨팅 파워와는 달리, 돈이 덜 드는 강화학습에 주로 의존했다. 별도의 사전 지도학습이 없다보니 학습 데이터랄 것도 없다. 첫 시발점인 약간의 콜드 스타트 데이터만으로 족했다. 딥시크 엔지니어들은 이런 초기의 콜드 데이터를 바탕으로 AI에게 생각하는 능력, 즉 ‘코기토’(Cogito)의 유전자를 주입했다. 한번 심어진 ‘코기토’는 AI로 하여금 스스로 세상과 현실을 감각하고 규정하며 저작(著作) 행위를 가능하게 해준다. 프롬프트가 반복될 때마다 스스로 생각하며 똑똑해지도록 한 것이다. 그 행간과 틈새엔 ‘사람’의 그런 노고가 배어있다. 사람만이 할 수 있었던 상상과 창조의 알고리즘, 경험을 사용하는 노하우를 기계에 전수한 것이다.

대표적인게 MoE(Mix of Experts)다. 확신할 순 없지만, 메타에서도 이미 시도한 바 있는 BTX(Brain Train Mix)도 첨가하지 않았을까 싶다. 이는 챗GPT 등의 어마어마한 매개변수를 모두 구동할 필요없이, 꼭 필요한 전문가라고 할 맞춤형 뉴런만 그때 그때 써먹는 방식이다. 최소의 매개변수로 최대의 효율성을 기한 것이다. 이런 과정 역시 가장 많이 투입된 자원은 역시 ‘사람’이다. 챗GPT 등과 달리 지도학습을 생략했다곤 하지만, 전체 프로세스를 꿰어가는 사슬엔 천재적 엔지니어들의 지도와 공학적 사유가 맺혀있다. 프로세스의 연결고리와 마디마디, 공백마다 빈틈없이 ‘딥시크 사람들’의 창발적 아이디어가 몰입된 듯하다.

오픈AI와 같은 기왕의 AI 기득권층은 늘 기술적 ‘초월’을 자부한다. 그래서 항상 새롭게 초월된 기술담론을 생성함을 자랑한다. 그러나 사실은 꼭 그렇지만은 않다. 초월했음직한 기술 담론들을 번번이 재활용해왔다고 할까. 거칠게 말하면, 단지 매개변수와 데이터의 부피를 늘려오며 버전을 높여온 경우가 많다. 그런 관성에서 딥시크는 벗어났다. 14억 인구의 행동 방식, 동선, 자판을 여닫거나 타이핑하는 습성에 이르기까지, 모든 창의와 생성의 원료가 일상에 방치되어있음을 발견해냈다. 일상을 ‘재발견’했다고 할까. 기왕의 기술 재료를 작심하고 발굴한다기보단, 무심한 관찰 속에 봉인되었던 일상적 원료들을 황금의 데이터로 둔갑시킨 것이다.

오픈AI의 말마따나 딥시크는 ‘증류’, 즉 챗GPT 콘텐츠를 커닝한게 분명해보인다. 그러나 보통의 사용자들에게 그건 그다지 중요치 않다. 딥시크 R1, V3는 마치 원근법이 만든 환영(幻影)이나, 명암법이 성취한 안정적 입체감을 피카소가 파괴한 것과도 같다. 경험된 기술행위를 넘어선 일상 속의 새로운 자연을 발견하고, 이를 추상(抽象)한 것이다. 세인들은 그 점을 더 주목하고 있다. 기술력에서 분명 중국은 미국보다 한 수 아래다. 그럼에도 'MoE'나 BTX를 버무린 재주에서 보듯, '딥시크 사람들'은 나름의 추상 능력을 세계 수준으로 끌어올린 것이다. 그들만의 ‘제2의 자연’을 야기(惹起)하는데 성공한 것이다. 그렇게 따지면 우리도 못할게 없다. 뉘 못지않게 똑똑하고 재주많고, 상상과 추상능력도 충만하지 않은가. 이 참에 우리도 한번 걷어붙이고 해볼만하다.