‘시진핑’과 어긋난 AI학습자료 ‘금물’, “챗봇 품질 저하 우려”
시진핑 저서 12권 기반 챗봇 보급 예정, 中기업들 “학습 훈련 고통스러워”

시진핑 중국 국가주석. (사진=AP통신)
시진핑 중국 국가주석. (사진=AP통신)

[애플경제 전윤미 기자] 중국의 생성AI와 이를 기반으로 한 챗봇 기술은 미국을 바짝 따라잡을 정도로 매우 발달했다. 그러나 사상과 언론 통제가 챗봇의 품질에 걸림돌이 되고 있다는 일각의 지적도 있다. 최근엔 “적어도 죽은 사람들에 관한 정보에 있어선 중국 챗봇이 최고”라는 서방 언론의 비아냥도 그런 맥락이다. 어떤 챗봇이든 결코 시진핑 주석의 사상과 맞지 않는 제품은 허용되지 않는다. 그렇다보니 “사망한 친인척 기반 챗봇”(chatbots based on deceased relatives)에 관해선 세계 최고라는 조롱섞인 표현도 나오고 있다.

실제로 중국에선 시진핑을 기반으로 한 챗봇이 즐겨 만들어지고 있다. 이들은 시진핑이 직접 썼다고 알려진 10여 권의 책을 사용해 제작된 것이다. 기술매체 엔가젯은 “가짜 ‘ScarJo’(스칼렛 요한슨)과 대화를 나누는 것이 어떨까요? 중국 지도자와 대화를 시도해 보는 것은 또 어떨까요?”라며 이런 중국 챗봇 문화를 비꼬기도 했다.

영국 파이낸스 타임즈도 최근 시진핑을 기반으로 한 중국의 챗봇들을 소개해 눈길을 끈다. 이들 챗봇은 사실상 시진핑의 ‘생각’을 이용해 훈련한 것들이다. 이 신문 보도에 따르면 중국 관리들은 시지핑의 책과 논문을 훈련 목적으로 사용하고 있다.

시진핑 책과 논문을 훈련 자료로 활용

그의 정치철학은 이른바 ‘시진핑 신시대 중국 특색의 사회주의 사상’ 또는 줄여서 ‘시진핑 사상’으로 알려져 있다. 이런 이념적 교리는 그가 중국 공산당(CCP) 지도자로 재직하는 동안 만들어졌다. 연구자나 관리들은 이를 염두에 두고, 시진핑이 직접 집필한 것으로 추정되는 12권 이상의 책을 포함, 그의 사상이나 어록 등을 비롯한 공식 문헌을 소재로 챗봇을 학습시키고 있다. 훈련 세트에는 정부 규정, 정책 문서, 국영 언론 보도, 기타 공식 간행물 등이 두루 포함된다.

실제로 챗봇 훈련에 사용된 일부 문서 중엔 시진핑에 대한 언급이 86,000회 이상 포함되어 있는 경우도 있다. 이는 시민들에게 “사상, 정치, 행동에서 우리는 항상 당 중앙위원회와 높은 일치 관계를 유지해야 합니다. 시진핑 총서기가 핵심이다.”라고 강조하고 있다. 챗봇 역시 이를 그대로 학습함으로써 대중들을 위한 사상 교육의 도구로 쓰이고 있다. 엔가젯은 이에 “이런 걸 파티에서 갖고 놀면 정말 재미있을 것 같다”고 놀리기도 했다.

이 챗봇은 아직 일반 대중에게 공개되지는 않았다. 이는 중국 사이버 공간 관리국(CAC)의 관할 하에 있는 연구 센터에서 사용되고 있지만, 앞으로 대중용을 포함해 더욱 폭넓은 용도로 공개될 것으로 보인다. 챗봇 모델은 질문에 답하고, 보고서를 작성하고, 정보를 요약하고, 중국어와 영어 간 번역을 수행할 수 있다. 기본적인 기능임에도 불구하고, 정치, 경제, 문화에 대한 시 주석의 사상을 전파할 가능성이 높다.

챗봇, 권위주의적 국가 철학 홍보 도구

이러한 움직임은 시 주석과 그의 권위주의 국가의 철학을 홍보하려는 중국 당국의 적극적인 노력의 일환이다. 시진핑이 직접 썼다고 한 12권 이상의 책이 챗봇 학습의 ‘교범’ 역할을 하는 한편, 중국에서 열리는 각종 도서 박람회에서도 무대의 중심을 차지하곤 한다. 텐센트나 네티즈(Netease) 등 중국의 인기있는 뉴스 앱은 공식 국영 미디어의 기사 피드 상단에 슬롯을 예약하고 있다. 슬롯 게시물의 대부분에는 시진핑 사상과 그의 소식이 헤드라인을 이룬다. 적어도 10살 이상 어린이들이라면 그의 정치 철학을 공부해야 한다. 이를 위해 챗봇이 유용한 교재로 사용될 수도 있다.

서방세계의 AI챗봇 모델은 중국에서 사용할 수 없다. CAC는 “생성AI 제공업체가 ‘핵심 사회주의 가치를 구현’하고 모든 챗봇의 출력에 ‘국가 권력을 전복시키는 콘텐츠를 포함해서는 안 된다’”고 규정하고 있기 때문다. 따라서 중국에선 서방 세계에서 볼 수 있는 챗GPT나, 구글 제미니 또는 이와 유사한 것은 없다. 그렇다보니 바이두, 알리바바 등과 같은 중국 기업들은 자사 모델이 시 주석이나 공산당 체제와 관련된 민감한 문제와 관련된 생성AI 콘텐츠를 엄격하게 제어하도록 의무화되어있다.

해외 영어데이터, ‘필터링’ 수고 감수해야

그러나 대부분의 경우, AI챗봇은 영어 데이터를 사용하여 모델을 교육하기 때문에 이런 규정을 지키는 것이 이들 기업에겐 여간 힘든 일이 아니다. 서방세계의 다양한 정보를 망라한 데이터들은 자칫 중국 공산당의 규정을 위반할 가능성이 크다. 그래서 이런 데이터로 학습할 경우 일일이 이를 필터링해야 하는 수고를 감수해야 한다. 해당 기업으로선 보통 어려운 일이 아니다.

그렇게 만들어진 중국 챗봇들은 민감한 주제에 대해 질문을 받으면 아예 채팅을 다시 시작하도록 한다. 그야말로 ‘사망한 친인척 기반 챗봇’ 부문에선 선두를 달릴지언정, 이런 풍토는 챗봇 기술발달의 큰 걸림돌이 아닐 수 없다. 그래서 “이를 염두에 둔다면, 시진핑은 적어도 본인이 살아있을 동안은 자신의 철학을 매우 잘 옹호할 수 있을 것”이라는게 서방언론들의 비아냥이다.

저작권자 © 애플경제 무단전재 및 재배포 금지