“MS 등 AI개발사들 무분별 데이터 사냥” 비난, 검색 상한선 둬
AI기업 ‘네트워크 데이터 대량 수집’, 소셜미디어 기업과 갈등 심화
일반 사용자들도 불편 감수, “트위터에 불만 목소리도 비등”
[애플경제 김향자 기자] 일론 머스크가 지난 1일(한국 시간 2일) 자신의 트위터 계정(@elonmusk)을 통해 “앞으로 하루에 사용자들이 볼 수 있는 트윗은 600개, (유료인) 트위터 블루는 6,000개로 제한한다”는 내용을 공지, 트위터 네트워크가 발칵 뒤집혔다.
MS나 오픈AI, 레딧 등 빅테크는 물론, 수많은 AI개발 스타트업이나 개인 개발자들이 트위터에 게재된 데이터를 ‘저인망’식으로 긁어가는데 대한 극약처방인 셈이다. 일반 사용자들을 겨냥한게 아니라 대규모 언어모델에 필요한 데이터를 트위터에서 긁어가는 AI개발업계를 표적으로 삼은 것이다. 그 때문에 덩달아 사용자들도 불편을 감수할 수 밖에 없게 되었다.
수정된 공지, ‘일반 사용자 1,000개, 트위터 블루 10,000개’
머스크는 첫 공지 후 다시 그 상한선을 조금 높이긴 했지만, 사용자가 매일 볼 수 있는 트윗 자체를 크게 제한한다는 사실에 많은 트위터들은 당혹스러워 했다. 이에 블룸버그, WSJ, NYT 등 모든 언론들이 일제히 이 사실을 헤드라인, 또는 기술(테크) 섹션 톱기사로 올리며 비상한 관심을 보였다.
일론 머스크 특유의 ‘밀어붙이는’ 기질을 유감없이 보인 점도 있지만, “초대형 AI 출현으로 AI개발 경쟁이 가열되면서, 특히 ‘정보의 바다’인 트위터에서 수많은 정보를 대량으로 ‘채굴’하고 있는데 대한 머스크의 반격”이란 평가다.
그러나 이같은 머스크의 공지가 트위터를 통해 전파되면서 적잖은 사용자들이 반발하거나, 심지어 탈퇴를 선언하기도 했다. 이날 하루 종일 사용자들은 ‘#TwitterDown’이나, ‘RIP Twitter’에 제한 조치를 성토하거나 불만을 털어놓으면서, 트위터가 도배가 되다시피 했다.
일론 머스크는 첫 공지에선 그러면서 이런 제한 조치가 얼마나 오래 지속될지조차 명시하지 않았다. 그러다가 사용자들의 반발이 쏟아지자, 잠시 후 “각각 800개와 8,000로 증가될 것”이라고 바꿨다.
그러나 사용자들은 계속 ‘제한 조치’ 자체에 대해 불만을 표시하며, 반발을 멈추지 않았다. 이에 머스크는 처음 공지를 올린 후 약 5시간 뒤에 다시 상한선을 수정해 “인증되지 않은 계정은 1,000개, 검증된 사용자는 1만개”라며 그 숫자를 다시 늘렸다.
머스크 평소 “AI개발사들 데이터 탈취” 불만
그 동안 머스크는 AI개발사들이 트위터를 누비며 정보를 쓸어가는데 대해 불만이 많았다. “AI 기업들이 돈버는데 왜 우리의 자산(데이터)을 공짜로 갖다 쓰느냐”거나, “트위터에서 너무 많은 데이터를 긁어모아 일반 사용자들의 서비스가 저하되고 있다”고 불평하곤 했다.
며칠 전부터 이미 트위터는 “(AI 개발사 등) 트위터 계정이 없는 사용자가 트윗과 프로필을 보는 것을 금지한다”고 밝힌 바 있고, 이에 따른 후속조치로 구체적 상한선을 둔 것이다. 이는 “모든 사람들이 데이터를 찾기 위해 사이트를 무분별하게 스크랩하는 것을 막기 위한 것”이라는 트위터측의 설명이다.
애초 머스크는 이에 대해 “일시적인 조치”라고 밝혔지만, 그 후 추가로 공지한 제한조치에 대해선 아직 아무런 시한도 밝히지 않고 있다.
그래서 ‘뉴욕타임즈’는 “이번 제한 조치는 AI프로그램을 개발하기 위해 데이터를 사용하려는 회사들에게 정면으로 싸움을 건 것으로 매우 이례적인 움직임”이라며 “수많은 AI 회사들이 무료로 모델을 훈련하는 데 도움이 될만한 데이터를 수집하느라 사이트를 스크랩하려는 것을 억제하기 위한 강력한 조치”라고 풀이했다.
실제로 챗GPT기술을 개발하거나 이를 기반으로 시장 공략에 성공하고 있는 오픈AI나 MS의 사례는 다른 많은 스타트업과 투자자들로 하여금 생성AI를 개발해 돈을 벌고자 하는 욕구를 부채질했다. 이에 개발 시스템을 훈련시키는 데 도움이 될 수 있는 많은 양의 데이터를 보유하고 있는 소셜 미디어 회사들과의 갈등과 긴장도 날로 증폭되고 있다.
그런 가운데 트위터와 일론 머스크가 가장 먼저 ‘칼’을 빼든 것이다.
머스크는 제한 조치 하루 전에 트위터에 “스타트업에서부터 지구상의 가장 큰 기업들에 이르기까지 AI를 하는 거의 모든 회사가 방대한 양의 데이터를 (트위터로부터) 스크랩하고 있다.”면서 “일부 AI 스타트업의 터무니없는 데이터 싹쓸이를 용이하게 하기 위해 많은 수의 서버를 비상시에 온라인으로 전환해야 하는 것은 고통스러운 일”이라고 비난했다.
그는 일단 “임시 비상 조치나, 데이터가 너무 많이 도용되는 사태는 일반 사용자의 서비스를 저하시키고 있다”면서 “수백 개 이상의 기업이나 조직들이 실제 사용자 환경에 영향을 미칠 정도로 트위터 데이터를 매우 공격적으로 스크랩하고 있는 실정”이라고 경고했다.
‘생성AI붐’으로 소셜미디어, LLM의 ‘데이터 어장’ 돼
실제로 전문가들은 초대형AI 개발 ‘붐’이 일면서 소셜 미디어 플랫폼은 AI 챗봇을 구동하는 대규모 언어 모델(LLM)의 ‘풍부한 먹거리’가 되고 있다는 평가다. LLM이 학습하기 위한 방대한 양의 데이터와 언어가 저장되어 있기 때문이다.
이는 트위터 뿐 아니다. 페이스북이나 인스타그램, 틱톡 등 다른 소셜 미디어 플랫폼도 데이터에 굶주린 AI 기업들의 ‘데이터 사냥’에 대처하기 위해 곧 새로운 대책을 마련할 것으로 보인다.
실제로 레딧(Reddit)도 최근 일부 AI개발사나 개인에게 데이터 비용을 청구하기 시작했다. “대규모 데이터 사용을 필요로 하는 상업적 기업에 더 이상 ‘보조금’을 지급하는 것은 있을 수 없다”는 회사측 입장이다.
앞서 일론 머스크는 지난해 트위터를 인수한 후 여러 가지 ‘개혁’ 조치를 취했다. 그 중에서도 특히 ‘트위터 블루’가 대표적이다. 이에 가입한 사용자들이 매달 8달러 요금을 내는 대신, ‘프리미엄 계정’을 사용할 수 있고, 해당 사용자들이 ‘가입자 전용 콘텐츠’를 만들 수 있는 기능을 만든 것이다. 이번 갑작스런 제한 조치 역시 머스크가 구상하는 ‘서비스 차별화 전략’의 일환으로 그 성공 여부가 주목되고 있다.
MS 등에 “트위터 API 사용, 돈내라”
또 트위터의 애플리케이션 프로그래밍 인터페이스(API), 즉 제3자가 트위터의 일부 데이터를 분석하고 이를 사용하여 도구를 구축할 수 있도록 하는 API의 사용을 제한했다. 그러면서 API에 대한 액세스 요금을 인상했다.
특히 지난 5월에는 “마이크로소프트가 API의 데이터를 부적절하게 사용했다. 데이터를 무료로 사용하고 있으며 이제는 비용 지불도 거부하고 있다”고 비난하면서 특히 “마이크로소프트가 기계학습을 위해 트위터 데이터를 불법적으로 사용한다”고 질타했다.
이에 마이크로소프트는 일단 “문제를 검토하고 적절한 시기에 대응할 것”이라고 얼버무렸다.
트위터는 또 데이터에 더 많은 비용을 청구하는 것 외에도, ‘사용자 확인’을 포함한 구독 서비스를 강화할 계획이다. 또 이번 제한조치에서 보듯, 인증된 사용자들에겐 분명 더 많은 혜택을 준다는 방침이다. 그럼에도 전문가 일각에선 부정적 시선이 많다.
평소 이같은 머스크의 차별화 조치(스튜어드십)에 비판적이었던 제이슨 골드만 전 트위터 임원은 “트위터 생긴 이래 전례가 없는 일”이라고 블룸버그에 개인적 견해를 밝혔다.
