빅테크, 각종 소셜미디어 콘텐츠를 밑천삼아 LLM 구축
메타, 아마존, 오픈AI 등 공식 인정, ‘개인정보보호’가 새로운 과제

(사진=셔터 스톡)
(사진=셔터 스톡)

[애플경제 이보영 기자] 초거대 LLM과 고도의 생성AI를 탄생하게 한, 가장 결정적인 힘은 무엇일까. 그 기반이 되는 여러 요소를 거론할 수 있으나, 가장 중요한 것은 수많은 사용자와 소비자들이 올린 게시물이나 그들이 제품을 선택하는 패턴과 성향이다.

메타 “본사 AI 훈련, 전적으로 게시물 사용”

메타나 아마존, 오픈AI 등이 생성AI를 개발하게 된 가장 큰 동력 역시 그런 것들이다. 이는 네이버, 카카오 등 국내 대기업들도 마찬가지다.

실제로 메타는 최근 “본사의 AI 훈련과 교육엔 전적으로 공개 소셜 미디어 게시물을 사용되었다”고 밝힘으로써 이같은 사실을 뒷받침하고 있다.

메타는 “공개적으로 사용 가능한 것으로 간주되는 콘텐츠가 대부분을 차지하는 페이스북, 인스타그램 사용자의 게시물이 담긴 대규모 캐시를 활용했다”고 공식화했다. 자사의 메타AI 등이 전적으로 사용자들로부터 나온 정보를 ‘밑천’으로 삼은 것임을 인정한 것이다.

메타가 최근 페이스북이나 인스타그램 게시물을 기반으로 개발한 Meta AI 가상 비서가 그 전형적 사례다. 이는 실제 사용자 행동과 선호도를 연구하여 AI 및 기계 학습 시스템의 성능을 향상시킨 것이다.

개인정보 많은 데이터셋은 제외?

다만 이 경우 문제는 순수한 개인정보나 사생활 관련 정보다. 메타의 글로벌 담당 CEO인 닉 클레그는 최근 “본사는 개인 정보가 압도적으로 많은 데이터 세트는 제외하려고 노력했다.”고 로이터통신에 밝혔다.

클레그는 데이터 세트의 대부분이 공개적으로 이용 가능하지만, 그로부터 제외된 비공개 기밀 데이터가 어느 정도 비중을 차지하는지는 명확히 밝히지 않았다. 다만 그는 개인 정보 보호 문제 때문에 기피한 소셜 네트워크의 사례로 마이크로소프트 소유의 링크드인을 언급했다.

이같은 사실은 지난 주 메타가 개최한 연례 ‘Connect 컨퍼런스’에서도 다시 한번 공표되었다. 메타는 공개된 소셜미디어 콘텐츠를 재료로 삼아, 음성, 텍스트, 제스처를 통해 상호 작용을 재정의할 수 있는 다양한 성격과 기능을 갖춘 AI 비서인 MetaAI를 출시한 것이다.

또한 안경 브랜드 레이밴(Ray-Ban)과 협력, MetaAI와 통합된 스마트 안경과 메타의 소셜 미디어 앱에 통합될 다른 AI 기반 도구도 출시했다.

트위터 등 ‘사용자 맞춤형’ 피드 생성

이는 메타 뿐 아니다. 다수의 빅테크들 역시 자사의 AI 데이터셋 구축을 위해 오랫동안 자체 사용자 데이터를 채굴해 왔다.

스포티파이(Spotify)와 같은 플랫폼은 사용자들의 청취 습관을 분석, 사용자들이 선택하는 음악을 선별하고, 이를 데이터셋으로 구축하고 있다. 넷플릭스 역시 사용자들의 시청 패턴을 분석, 프로그램과 영화를 맞춤형으로 추천하고 있다.

트위터와 인스타그램과 같은 소셜 플랫폼은 사용자 상호 작용을 평가하고, 이를 바탕으로 뉴스 피드를 개인화하기도 한다.

반대로 일부 플랫폼은 사용자가 스스로 자신의 정보를 제어할 수 있는 모델을 선택하기도 한다.

예를 들어 아마존측은 “본사는 정확하고 개인화되었으며 지속적으로 개선되는 경험을 고객에게 제공하기 위해 노력한다”고 ‘디크립트’에 밝히기도 했다. 즉, 사용자가 자신의 모델로 소셜 플랫폼이 임의로 AI를 훈련시키지 않도록 한다는 얘기다.

오픈AI도 이러한 접근 방식을 취하고 있다. 이 회사의 AI모델 훈련을 위해 자신의 작업이나 작품이 수집되는 것을 원하지 않는 아티스트는 이를 거부할 수 있다.

기술발전 vs 개인정보보호, “균형 이뤄야”

하지만 그 과정이 너무나 번거롭다는 지적이다. 그래서 거부를 시도하다가 결국 포기하고 ‘분노’하는 사람들도 많다는 것이다. 아티스트는 작품마다 별도의 요청을 제출해야 한다. 그래서 수백 점(또는 수천 점)의 그림을 작업한 유명 작가라면 회사측의 사용 요청을 거부하는 것이 무척이나 어렵다는 지적이다.

그래서 전문가들은 “AI모델 학습과정에서 사용자 데이터의 중요성이 결코 과소평가되어선 안된다”면서 “획기적인 기술 발전과 사용자 개인 정보 보호라는 ‘신성한 가치’ 사이에서 균형을 유지해야 한다”고 지적한다.

저작권자 © 애플경제 무단전재 및 재배포 금지