잇따라 라이센스 협정, ‘LLM 훈련에 방대한 뉴스 기사 활용 가능’
구글-WP, WSJ과 협정 추진, 지난주 오픈AI-AP통신 라이센스 체결

국내의 한 AI개발업체가 '2023 Ai엑스포 코리아'에 출품한 뉴스 데이터셋을 홍보하는 부스 안내문으로서, 본문 기사와는 직접 관련이 없음.
국내의 한 AI개발업체가 '2023 Ai엑스포 코리아'에 출품한 뉴스 데이터셋을 홍보하는 부스 안내문으로서, 본문 기사와는 직접 관련이 없음.

[애플경제 김향자 기자]AI가 기사를 능숙하게 쓸 수 있다면? 이런 생성 기술을 확보하기 위해선 LLM 훈련을 위한 방대한 양의 뉴스 기사와 데이터가 필요하다. 이에 글로벌 AI개발업체들이 유력한 언론매체들에게 접근, 라이센스 협정을 체결하는 사례가 이어지고 있다.

특히 생성AI의 정확성 등 품질을 높이기 위해선 방대한 데이터와 이를 바탕으로 한 매개변수 확충이 핵심이다.

이에 지난 주 오픈AI와 AP통신의 ‘뉴스 제휴’ 라이센스 협약에 이어, 이에 질세라 구글도 워싱턴포스트(WP), 월스트리트저널(WSJ) 등과 라이센스 협정을 추진하는 등 분주한 움직임을 보이고 있다.

“AI로 기사 쓰는 기술 연구에 필요”

19일(현지 시각) 로이터통신에 따르면 구글은 “뉴스 기사를 작성하기 위해 인공지능 도구를 사용하는 것을 연구하고 있다”면서 “특히 AI로 기사를 쓰는 기술 등을 연구하며, 언론기관과 협의 중”이라고 밝혔다.

로이터통신과 뉴욕타임스 등에 따르면 구글측이 이름을 밝히지 않았지만 이 회사가 접촉하고 있는 언론매체는 워싱턴포스트, 월스트리트저널을 소유하고 있는 ‘뉴스 코퍼레이션’(NWSA)인 것으로 알려졌다.

구글 대변인은 “예를 들어, AI 도구들은 기자들이 헤드라인이나 다양한 글쓰기 스타일을 선택할 때 이를 지원할 수 있다”며 “기자들의 작업과 생산성을 향상시키는 도구”라고 했다. 관련 기술을 완성하기 위해선 우선 언론매체가 매일 생산하는 방대한 뉴스 아카이브를 자유롭게 이용할 수 있어야 한다.

그는 그러나 “AI 도구들은 기자들이 기사를 보도하고, 작성하고, 사건과 사실을 확인하는 등의 필수적인 역할을 대체하기 위한 것이 아니며, 대체할 수도 없다”고 덧붙였다.

이에 대해 해당 언론사의 일부 임원들은 이를 불안하게 받아들이며 부정적 반응을 보인 것으로 알려졌다. 그러나 NYT는 구글 사정에 밝은 인사들의 말을 인용해 “이번에 공개된 AI 툴은 구글 내부에서 ‘제네시스’로 불릴 만큼, 큰 기대를 받고 있다”고 전했다.

정작 제의를 받은 것으로 알려진 뉴스 코퍼레이션측은 NYT 보도나 AI 툴의 기사 쓰기 등에 대해서는 말을 아꼈다. 그러면서도 “본사는 구글과 매우 생산적이고 바람직한 관계를 맺고 있으며, 순다르 피차이 구글 CEO가 저널리즘에 관심을 갖고 나름의 비전을 제시하고 있는 것을 감사하게 생각한다”고 했다.

(이미지=로이터통신)
(이미지=로이터통신)

오픈AI, 저작권 문제, FTC제재 염두, 협정 서둘러

이는 앞서 AP통신이 이미 “‘챗GPT’를 만든 오픈AI’와 뉴스 제휴를 할 것”이라고 라이센스 협약을 맺은지 며칠 만에 나온 것이다. 구글로선 그 만큼 다급했음을 보여주는 대목이다.

앞서 오픈AI와 AP통신은 지난 14일(현지 시각) ‘뉴스 제휴’ 협약을 맺었다. 오픈AI가 AP의 뉴스 아카이브를 자유롭게 이용할 수 있도록 한 내용이다.

생성AI로 기사를 쓰는 툴, 즉 대형 언어 모델(LLM)을 업그레이드하기 위해선 방대한 저작물이나, 뉴스 기사, 소셜 미디어 채팅 등의 수많은 정보를 수집, 입력해야 한다. 이는 지난해 챗GPT 출시를 계기로 텍스트, 이미지 등을 생성할 수 있는 AI가 붐을 이루면서 이런 경향은 더욱 두드러지고 있다.

그런 과정에서 저작권이나 개인정보 침해 등의 문제도 이어지고 있다. 또 AI 모델을 ‘훈련’하기 위해 언론매체이 기사나 예술가의 작품, 음악 또는 다른 창작물이 이에 사용될 경우 합당한 보상을 해야한다는 목소리도 높아가고 있다. 실제로 그 동안 언론기관들과 작가와 저자들은 AI 시스템을 훈련시키는 데 사용되는 그들의 작품에 대한 보상을 요구해왔다.

특히 미국 연방거래위원회(FTC) 이번 주 “오픈AI가 공공 데이터를 스크랩하는 과정에서 불공정하거나 사생활이나 데이터 보안 관행을 어기고, 챗봇 제품을 통해 허위 정보를 공개해 피해를 입혔다”며 조사에 착수하기도 했다. 상황이 갈수록 구글, 오픈AI 등 AI개발사에 불리하게 돌아가는 셈이다.

그런 고민 끝에 구글, 오픈AI 등은 아예 언론사와 ‘뉴스 제휴’를 하는 방법으로 국면을 돌파하는 전략을 구사한 것이다.

실제로 노스웨스턴대 통신학·컴퓨터공학과의 디아코풀로스 교수는 “이번 오픈AI와 AP 간의 라이센스 협정은 AI훈련 목적으로 사용할 수 있는 자료를 제공하기 위한 목적이 첫 번째”라면서 “또한 FTC가 아예 이번 소송을 통해 모든 외부 정보나 자료 접근을 차단할 수도 있다는 위기감이 크게 작용한 것으로 보인다”고 AP통신에 밝혔다.

이에 AP측은 “일단 지적 재산권이 보호되고 콘텐츠 제작자가 AI개발업체로부터 공정한 보상을 받을 수 있도록 보장하는 프레임워크”라고 협정의 취지를 강조했다.

(이미지=셔터 스톡)
(이미지=셔터 스톡)

이들 두 회사는 구체적인 내용은 밝히지 않았지만 “뉴스 제품과 서비스에서 생성 AI의 잠재적 사용 사례”도 검토하고 있다고 밝혔다. 즉, 장차 생성AI를 이용한 ‘기사 쓰기’도 염두에 두고 있는 듯한 뉘앙스다.

한편 AP는 아직은 뉴스 기사에서 생성적 AI를 사용하지 않지만, 기업 수익 보고서 등 내부에선 이미 지난 10년 동안 다른 형태의 AI를 사용해온 것으로 알려졌다.

또 일부 지사에선 AI를 업무에 접목할 수 있도록 돕는 프로그램도 운영하고 있으며, 최근 AI 기반 이미지 아카이브 검색기능도 도입했다. 글로벌 언론매체 중에서 가장 AI 친화적인 분위기가 형성되어 있는 셈이다.

AP통신에 이어, WP, WSJ 역시 구글과 라이센스 협정을 추진하는데 대해 “앞으로 언론계의 큰 변화를 촉발하는 계기”로 보는 시각이 우세하다.

언론 비평가 켄 닥터는 “(해당 언론사들의) 규모와 다른 뉴스 매체와의 관계나 영향력 등으로 미뤄볼 때 이번 협정의 효과는 상상키 어려울 정도로 클 수도 있다”고 로이터통신에 밝혔다.

저작권자 © 애플경제 무단전재 및 재배포 금지