저작권 침해 방지, 표준기구 C2PA 정한 메타데이터 표시
검색 이미지, 광고 등에 적용, “생성AI 출처 명확 표시로 고객 신뢰”
[애플경제 이보영 기자] 구글이 검색 결과로 나온 AI 생성 이미지를 식별하기 위한 ‘라벨’을 지정한다. 구글에 의하면, AI 생성 이미지에 대해 ‘Circle to Search’ 및 ‘Google Lens’에 C2PA(Coalition for Content Provenance and Authenticity) 메타데이터를 표시하기로 했다.
C2PA는 일종의 메타데이터 표시 기준을 만든 기구다. 이런 식별 메타데이터는 일종의 콘텐츠 자격 증명이기도 하다. AI가 생성한 이미지에 대한 식별은 이제 AI의 생활화가 가속화되면서 매우 중요해졌다. 구글의 새로운 AI 식별 기능은 나름대로 고객 신뢰를 확보하고, 검색과 광고에 대한 공신력을 높이기 위한 방안의 하나로 나온 것이다.
구글은 블로그 게시물을 통해 “앞으로 몇 개월 안으로 검색창고 이미지 및 광고의 이미지가 카메라로 촬영되었는지, 포토샵으로 편집된 것인지, 또는 AI로 생성되었는지 표시될 것”이라고 밝혔다. 구글은 어도비를 포함한 다른 기술 회사와 함께 AI 생성 이미지에 이같은 메타데이터 라벨을 부착하기로 했다.
이는 일종의 워터마크로 볼 수 있다. AI 워터마킹 표준은 구글이 지난 2월에 가입한 표준 기구인 C2PA에서 만든 바 있다. C2PA는 어도비와 비영리 단체인 JDF(Joint Development Foundation)가 지난해 공동으로 설립한 것으로, 온라인 콘텐츠의 출처를 추적하는 표준을 개발했다. 지금까지 C2PA의 가장 중요한 프로젝트는 AI 레이블링 표준인 콘텐츠 증명(CC, Content Credentials)이다.
구글은 C2PA 표준의 ‘버전 2.1’을 개발하는 데 일조한 것으로 알려졌는데, 이 표준은 원본을 자의적으로 변조하는 것을 방지하는 기능을 한층 강화한 것이다. 앞서 오픈AI도 지난 2월에 “현실을 똑같이 묘사한 소라(Sora)AI 영상에도 C2PA 메타데이터가 포함될 것”이라고 밝힌 바 있다. 그러나 아직 ‘소라’는 대중에게 공개되지 않았다.
현재 아마존, 메타, 오픈AI 등 많은 테크 기업들이 C2PA 운영 위원회에 참여하고 있다. 이에 대해 C2PA를 주도한 어도비 측은 당시 보도자료를 통해 “콘텐츠 인증 정보는 모든 종류의 콘텐츠에 대한 디지털 라벨 역할을 할 수 있다”며 “이는 온라인에서 신뢰와 투명성을 재건하기 위한 기반이 될 수 있다.”고 의의를 강조했다.
C2PA는 대부분의 온라인 플랫폼보다 빠르게 레이블 지정 표준을 출시하고 있다. 사용자가 메타데이터를 볼 수 있는 ‘이 이미지에 대한 정보’(‘About this image’ feature) 기능은 현재로선 호환되는 안도로이드 기기의 구글 이미지와 ‘Circle to Search’, ‘Google Lens’에만 표시된다. 아직은 사용자가 수동으로 메뉴에 액세스해서 메타데이터를 확인해야 한다.
어도비 등 설립 C2PA의 ‘레이블 지정 표준’ 도입
구글은 블로그를 통해 “구글 검색 광고에서 ‘C2PA 워터마킹’을 날로 늘려가며, C2PA 신호를 통해 주요 정책을 시행하는 방법을 알리는 것이 목표”라고 밝혔다. 현재 C2PA는 이 콘텐츠 자격 증명 배지를 이미지 증명을 위한 범용 아이콘으로 만들었다. 구글은 또한 카메라로 촬영한 유튜브 동영상에도 C2PA 정보를 포함할 계획이다. 이런 식으로 연말 이전까지 좀더 많은 분야에 걸쳐 이를 확산시킨다는 방침이다.
이는 신원이 분명한 AI 이미지는 기업에게도 매우 중요하다는 인식에 바탕을 두고 있다. 그래서 구글은 “AI에서 생성된 이미지의 확산을 직원들이 알고 있는지 확인하고, 이미지 출처를 확인하도록 교육해야 한다”며 “이를 통해 잘못된 정보가 확산되는 것을 방지하고, 직원들이 사용 권한이 없는 이미지를 사용할 경우 발생할 수 있는 법적 문제를 방지할 수 있다”고 밝혔다.
흔히 AI에서 생성된 이미지를 사용할 경우 AI 모델이 어떻게 수집되고 학습되었는지 판단하기는 쉽지 않다. 그 때문에 저작과 소유권에 대한 문제가 비일비재하게 생긴다. AI 이미지는 때때로 식별하기 어려울 정도로 교묘한 경우가 많다. 그러나 소비자들이 특정 제품으로부터 그런 허점을 찾아낼 경우, 기업과 제품에 대한 신뢰가 크게 떨어질 수 있다.
C2PA는 물로 AI 생성 콘텐츠를 식별하는 유일한 방법은 아니다. 이 밖에도 시중엔 이미 각종 가시적인 워터마킹이나 지각적 해싱 또는 지문 등이 많이 활용된다. 때로 아티스트들은 나이트쉐이드(Nightshade)와 같은 ‘데이터 포이즈닝’ 필터를 사용, 생성 AI를 혼란스럽게 만들어 AI 모델이 자신의 작업을 함부로 학습하는 것을 방지할 수도 있다.
‘데이터 포이즈닝’은 생성AI 학습 데이터를 조작함으로써 머신러닝 모델이 혼동을 일으켜 예기치 못한 결과를 보이도록 유도하는 것이다. 이 기술은 ‘클로킹’을 사용, 생성AI 학습 알고리즘을 속여 실제 수집되는 데이터와 완전히 다른 데이터로 믿도록 하는 것이다. 예술가와 작가들이 빅테크에 맞서 저작권을 보호하기 위한 수단으로 등장한 기술이다.
이에 구글은 원치않은 저작권 침해 사례를 막기 위해 자체 AI 감지 도구인 ‘SynthID’를 베타 버전으로 출시한 상태다. 이번 C2PA 라벨을 검색 AI생성 이미지에 도입키로 한 것도 그런 노력의 일환으로 받아들여지고 있다.
