NYT, AI생성 이미지 실험 결과 ‘눈길’, “오답률 높아”
달리, 미드저니 생성, 평균 오답률 90% 달할 만큼 정교

달리, 미드저니 등 AI 이미지 도구로 생성한 얼굴과 실존 인물의 얼굴들. (사진=뉴욕타임스)
달리, 미드저니 등 AI 이미지 도구로 생성한 얼굴과 실존 인물의 얼굴들. (사진=뉴욕타임스)

[애플경제 전윤미 기자] ‘Dall-E’나 ‘Midjourney’ 등 인공지능에 의한 각종 이미지 생성 툴은 실제론 존재하지 않는 가상의 인물을 진짜 사람과 똑같은 모습으로 재현할 수 있다. 이런 이미지 중 어떤 것이 실제 사람이고 어떤 것이 AI로 생성되었는지 식별하는게 쉽지 않을 정도다.

이에 ‘뉴욕타임스’가 21일 여러 장의 인물 사진을 제시하고, 그 중 AI가 만든 것과, 실제 인물을 구분해보라는 ‘퀴즈’ 성격의 기사를 게재해 눈길을 끈다. 이는 AI연구원들이 실험한 결과를 소개한 것이다.

상단은 실제 인물, 하단은 AI가 만든 얼굴

이 신문이 제시한 사진은 모두 10장이다. 그러나 모든 사진이 선뜻 AI 생상 인지, 실제 인물인지를 구분하는게 쉽지 않다. 분석 결과 상단의 5장은 모두 실제 인물이고, 하단의 5장은 AI가 생성한 것이다.

그러나 실험 결과 상단 오른쪽에서 두 번째 사진은 ‘실제 인물’로서, 이를 맞춘 사람이 90%를 차지했다. 또 하단 오른쪽에 두 번째 사진은 AI가 생성한 것으로 정답 비율이 82%에 달했다. 두 사진 모두 실제와 AI 생성 여부를 비교적 식별하기 쉬운 이미지라는 분석이다.

그러나 나머지 8장의 사진은 오답률이 90% 안팎에 달할 만큼, 식별하기가 어려운 것들이다. 특히 아래 5장의 사진은 언뜻 육안으로 봐선 분간하기가 쉽지 않을 만큼 실물과 똑같이 정교하게 만들어졌다.

지난 몇 년 동안 ‘Dall-E’, ‘Midjourney’와 같은 도구가 공개된 이후 이처럼 AI가 생성한 뉴스 속보나, 패션, 유명인 모습 등은 크고 작은 혼란을 불러일으켰다.

‘뉴욕타임스’ 실험에서 보듯, 실제 얼굴과 AI가 생성한 얼굴을 구별하는 것은 매우 헷갈리는 일이다. 어떤 경우는 AI가 만든 사람 얼굴은 실제 인물보다 더 진짜같은 느낌을 줄 정도다. AI 연구가들 사이엔 이를 두고 ‘실제 사진보다 더 사실적’이라고 해서, ‘하이퍼리얼리즘’이라고 불리기도 한다.

실제보다 더 실물같은 ‘하이퍼리얼리즘’

AI 개발자들은 날로 탁월한 생성 능력을 지닌 AI를 만들어내고 있다. 이미지 생성 도구는 실제 사람의 이미지를 수 만 장이나 학습했기 때문에 하이퍼리얼리즘적인 사람 얼굴을 생성해낼 수 있다. 다만 이러한 훈련 데이터 세트에는 대부분 백인의 이미지가 포함되어 있다보니, 생성 결과도 모두 하이퍼리얼한 백인 얼굴이다.

이에 ‘뉴욕타임스’는 “AI 교육을 위해 백인의 이미지에 지나치게 의존하는 것은 기술 산업에서 널리 지적되고 있는 문제점”이라고 했다.

그렇다보니 AI연구자들은 실험에 참가한 사람들이 실제 인물과 AI 생성 이미지를 구분할 때 백인이 아닌 다른 인종의 얼굴은 한층 쉽게 식별할 수 있다는 사실을 발견했다. 또한 실험 참가자들에게 자신이 선택한 것이 얼마나 확실한지 표시하도록 요청했는데, 역설적으로 자신감이 높을수록 틀릴 가능성이 컸다.

관련 연구를 오래 해온 호주국립대학교의 에이미 다웰(Amy Dawel) 박사는 “(실험 참가자들의) 과도한 자신감에 매우 놀랐다.”며 “이는 사람들이 인터넷에서 더 혼란스럽고, 잘못된 정보에 더 취약하게 만드는 결과를 보여주는 것”이라고 ‘뉴욕타임스’에 밝혔다.

AI가 생성한 얼굴이 실제 사람보다 더 진짜처럼 여겨지다보니, 디지털 이미지나 생성물이 온라인 공간에서 허위사실이나 오해의 소지가 있는 메시지를 널리 확산시키게 된다.

사람의 평균적 이목구비 비율로 ‘진짜’같아

얼마 전까지만 해도 AI가 실제에 가까운 인물을 생성하더라도, 어딘가 부자연스러운 구석들이 있어서, 실존 인물이 아님을 어렵잖게 식별할 수 있었다. 예를 들어 거울에 비친 것처럼 똑같은 양쪽 귀나, 같은 방향을 바라보는 눈과 같은 것들이었다.

그러나 AI기술이 발전함에 따라 이젠 그런 한계를 벗어났다. 이번 ‘뉴욕타임스’가 소개한 이미지를 생성한 AI 연구원들은 “생성된 가상인물은 실험 참가자들 사이에서 의심을 불러일으키지 못할 정도로 평균적인 사람 얼굴 비율에 매우 가깝다”고 했다.

이번 참가자들이 그랬듯이 사람들은 사진을 식별할 때 기형적인 귀나 평균보다 큰 코와 같이 평균 비율에서 벗어난 특징에 집착하는 것처럼 보였다. 이를 AI의 징후로 간주한 것이다. 그러나 이번에 제시된 사진에선 그런 징후를 전혀 포착할 수 없어 어려움을 겪었다는 후문이다.

연구에 사용된 이미지는 학습 과정에서 백인 얼굴이 전체의 69%를 차지한 사진 저장소에서 훈련된 이미지 모델 ‘StyleGAN2’에서 가져온 것이다. 참가자들은 그 중 얼굴 비율, 피부 모양, 주름, 눈과 같은 얼굴 특징을 포함하여 결정을 내리는 데 몇 가지 특징에 의존한 것으로 전해졌다. 그럼에도 불구하고, 오답률이 90%에 달할 만큼 정교했다.

저작권자 © 애플경제 무단전재 및 재배포 금지