‘데이터 경제’ 내지 ‘빅데이터 시대’라곤 하지만 그것이 정의로운가 하는 것은 또 다른 문제다. 진리나 진실은커녕 ‘사실’에도 미치지 못하는 재료와 정보가 난무하기 때문이다. 당연히 허구적 인사이트를 맹종하며, 잘못된 의사결정으로 수많은 정치․경제․사회․문화적 오류와 난맥상을 초래하기 일쑤다. 가히 ‘데이터 전체주의’ 시대라고 해야 마땅한 지경이다. 그래서 눈길을 끄는게 ‘메타데이터’다. 이는 주어진 데이터를 덥썩 받아들이기보다, 먼저 해부하고 분석해보는 것이다. 데이터의 의미는 무엇이며, 그 구성분자나 정보의 맥락은 어떠한지, 그 이면에 감춰진 의도는 또 무엇인지를 알아내는 것이다. 다시 말해 ‘데이터를 만든 데이터’를 분석하는 것이다.
메타데이터는 우선 기능적인 효용부터가 뛰어나다. 아무 데이터나 마구 뒤섞어 분석, 분류하는 무작위 데이터 라벨링은 매우 비효율적이다. 이에 반해 메타데이터 작업을 거친 후라면, 원본 데이터를 다시 체계적으로 구조화하는게 수월하며, 데이터를 정의하고 분류하는 일도 간단, 명료하게 해낼 수 있다. 데이터 프로세스의 효율성을 기하는데도 아주 그만이라는 얘기다. 그러나 이는 기능적 이점에 불과할 뿐이다. 정작 중요한 것은 “왜 이런 데이터가 생성됐는가?”, “그 쓸모나 의미는 무엇인가?”, “이런 데이터를 과연 의미있는 결과값에 포함시켜도 되는가?” 따위의 질문이다. 메타데이터의 핵심 가치는 그런 것들이다.
메타데이터는 인류 정신문명의 진화와도 닮았다. ‘과학 이전’의 세계에선 현상이나 대상을 그저 회화적인 이미지로 소묘할 뿐이었다. 그러나 과학이 등장하면서는 그런 감성적 직관에 더해 자연을 기하학적으로 구체화하는 기하학화(geometrisation)의 시대가 열린다. 서구 데카르트주의와 뉴턴 역학의 성공이나, “빛은 입자 아닌 파동”이라며 뉴턴을 받아친 프레넬의 광학이론의 성과 같은 것들이 그 배경에 있었다. 한 발 나아가서 이젠 단순히 직관을 벗어나거나 대상에 대한 즉각적 경험을 배척하는데 그치지 않고, 보이지 않는 것들을 보게 되는 무한 상상력의 시대가 열린다. 곧 추상화의 시대다.
이런 추상작용은 인류 정신을 해방시켜주고, 유물론적 역사주의나 실증주의를 뛰어넘게 했다. 빅데이터 시대 운운하는 지금이야말로 이런 ‘기하학화’와 ‘추상화’가 어우러진 변증법적 사고가 충만해야 할 때다. 그 어떤 정보나 데이터에 대해서도, 눈 앞에 보이는대로 크로키할게 아니라, 보이지 않는 것을 보고자 하는 추상화의 태도가 필요한 것이다. 매사에 부정적 질문을 던지는, 이른바 ‘부정(否定)의 철학(philosophie négative)’ 또한 필요한 시기다. 즉 보이는 것만 보는, 인식론적 한계를 극복해야 하는 것이다.
그렇지 않고, 최초로 목격된 경험이나 일반화된 관념, 현상을 그저 맹신하고 수용만 하다간, 착시현상을 부를 뿐이다. 본질에는 무지한채 편견과 확증편향, 비과학적 오류만을 반복할 뿐이다. 국내 포털뉴스 사이트 일각에서 말하듯, “뉴스 배열은 알고리즘에 따른 것일뿐”이라는 식의 알고리즘 지상주의는 공허한 알레고리를 내세운 ‘데이터 전체주의’의 핑계일 뿐이다. 그런 점에서 메타데이터야말로 정의로움에 한 발 다가서는 디지털 시대의 무기라고 하겠다.
애당초 ‘데이터’는 ‘본질’이 될 수 없다. 감성적 직관에만 매몰된채, 목격된 이미지에만 매달릴 경우 이는 그저 허상에 불과한 ‘환타스마타’ 내지 거짓된 기호일 뿐이다. 그래서다. 데이터의 데이터가 무엇인지, 데이터 생성을 둘러싼 인간과 환경은 어떠했는지 등과 같은 형이상학적 분석과 맥락 집중이 절실한게 지금 ‘빅데이터’ 시대다. 그런 과정이 없는 데이터란 그냥 허접한 나뭇가지일뿐, 이글이글 불길을 지피는 잉걸이 될 수 없다. 모름지기 ‘빅데이터’ 아닌 ‘빅 메타데이터’ 시대가 바람직한 까닭이다.
