아무리 공정하다고 여겨지는 알고리즘이나 데이터라 해도 특정 인간의 특정 의도가 투영될 수 밖에 없다. 수용자 역시 마찬가지다. 수많은 데이터를 두고 자신에게 필요한 가정들을 검증없이 재생산하고, 그 가정들을 정당화하는 데이터만 받아들이기 십상이다. 그 결과는 추악한 예측모형이다. 송수신하고픈 주파수 대역 이외의 것들은 걸러버리는 확증편향의 디지털 문맹자들만 양산하게 되는 것이다. 그래서 중요한게 데이터 해독과 구사 능력, 곧 데이터 리터러시다.
온통 데이터와 알고리즘으로 작동하는 세상에서 이는 절박한 인간조건으로까지 승격된다. 본디 인간은 자연과 만물의 형상, 곧 자연언어의 일부가 아니던가. 그러나 이를 다시 인간의 눈으로 묘사하고 생성함으로써 인간언어, 곧 문명을 태동케 했다. 이제 IT와 ICT기술을 아우른 디지털 시대엔 그것들을 초월한 제3의 공시적 언어가 절실해졌다. 그 새로운 언어의 문법이 되어야 마땅한게 바로 데이터 리터러시다. 이는 인간언어로 묘사되어온 문명을 디지털화하는 과정에서 그 목표가치를 정확히 조준하는 매뉴얼이며, 디지털 문명을 살아가는 모든 주체들의 올바른 화법이다.
가트너는 그래서 데이터 리터러시를 좀더 직설적으로 풀이했다. “상황에 맞게 데이터를 읽고 쓰며 소통할 수 있는 능력”으로 본 것이다. AI나 머신러닝에 의해 매일 무한정 쏟아지는 빅데이터는 인류 문명사 이래 초유의 분별과 해독력, 구사능력을 요구하고 있다. 작게는 그것의 발원지 곧 데이터 소스와 구조, 마이닝 과정에서의 식별능력, 지성을 토대로 한 분석과 사용, 그리고 그 결과값에 대한 객관적 설명이 뒤따라야 한다. 크게는 그렇게 도출된 결과나 지표가 갖는 가치에 대한, 가장 공정한 산업적, 사회적 해독이 가해져야 할 것이다.
그런 리터러시를 바탕으로 다시 디지털 시대를 관통하는 ‘데이터 언어’가 생성되어야 한다. 이는 다시 디지털 문명의 각자 처한 현장, 즉 정치와 경제, 산업, 기업과 비즈니스 등에서 적절하게 구사되거나, 효율적으로 활용될 것이다. 물론 산업이나 사회 각 분야별 영역의 특성에 따른 변형이 있을 순 있겠다. 생활언어가 그렇듯이, 마치 방언처럼 특수한 용도에 걸맞은 변용과 응용은 허용될 수 있다. 허나 왜곡된 해독이나 구사, 즉 아예 소통이 불가할 정도의 ‘사투리’가 되어선 안 된다.
애당초 디지털 문명 초입에서부터 디지털 문맹을 퇴치하기 위한 고민을 먼저 했어야 했다. 그런 이해와 분석이 있을 때 온갖 데이터 문명의 허와 실도 선명히 보이고, 합리적으로 문명을 조작하고 제어할 방법이 생기기 때문이다. 물론 디지털 사회의 경쟁력을 위해선 유망한 인재와 창의적인 기술이 중요하다. 그러나 맨파워나 기술력 역시 데이터로부터 조합된다. 그 어떤 산업체나 사회구성체이든, 튼실한 데이터 리터러시가 작동할 때 사람과 기술이 제 몫을 해내는 것이다.
데이터 과학자 캐시 오닐은 “데이터와 알고리즘이 신을 대체했다”고 경악했다. 기실 데이터교 광신도들은 기하급수로 늘어나고 세상을 미혹하는 역설도 흘러넘친다. “태양이 지구를 돈다”는 식의 반동적인 도그마나, 반(反)공화적 혐오도 데이터의 옷을 입고 횡행한다. 오닐의 말처럼 빅데이터가 이젠 ‘대량살상무기’로 변질되는 형국이다. 그런 부조리한 현실에 대처하려면 데이터를 올바로 독해하고 소통하는 길 밖에 없다. 그래서 디지털 현상에 대한 착시와 오독, 편견을 인간 세상의 복잡한 방정식과 격리시켜야 하는 것이다. 그렇게 보면 데이터 리터러시야말로 디지털 시대의 강력한 백신이다.
