“AI 도입 성공은 ‘데이터 통합’ 여부에 달려”
평범한 진리 불구, 실제 ‘통합’ 체계화 기업 많지 않아 고품질의 신뢰할 만한 데이터 기반 AI 결과라야 ‘신뢰’ “쓰레기가 들어가면 쓰레기, 보석이 들어가면 보석” 글로벌 빅데이터 기업들 “데이터 준비성이 성공의 관건”
[애플경제 이지향 기자] AI 시대가 본격화하면서 적잖은 기업들은 여전히 방향을 제대로 잡지 못하고 있다. 국내 산업계 전반에 걸쳐 이런 모습이 하나의 ‘현상’이 되고 있다. 그러나 AI 혁신은 분명 필요하다. 이에 AI 도입을 둔 혼선을 정비하고 방향을 뚜렷이 설정할 필요가 있다. 이를 위해 그 무엇보다 중요한 것이 ‘데이터’다. 좀더 정확히 표현하면 회사 안팎의 데이터를 체계적으로 통합, 관리하는 시스템이다.
테이터 통합, 말처럼 쉽지는 않아
이는 그 동안 팔란티어테크놀로지스나 데이터브릭스, 스노우플레이크, 렐티오 등 글로벌 빅데이터 기업들이 한 목소리로 강조하는 대목이다.
그러나 말처럼 데이터 통합과 관리가 쉬운 일은 아니다. 이른바 마스터 데이터 관리(MDM) 시스템을 출시한 렐티오는 “현실은 목적하는 바와 다른 경우가 많다. 대부분의 프로젝트가 줄곧 파일럿 모드에 머물거나, 고립된 실험 단계에 머물러 있기도 한다”면서 “신뢰할 수 없고 분산된 데이터가 AI의 잠재력을 제한하고 있음을 보여주는 신호가 사내 곳곳에서 발견되곤 한다”고 했다.
만약 그런 상태에서 AI챗봇을 활용할 경우 “정보 제공을 도와드리기 위해 (챗봇이) 여기에 있지만, 전문가의 안내를 대신할 수는 없다”와 같은 ‘면책 조항’으로 시작하는 출력을 접할 수 밖에 없다. 데이터의 태부족이나, 난삽하고 무질서한 데이터탓이다. 그 바람에 “정확성을 위해 (챗봇이) 노력하지만 실수할 수도 있다. (정확성을 원하면) 중요한 세부 정보를 확인해달라”는 챗봇의 반응을 접할 수 밖에 없다.
이는 기업이 고품질의 신뢰할 수 있는 데이터 입력 없이는 AI 결과를 완전히 신뢰할 수 없기 때문이다. 그 결과 오로지 ‘안전성’을 생각하는 기업은 좁은 통제된 환경에서 AI를 차단하고 만다. 결국 혁신은 물 건너가고, AI 도입은 낭비가 되며, 규모의 경제는 언감생심이 되기 십상이다.
AI 프로젝트는 그렇다고 단일한 경로나 맥락으로 진행되어서는 안 되며, 현실적으로도 불가능하다. AI의 효용을 기하려면 광범위한 맥락에서 사내의 여러 시스템과 팀을 망라하며, 모든 인사이트를 총괄 통합하는게 중요하다. 그러나 많은 기업이 특정한 용도나 좁은 업무 영역에 국한시킴으로써 확장에 어려움을 겪고 있다. 이유는 무엇일까? 다름 아닌 ‘기반 데이터’가 준비되지 않았기 때문이다.
즉, “데이터가 AI를 위해 준비되지 않았다면 AI는 실험 단계를 넘어설 수 없다”는 경고다.
‘AI 준비 데이터’에 대한 명확한 정의
데이터브릭스는 이처럼 ‘AI를 위해 준비된 데이터’를 명확하게 정의했다. 즉, “기업의 가장 중요한 정체성(실체)에 대한 안전하고, 정제되고, 보강되고, 통합되고, 신뢰할 수 있는 데이터”로 정의한다. 또 “실시간 운영과 심층 분석 등을 위해 즉시 액세스할 수 있어야 한다”고 했다.
그러면서 “고객 기록이 여러 부서에 중복되지 않고, 제품 정보가 오래된 시스템에 분산되지 않으며, 공급업체, 위치, 자산 및 관계 데이터는 정확하고 최신 상태이며 항상 정확해야 한다”고 규정했다.
예를 들어 글로벌 소매업체의 경우 통합된 고객이나 제품 데이터가 없으면 고객 맞춤형 등의 노력이 무의미해진다. 그저 관련성 없는 추천과 매출 손실로 이어질 뿐이다. 그러나 “통합된 데이터를 사용하면 그런 문제가 해결되고 지능적이고 시의적절한 데이터 통합이 이뤄진다”는 것이다.
최신 데이터 통합 플랫폼을 운영하는 렐티오는 자사의 마스터 데이터 관리(MDM)를 예로 들며, “클라우드 네이티브와 실시간 기능을 통해 기업의 핵심 가치는 물론, 상호 작용과 거래, 고객 관계 등을 통합한다”고 소개했다. 특히 지능형 데이터 그래프가 특징이라고 했다. 이를 통해 데이터를 연결하고 맥락화함으로써 AI가 활용할 수 있도록 한다. “기업 전체에 지능적이고 전사적인 에이전트 AI 역량을 강화한다”는 것이다.
흔히 AI전문가들은 AI(챗봇 등)에 대해 “쓰레기가 들어가면 쓰레기가 나온다”는 속설을 즐겨 인용하기도 한다. 즉 신뢰할 수 있고 정확한 (출력) 인사이트는 역시 ‘신뢰할 수 있는 정확한’ 데이터에 달려 있다는 얘기다. 이런 철칙은 지난 수 십 년 간 변하지 않았다. “변한 것이 있다면 ‘속도’와 관련된 위험 요소일뿐, 데이터를 기반으로 AI가 작동한다는 사실은 변하지 않았다”는 것이다.
‘인간 의사결정권자’처럼 AI도 ‘신뢰’가 중요
사실 AI 시스템이란 애초 ‘인간 의사 결정권자’에게 필요하듯, ‘신뢰’가 중요하다. 그것을 위해서라도 항상 최신 상태이며, 항상 사용 가능하고, 항상 맥락에 맞는 데이터가 필요하다는 주장이다.
물론 날이 갈수록 ‘속도’가 중요하긴 하다. 속도를 빠르게 하기 위해서도 실시간 상호작용가 선제적 고객 대응, 신속한 의사 결정을 즉시 지원할 수 있는 통합 데이터가 필요하다. 레거시 시스템이나 단편화된 아키텍처로는 불가능한 일이다.
앞서 빅데이터 기업들의 데이터 통합 플랫폼은 이를 겨냥한 것이다. 즉 “기업 데이터를 지속적으로 정리, 보강, 통합하고, 일상적인 업무 현장에서도 AI를 활용할 수 있도록” 하는 것이다. 팔란티어는 “진실은 AI의 성공이 가장 화려한 도구나 새로운 기술을 사용하는 데 있는 것이 아니다”면서 “준비성, 즉 데이터 준비성이 성공의 관건”이라고 했다.
즉 “준비된 데이터가 없다면 최고의 AI 모델조차도 ‘연료가 없는 고성능 자동차’와 같다. 보기에는 좋지만, 빠르게 나아가진 못하는 차량과 같다”고 짚었다. 이에 따르면 최종 승자는 ‘불량 데이터’ 때문에 속도를 늦추지 않는 기업이다. 신뢰할 수 없는 데이터 때문에 ‘병목 현상’이 생겨선 안 된다는 지적이다.
데이터브릭스는 “AI 시대의 승자는 데이터를 단순한 자산이 아닌 기반으로 여기는 기업”이라고 단언했다. “신뢰할 수 있는 데이터를 통해 단순한 파일럿 단계를 넘어 개인화된 경험, 지능형 워크플로, 더 빠르고 스마트한 의사 결정을 실현할 수 있을 것”이라며 “AI 도입의 경쟁력은 결국 그 원동력이 되는 데이터에 따라 정해진다”고 강조했다.