날로 데이터 분석 ‘붐’, ‘처방적 분석’ 가미되며 더욱 경쟁 가열
ML 기반 신흥 기업들, IBM, 오라클 등 기존 분석·제공업체 위협
‘솔루션에 생성AI 탑재’ vs ‘ML 기반 구문 분석, 시나리오 평가’ 맞서기도
[애플경제 전윤미 기자] 생성AI가 발달할수록 가장 중요한 요소는 데이터다. 데이터 마이닝에 이은 정밀한 분석은 곧 정확하고 품질좋은 데이터셋을 가능하게 하며, 심층적이고 수준높은 학습에 의한 고성능 AI를 구축할 수 있다. AI를 고도화하기 위한 데이터 수집과 분석이 중요하다보니, 특히 데이터 분석 시장이 발달하면서 경쟁이 치열해지고 있다.
합성데이터 생성과 AI경량화를 전문으로 하는 젠젠AI의 조호진 대표는 “특유의 미디어 데이터 기술, 즉 모바일 영상의 초해상도 및 이미지 샤프닝으로 이런 추세에 대응하기도 한다”면서 “앞으로 양질의 데이터셋을 위한 데이터 애널리시스(분석)가 AI발달의 핵심 요소가 될 것”이라고 밝혔다.
“향후 수 년 동안 시장 급성장”
이런 관측은 이미 글로벌 시장분석기관들에 의해서도 뒷받침되고 있다 더욱이 “AI 기반 시스템이 산업계 전반에 파급되면서 향후 수 년 동안 주요 성장이 촉진될 것으로 예상된다”고 밝혔다.
시장조사기관 ‘글로벌 데이터’(GlobalData)의 새로운 연구에 따르면 실제로 글로벌 데이터 분석 시장은 IoT, 클라우드 컴퓨팅, AI의 발전에 힘입어 빠르게 성장하고 있다. 이에 따르면 2025년까지 데이터 볼륨이 무려 175제타바이트를 초과할 것으로 예상된다. 전체 데이터 분석 시장 역시 2023년에서 2028년 사이에 연평균 성장률(CAGR) 11.1%로 성장한 끝에 2028년에는 1,900억 달러에 도달할 것으로 예상된다.
데이터 분석 분야는 이미 시장이 성숙한 상태다. 그런 가운데 최근 몇 년 동안엔 하드웨어, 데이터 관리, 애플리케이션, 배포 등 가치 사슬을 망라하며, 큰 발전이 거듭되었다.
전문가들에 의하면 특히 단순한 분석을 뛰어넘는 ‘처방적 분석’이 데이터 분석 붐을 일으키는 촉매 역할을 하고 있다. 이는 단순히 무슨 일이 일어났는지, 왜 일어났는지 설명하는데 그치지 않고, 기업이나 조직이 다음에 무엇을 해야 하는지를 알려준다.
특히 머신 러닝(ML) 기술이 발달하면서 방대한 데이터를 구문 분석하고, 있을 수 있는 시나리오를 미리 시뮬레이션하거나 평가한다. 그 결과로 데이터에 기반한 추후 의사결정과 실행 방향을 제시하는 것이다.
현재 세계적으로 이같은 데이터 분석 시장을 리드하는 글로벌 기업들로는 IBM, 오라클, SAS, SAP 등이 있다. 그러나 기존의 시장을 지배하던 이들 데이터 분석 공급업체들은 최근 ML을 사용, 분석하고 의사 결정을 자동화하도록 하는 또 다른 업체들에게 추격당하고 있다. 대표적으로 ‘코그니티브 스케일’, ‘H2O.ai’와 같은 AI 기반 공급업체 등이 있다.
이에 데이터 분석 공급업체들도 분석 플랫폼에 AI솔루션을 내장하는 등으로 맞서고 있어 더욱 시장 쟁탈전이 치열하다. 예를 들어 MS는 엑셀이나 ‘PowerBI’와 같은 분석 도구에 챗GPT를 내장한 코파일럿을 출시햇다. 이는 기업의 AI기능에 획기적인 변화를 유도하고 있다.
기존 글로벌업체에 신흥 DB기업들 맹추격
앞서 ‘GlobalData’도 이같은 추세를 좀더 자세히 전하고 있다. “기존의 데이터 분석 공급업체는 머신 러닝을 사용, 기업 의사 결정을 자동화하도록 지원하는 AI 기반 공급업체에 의해 위협받고 있다”고했다. 특히 “생성AI 도구의 등장으로 데이터 분석 공급업체들이 해당 솔루션을 플랫폼에 내장함으로써 일종의 데이터 과학 기능에 대한 액세스를 민주화한 셈”이라고 풀이했다.
앞으로 데이터 양이 급속히 증가하고, 더욱 고급스럽고 정밀한 분석에 대한 기대가 높아지면서 특히 관리나 보안 측면에서 허점이 생길 가능성이 크다는게 전문가들의 우려다. 또 생성AI가 방대한 데이터 세트에서 매우 정교한 모델과 시뮬레이션을 생성할 수 있다는 점도 또다른 문제를 유발할 수 있다. 대표적으로 민감한 개인 정보를 유출하거나 무단으로 오용하는 현상 등이다.
AI 시스템이 더욱 자세하고 현실적인 분석을 생성하는 데 더 능숙해질수록 그런 위험도 커진다는 지적이다. 이에 따라 민감한 데이터가 노출되지 않도록 하는 엄격한 데이터 관리 시스템이 필요하다.
데이터 분석 경로를 관리하기 위해선 데이터 과학자, 데이터 엔지니어, 각종 데이터 전문가 등 숙련된 인재들이 중요하다는 주문도 따른다. 즉 데이터 분석에는 시각화, 보고, 커뮤니케이션 기술이 필요하기 때문이다. 이를 아우를 수 있는 고급 인력과 인프라가 그 만큼 중요해진다는 얘기다.
소규모 기업이 대부분인 국내 업계 일각에선 이를 만족시킬 만한 자체 역량이 미흡한 실정이다. 이에 드물긴 하지만, 소규모 데이터 분석 업체와의 전략적 인수나 파트너십을 맺는 사례도 있다. 이를 통해 “데이터 관리, AI 통합 등을 아우른 시스템으로 시장 경쟁에 대응한다”는 것이다.
