‘메타데이터 관리 솔루션, 멀티모달 데이터 패브릭, 에이전트 분석 등
데이터·분석, 리더에 대한 ‘자원 효율성 넘어 성과 압박 커져’…

데이터 분석 트렌드 이미지. (사진=펙셀)
데이터 분석 트렌드 이미지. (사진=펙셀)

[애플경제 이지향 기자] 합성 데이터, sLM(소규모언어모델), 복합 AI 등 9가지가 2025년 데이터·분석 트렌드로 선정되었다. 6일 가트너는 실행 가능한 객관적인 인사이트를 제공하는 ‘2025년 데이터 및 분석(D&A) 핵심 트렌드’ 9가지를 발표했다.

이는 생성AI 기반의 언어모델이 생활화되는 가운데, 이를 위한 데이터셋 등 데이터 프로세스의 필수적인 특성이기도 하다.

가트너코리아에 의하면 가레스 허쉘(Gareth Herschel) 가트너 VP 애널리스트는 “데이터 및 분석이 전문 영역에서 벗어나 점점 더 보편화되고 있다”면서 “이에 데이터 및 분석 리더들은 제한된 자원을 효율적으로 활용하는 것을 넘어, 더 많은 자원으로 더 많은 성과를 창출해야 하는 압박을 받고 있다”고 최근의 동향을 설명했다. 그는 또 “이런 기대와 요구 사항을 충족시키는 것은 점점 어려워지고 있으며, 이에 데이터 및 분석 리더는 주요 트렌드를 파악하는게 더욱 중요해지고 있다.”고 전했다.

금년 데이터·분석 트렌드로 우선 ‘활용도 높은 데이터 제품’(Highly Consumable Data Products)이 주목받고 있다.

활용도 높은 데이터 제품을 최대로 활용하는게 중요하다는 얘기다. 이를 위해 데이터 및 분석 리더는 비즈니스에 필수적인 사용 사례에 이같이 활용도 높은 데이터를 집중하고, 그런 데이터 제품 간 연결을 확장해야 한다는 주문이다.

또한 재사용이나 조합이 가능한 최소 기능 데이터 제품을 우선 제공함으로써 지속적으로 제품을 개선시킬 수 있도록 해야 한다. 특히 데이터 및 분석 리더는 데이터 제품의 성공을 측정하기 위해 생산 팀과 활용 팀 간의 핵심 성과 지표(KPI)에 대한 합의를 반드시 도출해야 한다.

‘메타데이터 관리 솔루션(Metadata Management Solutions)’도 주요 트렌드로 꼽혔다.

즉, “효과적인 메타데이터 관리는 기술적 메타데이터부터 향상된 컨텍스트를 위한 비즈니스 메타데이터에 이르기까지 폭넓은 관리를 요한다”는 설명이다. 이처럼 다양한 메타데이터 유형을 통합함으로써 데이터 카탈로그, 데이터 계보, AI 기반 사용 사례를 활성화할 수 있다. 이를 위해 메타데이터를 자동으로 탐색하고 분석하는 적절한 도구를 필수적으로 선택해야 한다는 주문이다.

‘멀티모달 데이터 패브릭’(Multimodal Data Fabric)도 중요하다. 강력한 메타데이터 관리 체계를 구축하기 위해서도 이는 필수라고 할 수 있다. 이를 위해 먼저 데이터 파이프라인 전반에서 메타데이터를 수집하고 분석한다. 그런 다음 멀티모달 데이터 패브릭을 통해 얻은 인사이트와 자동화 기능으로 데이터 오케스트레이션을 지원한다. 또한 데이터옵스(DataOps)를 활용해 운영 효율성을 개선하며, 데이터 제품을 활성화한다.

특히 금년에는 ‘합성 데이터’(Synthetic Data)가 더욱 부각될 것으로 예상되었다. 흔히 AI 개발 등의 과정에서 데이터 누락이나 불완전, 그리고 확보하기 힘들거나 비용이 많이 드는 영역의 식별은 매우 중요하다. 합성 데이터는 이처럼 현실적인 장애가 있는 경우에 매우 유용하다. 원본 데이터를 편의상 변형하거나, 또는 민감한 데이터를 대체할 수 있는 가상 또는 합성된 데이터를 구축하는 것이다. 이를 통해 “AI 개발을 촉진하면서도 데이터 프라이버시를 보장할 수 있다”는 기대다.

(사진=퓨처)
(사진=퓨처)

AI에이전트를 활용한 ‘에이전트 분석(Agentic Analytics)도 주요 트렌드로 부상할 전망이다. 이는 데이터 분석을 위해 AI 에이전트를 활용, 폐쇄 루프 비즈니스 성과를 자동화하는 혁신적인 방식이다.

이를 실현하려면 인사이트를 자연어 인터페이스에 연결하는 사용 사례를 시범적으로 운영할 필요가 있다. 이를 통해 디지털 업무 환경 애플리케이션 통합을 위한 공급업체 로드맵을 평가해야 한다. 뿐만 아니라 오류 및 환각 위험을 최소화하기 위한 거버넌스 확립과 함께 ’AI 레디‘(AI-Ready) 데이터 원칙을 통해 데이터를 준비하고, 점검 또한 필수적이다.

AI 에이전트(AI Agents)는 임시적, 탄력적으로 자동화가 필요하거나, 복잡한 적응형 자동화 모델을 필요로 하는 경우에 유용하다. 보다 정교한 AI 에이전트를 구축하기 위해서는 대규모언어모델(LLM)에만 의존하는 것을 넘어 다양한 분석 및 AI 모델을 활용해야 한다. 데이터 및 분석 리더는 AI 에이전트가 여러 애플리케이션 간 원활하게 데이터를 접근하고 공유할 수 있도록 지원해야 한다.

’소규모언어모델‘(Small Language Models, SLM)도 더욱 주목받을 전망이다. 특정 영역에서 보다 정확하고 맥락에 맞는 AI 결과물을 얻는 데는 대규모언어모델보다 소규모언어모델을 고려하는 것이 바람직하다는 얘기다. 증강 생성(RAG) 방식의 데이터 제공이나 맞춤형 도메인 모델의 미세 조정을 통해 성능을 최적화하는 것이 바람직하다.

“특히 온프레미스 환경에서 민감한 데이터를 다루고, 컴퓨팅 리소스 및 비용을 절감하는 데는 SLM을 사용하는 것이 효과적”이란 가트너의 설명이다.

’복합 AI‘(Composite AI)도 새삼 주목을 받을 전망이다. 즉, 여러 AI 기술을 결합해 활용하면 AI의 영향력과 신뢰성을 한층 강화할 수 있다는 뜻이다. 특히 데이터 분석팀은 생성AI나 LLM뿐만 아니라 데이터 과학, 머신러닝, 지식 그래프, 최적화 등 다양한 AI 기술을 통합해 포괄적인 AI 솔루션을 구축해야 한다.

‘의사 결정 인텔리전스 플랫폼’(Decision Intelligence Platforms)은 데이터 중심에서 의사 결정 중심으로 전략을 전환하는 것이다. 즉, 단계적으로 모델링을 위한 긴급한 비즈니스 의사 결정을 모델링하고, 의사 결정 인텔리전스 체계를 정립하며, 이에 해당하는 플랫폼을 평가하는 것이다. 즉 “데이터 과학 기술을 재점검하고, 의사 결정 자동화의 윤리, 법률, 규정 준수 측면을 해결하는 것은 성공의 필수 요소”라는 얘기다.

저작권자 © 애플경제 무단전재 및 재배포 금지