“원시 데이터를 의미 있는 통찰력으로 변환하는 프로세스”
DB구조나 의사 결정 과정 포함, 데이터 흐름과 경향성, 연관성 규정
관계 다이어그램, 엔티티-관계 다이어그램, 의사 결정 트리 등 사용
개념적․물리적․논리적 모델… ‘비용절감, 효율제고, 정확성, 데이터 민주화 등’

(사진=Getty Image)
(사진=Getty Image)

[애플경제 이보영 기자] 데이터 모델링은 인공지능 학습이나 머신러닝, 알고리듬 구축 등을 위한 필수 요소로 꼽힌다. 그러나 모델링의 목표에 적합한 유형을 선택하고, 이를 통해 사용자 혹은 기업을 위해 어떤 이점과 효용을 창출할 것인가가 중요하다는게 전문가들의 지적이다.

데이터 모델링은 기업이나 조직이 보유한 데이터에 구조와 방향을 제공하는 프로세스를 정의하는 데 도움이 되는 작업이다. 이른바 데이터 라벨링 작업으로 ‘프리랜서’ 직원들을 기용하고 있는 C사의 한 임원은 “데이터 모델링의 핵심은 원시 데이터를 의미 있는 통찰력으로 변환하는 프로세스”라며 “이는 데이터베이스 구조나 조직의 의사 결정 과정을 포함한다”고 밝혔다.

지난 ‘2022 디지털 대전환’ 전에 참가한 C사의 부스에서 그는 “이러한 모델은 테이블이나, 필드, 테이블 간의 관계를 정의할 수 있는 다이어그램 소프트웨어를 사용하여 분석하고 생성하는 경우가 많다”고 자사의 사례를 들어 설명했다.

이들 전문가에 따르면 데이터 모델링은 실제 비즈니스나 시스템, 또는 현상에 관한 데이터 모델을 설계하고 생성하는 프로세스다. 관계 다이어그램, 엔티티-관계 다이어그램, 그리고 의사 결정 트리를 포함하여 많은 모델 유형이 데이터 모델링에 사용된다. 이렇게 생성된 모델은 대량의 정보를 이해하고, 데이터 내의 흐름과 경향성, 연관성을 찾기 위한 필수적 도구다.

스마트 팩토리와 머신비전에 주력하고 있는 또다른 A사 관계자는 “데이터 모델은 일반적으로 엔티티, 속성 및 관계라는 세 가지 구성 요소를 포함한다”면서 “데이터 모델 또는 다이어그램의 목적은 대상이 지닌 여러 구성 요소끼리 서로 어떻게 관련되는지 매핑(mapping)하는 것”으로 규정했다. 즉 ‘일반적인 다이어그램은 각 구성 요소의 속성, 다른 구성 요소와의 관계, 구성 요소 간의 입력 및 출력 흐름, 제약 조건을 다루는 모델링된 시스템의 개요에서 시작된다“는 것이다.

그래서 “이러한 요소들을 이해하고 조립하면 시스템을 이해하는 사람이라면 누구나 읽을 수 있는 논리적 그림이 만들어진다”고 했다. 이에 따르면 기업 및 관계도는 요소별로 복수의 도표를 포함할 수도 있다. 그 중 하나는 내부 구조와 행동을 설명하고, 다른 하나는 다른 요소와의 관계를 보여주고, 또 다른 하나는 외부 요인에 의해 부과되는 제약을 보여준다. 그 결과 “간명하면서 정확한 데이터 모델을 만들면 데이터베이스 설계에 대한 정보에 입각해 기업이 의사 결정을 내리는 데 도움이 된다”는 설명이다.

그렇다면 업계에서 주로 사용하거나, 추천하는 데이터 모델 유형은 어떤 것들이 있을까. 우선 ▲개념적 데이터 모델(Conceptual data model)이 있다. 이는 시스템과 ‘엔티티’가 서로 어떻게 관련되는지에 관해 깊이있게 이해할 수 있게 한다. 기업의 데이터와 절차를 통일된 전체로 표현하는 방법이다. 또한 기업 목표를 충족하기 위해 변경하거나, 설계 및 수정할 필요가 있는지를 식별하도록 한다.

다음은 ▲논리 데이터 모델(Logical data model)을 들 수 있다. 이는 앞서 개념적 모델의 ‘엔티티’가 관계형 데이터베이스 내의 테이블, 필드, 인덱스 및 관계에 매핑되는 방법을 자세히 설명하는 방식이다. 예를 들어, 관계형 <표>는 제품 주문과 같은 엔티티를 나타낼 수 있다. <표>의 열은 고객 ID 및 총비용과 같은 다양한 주문 속성을 나타낸다. 이때 여러 테이블의 관련 데이터가 쿼리에 결합되면 이 프로세스를 ‘JOIN’이라고 한다.

▲물리적 데이터 모델(Physical data model)도 있다. 실제 데이터 모델은 테이블, 인덱스, 행 및 열의 형식을 포함하여 데이터베이스와 같은 물리적 구조에서 데이터를 저장하는 방법을 지정한다. 이는 제안된 데이터베이스에 필요한 하드웨어를 구성하고, 스토리지의 종류를 보여주는 것이 주요 목표다.

데이터 모델링은 또 기업이나 조직에게 다양한 이점과 효용을 안겨준다. “데이터를 완벽하게 이해하면 정보에 입각한 정확한 의사 결정을 내리고, 회사를 위한 더 나은 전략을 수립하는 데 도움이 될 수 있다.”는 것이다. 그래서 현업 관계자들은 성공적인 데이터 모델링 전략에서 얻을 수 있는 가장 큰 이점 몇 가지를 들기도 한다.

우선 ▲더욱 향상되고 빠른 성능이다. 모델링은 정보를 저장하고 액세스하기 위한 체계적인 기반을 구축함으로써 더욱 빠르게 이를 처리할 수 있게 한다. 또 ▲리스크를 감소시킨다. 즉, 데이터 모델링을 통해 데이터 세트 간의 차이나 불일치를 식별하여 위험을 줄인다. 이렇게 하면 더 큰 문제가 되기 전에 문제를 해결할 수 있기 때문에 시간과 비용을 절약할 수 있다.

▲효율성도 크게 향상된다. 모델링으로 프로세스를 간소화하고 기업이 장부를 보관하는 데 비용이 많이 드는 중복된 요인들을 제거한다. 또한 ▲더 나은 의사 결정을 통해 경영진이 비즈니스 운영 내에서 동향과 패턴을 식별할 수 있도록 지원함으로써 의사 결정 능력을 향상시킨다. 그런 다음 “이를 사용하여 전략에 대한 보다 현명한 선택을 할 수 있다”는게 현장 관계자들의 얘기다.

또한 ▲정확도를 크게 향상시킬 수 있다. 즉, 정확한 데이터를 통해 정보 관리자는 불필요한 노력을 기울이지 않고도, 리소스를 잃지 않고 현명한 투자를 할 수 있다. ▲오류도 줄일 수 있다. 즉, 잘 구성된 시스템은 회사의 정보 시스템에서 오타, 오류 및 기타 부주의한 오류를 제거한다. 이와 함께 ▲워크로드를 감소시킬 수 있다. 즉, 필요한 작업을 수행하면서 반복 되거나, 중복되는 과정을 줄이면서 더 높은 수준의 작업에 집중할 수 있게 한다.

당연히 ▲비용을 절감할 수 있다. 즉, 데이터 모델링은 프로세스의 필수 단계이면서, 동시에 비용면에서도 효율적인 작업이다. 이를 통해 감독 부실이나 결함으로 인해 기업에 막대한 비용이 발생하는 잠재적 리스크를 방지할 수 있는 것이다. 특히 이는 ▲데이터 민주화에 기여한다. 즉, 데이터 모델을 사용하면 비즈니스 데이터를 더욱 쉽게 해석하고 이해할 수 있다. 이에 대해 특히 C사 임원은 “조직 전체의 이해 관계자가 데이터를 효과적으로 자신에게 유리하게 사용할 수 있음을 의미한다”고 규정하면서 “그러므로 데이터 모델링은 모든 기업과 비즈니스에서 필수적”이라고 강조했다.

저작권자 © 애플경제 무단전재 및 재배포 금지