적절한 색상 코딩, 맥락에 충실한 정보로 “한눈에 이해하도록”
범주와 변수 최소화, 제한된 색상, 레이블․제목․주석 추가
대비․계층․균형․정렬 등 디자인 원칙 준수, 개인정보보호와 보안도 중요

각종 NFT사진으로 본문과는 직접 관련이 없음. (출처=클라우드프로)
각종 NFT사진으로 본문과는 직접 관련이 없음. (출처=클라우드프로)

[애플경제 김예지 기자] 현실 세계의 데이터를 효과적으로 시각화하는 것은 디지털기술의 핵심이다. 데이터 시각화의 궁극적인 목표는 모든 기술 수준의 사용자가 쉽게 이해할 수 있는 방식으로 정보를 제공하는 것이다. 잘 설계되고 구성된 데이터 시각화는 복잡한 정보를 시각적으로 매력적이고 유익한 방식으로 제공, 사용자 내지 소비자가 한 눈에 데이터를 이해할 수 있도록 하는 것이다.

뛰어난 데이터 시각화는 적절한 색상의 코딩과, 맥락에 충실한 정보를 사용, 한눈에 데이터를 쉽게 이해할 수 있도록 한다. 예를 들어 대화 방식을 통해 다양한 데이터를 탐색하게 거나, 간단한 디자인과 직관적인 색상 코딩으로 데이터를 쉽게 해석할 수 있도록 한다.

또한 복잡한 정보의 시각화를 위해 다양한 크기의 원을 사용하거나, 다양한 색상을 적용, 유형별로 분류함으로써 시각적으로 빠르게 구별할 수 있게 하는 것도 좋은 방법이다.

잘못된 시각화, 잘못된 의사결정으로 이어져

특히 인포그래픽은 데이터 속의 범주와 트래픽을 포함한 강력한 시각적 효과를 자아낸다. 강조해야 하거나, 주의를 끌 필요가 있는 요소를 선명하게 보여줌으로써 데이터 시각화의 본연의 취지에 가장 가깝다. “복잡한 데이터를 쉽게 해석하고 이해할 수 있는 이상적인 형식”이란 설명이다.

그러나 데이터를 잘못 표현하면 의도치 않게 오해의 소지가 있을 수 있다. “이 정도면 되겠지…” 하며 간과한 부정확함은 언뜻 사소해 보일 수 있지만 데이터를 왜곡하기 십상이다. 이는 결국 잘못된 의사결정과 비즈니스로 이어질 수도 있다.

데이터 시각화에선 또한 범주가 너무 많으면 복잡해질 수도 있다. 이 분야 전문매체인 ‘데이터메이션’은 전문가들의 의견을 빌려 “명확성을 유지하려면 범주 수를 6개 이하로 제한하는 것이 좋다”며 “이 한계를 초과하면 (데이터 시각화를 위한) 차트가 너무 혼잡해져 각 ‘세그먼트’를 구분하기 어렵고, 제대로 된 통찰력을 제공할 수가 없게 된다”고 지적했다.

데이터 시각화에 변수가 너무 많아도 문제다. 패턴이 모호해지고, 잘못된 상관관계가 생기고, 어수선지면서 데이터가 더 복잡해진다. 그로 인해 의미 있는 분석과 통찰을 하는게 어렵다. 즉 “메시지를 전달하는 데 필요한 것에만 집중하고 나머지는 버려야 한다. 항상 데이터를 명확하고 간결하게 표현하는게 바람직하다”는 견해다.

데이터 시각화에 잘못된 색상을 사용하는 것도 피해야 한다. 이는 잘못된 해석으로 이어질 수 있기 때문이다. 또 시각화를 위해 구축한 차트 하나에 색상이 너무 많아도 문제다. 혼란스럽기만 하고, 데이터를 정확하게 해석하기 어려워진다.

예를 들어 제한된 색상 팔레트를 사용, 데이터의 명확성과 이해도를 부각시키는게 좋다. 덜 중요한 요소에는 중립적인 색상을 선택하고, 보는 이의 시선을 끌기 위해 대조적인 색조를 사용, 중요한 점을 강조하도록 한다. 또 즉 긍정적인 의미는 빨간색, 부정적인 의미는 초록색과 같은 일반적인 통념에 충실한게 좋다.

금융, 의료, 교육, 정부, 소매, 미디어 부문 많이 사용

데이터 시각화는 다양한 분야에서 정보를 표현하고 해석하는 방식을 변화시켰다. 복잡한 데이터 세트를 시각적으로 매력적인 표현으로 변환, 이해도를 높이고 정확한 의사 결정으로 이어질 수 있도록 한다.

데이터 시각화는 금융, 의료, 교육, 정부, 소매 및 미디어 부문에서 많이 사용된다. 금융 분야에선 데이터 시각화를 통해 자세한 시장 동향, 주식 실적, 재무 데이터를 생생하게 보여준다. 대화형 대시보드를 사용해 패턴을 파악하고 시장의 변화를 예측할 수 있어 현명한 투자 결정을 이끌기도 한다.

의료 기관들도 데이터 시각화를 활용, 질병을 모니터링하고, 환자 상태를 분석한다. 특히 전염병의 경우 ‘히트맵’과 지리적 시각화를 통해 확산을 추적하고, 실시간 데이터를 기반으로 의료 서비스를 최적화할 수 있다. 교육 부문에선 추상적인 개념을 시각화하되, 매력적인 다이어그램, 차트 및 그래프로 전환, 효율적인 학습을 가능하게 한다. 복잡한 정보를 학생들이 더 쉽게 이해할 수 있도록 하는 것이다.

정부와 공공부문 역시 빅데이터 시각화를 사용해 예산 할당, 범죄 통계 및 공공 정책 영향과 같은 다양한 측면에 대한 실시간 분석을 할 수 있다. 이를 통해 정책의 투명성을 기하고, 시민들의 참여를 강화한다. 소매업체도 데이터 시각화를 통해 판매 실적과 고객 행동을 실시간으로 모니터링할 수 있다. 중요한 정보에 액세스하면 전략을 신속하게 조정하고 경쟁 우위에 설 수 있다.

미디어 매체는 데이터 시각화를 통해 뉴스 기사를 한층 설득력 있게 제공할 수 있다. 인포그래픽은 복잡한 사건을 단순화해, 독자나 시청자가 이를 손쉽게 파악하고 이해할 수 있도록 한다.

사진은 본문과는 직접 관련이 없음.
사진은 본문과는 직접 관련이 없음.

데이터 철저 이해, 접근성․포용성도 중요

정확하고 효과적인 데이터 시각화를 위해선 무엇보다 철저한 데이터 이해가 중요하다. 데이터의 구조와 차원, 특성을 포함, 데이터를 철저히 이해해야 한다. 이를 위해선 데이터 탐색, 정리 및 사전 처리가 중요하다. 또 ‘올바른 시각화 선택’이 조건이다. 적절한 유형의 시각화를 선택하는 것은 데이터의 특성과 목적에 따라 달라진다. 예를 들어, 막대 그래프는 수량을 비교하는데 좋고, 선 그래프는 시간 경과에 따른 추세를 보여주는 데 적합하다.

또 데이터와, 시각화의 맥락을 이해하도록 레이블, 제목, 주석을 추가하는게 좋다. 다만 레이블은 간결하고 유익해야 하며, 명확성을 기해야 한다. 일관성있는 디자인도 중요하다. 색상, 글꼴 및 서식을 일관되게 선택, 응집력이 있고, 시각적으로도 매력적인 프레젠테이션이 되어야 한다. ‘대비’와 ‘계층’, ‘균형’, ‘정렬’ 등의 디자인 원칙을 준수, 가독성과 시각적 효과를 높일 필요가 있다.

특히 접근성과 포용성이 있어야 한다. 장애가 있거나 다양한 학습 요구 사항이 있는 사용자까지도 시각화된 데이터에 액세스할 수 있어야 한다. 그래서 전문가들은 “색맹 친화적 팔레트를 사용하고 이미지에 대한 대체 텍스트를 제공할 것”을 요구하기도 한다.

다만 의미 있는 결론을 도출하기에 충분한 데이터가 없거나 명확한 시각화를 만들기에는 데이터가 너무 희소한 경우는 어떻게 해야 할까. 이런 경우는 평균이나 백분율과 같은 설명적 통계나, 주요 추세를 강조하는 텍스트 내러티브를 활용하면 좋다. 이를 통해 비록 데이터가 부족하더라도 오해의 소지가 있는 시각화에 의존하지 않고도, 정확한 분석을 할 수 있다.

또 개인 정보나 기밀 정보와 같은 민감한 데이터가 포함된 경우, 개인 정보 보호와, 보안 문제를 우선시해야 한다. 이런 경우는 아예 시각화를 시도하지 않는게 좋다. 대신에 텍스트 요약, 다시 정리된 통계, 암호화된 보고서가 바람직하다는 전문가들의 권유다.

데이터에 주관적이고, 추상적이며 심지어 감정적 요소가 포함된 경우는 시각화가 적절하지 않을 수도 있다. 억지로 시각적 형식으로 변환하면 의미가 반감되거나 사라질 수 있다. 이런 경우는 텍스트나 설명 방식을 권하기도 한다.

저작권자 © 애플경제 무단전재 및 재배포 금지