정부, ‘데이터안심구역’ 중심으로 공공․기업정보 널리 공개

민․관 보유 데이터 일반에게 제공, 데이터와 융합·분석도 가능

2022-10-25     전윤미 기자
사진은 삼성전자 에이라이트 제품으로 본문과는 직접 관련이 없음.

[애플경제 전윤미 기자] 디지털 시대는 정보가 생명이지만, 일반 시민들이나 중소기업, 소상공인 등 디지털 약자들은 정보나 데이터에 쉽게 접근할 수 없거나, 빈약한 실정이다. 이에 과학기술정보통신부는 기존이 ‘데이터안심구역’의 기능을 한층 강화하며 데이터를 개방하고 각종 데이터와의 융합 서비스를 시도하기로 했다. 이를 통해 “그 동안 축적된 과학기술통계 데이터의 활용을 촉진하고, 수요자 중심의 맞춤형 통계 데이터 생성을 지원할 것”이라고 밝혔다.

과기정통부와 한국데이산업진흥원은 데이터안심구역을 운영하고 있다. 이는 산·학·연 연구개발이나 조사․통계 데이터 등을 생성, 분석할 수 있도록 시스템을 갖추고 있다. 기업과 기관, 개인 등 누구나 이를 이용할 수 있다.

과기정통부는 그러나 “지금까지 정부에서 제공하는 과학기술 통계만으로는 이용자 수요를 충족하는데 한계가 있기 때문에, 새롭게 데이터 분석 및 융합 서비스를 통해 한 차원 높은 공공 데이터를 제공할 수 있게 된다”고 취지를 밝혔다.

데이터안심구역은 ‘R studio’, ‘주피터(Jupyter)’ 등의 분석도구를 통해 데이터 모델링을 한다. ‘R studio’는 R 프로그래밍 언어 기반의 오픈소스 소프트웨어로서, 통계 분석에 라이브러리를 활용하여 데이터를 분석한다. ‘주피터’는 파이썬 프로그래밍 언어 기반의 오픈소스 소프트웨어다. 이는 각종 라이브러리를 활용한 데이터분석이나 머신러닝 등에 유용하다.

또 ‘Tableau’를 이용해 빠르게 정보를 탐색하여 즉각적인 통찰을 얻을 수도 있다. 전문적인 데이터 분석 기술 없이도 직접 고품질 데이터를 시각화하고 활용할 수 있다는 게 장점이다.

이같은 분석도구를 갖춘 데이터안심구역은 무엇보다 미개방 데이터를 안정적으로 분석, 활용할 수 있다. 특히 쉽게 접할 수 없는 공공기관이나 민간기업의 미개방 데이터를 누구나 안전한 분석환경에서 무료로 활용할 수 있다. 또 다양한 사용자의 수준을 고려한 사용자 맞춤형 데이터 분석 환경을 제공하기도 한다.

데이터산업진흥원에 구축된 데이터안심구역은 데이터 수집부터 시각화에 이르기까지 데이터 분석의 전체 라이프 사이클을 지원한다. 특히 전문가는 물론 비전문가까지 분석을 수행할 수 있는 편리한 분석플랫폼이란 점이 눈에 띈다. 예를 들어 외부와 단절된 데이터 분석 공간이 갖춰져 있어, 외부 공개가 곤란한 민감한 데이터를 보안이 확보된 공간에서 분석할 수도 있다.

이를 통해 이용자들은 각종 원천 데이터를 포함해, 데이터안심구역에 적재되어 있는 각 분야의 미 개방 데이터나, 이용자 스스로 보유한 데이터를 활용하여 과학기술통계와 결합한 다양한 융합 데이터를 생성할 수 있다. 데이터별 분야는 금융, 기업, 에너지, 의료, 교통, 물류, 통신, 유통 등을 망라한다. 그러므로 대기업은 물론, 중소기업이나 자영업자, 예비창업자 등에겐 매우 귀중한 정보 ‘저장고’가 될 수도 있다는 설명이다.

특히 데이터산업진흥원은 “민감 정보를 제외한 분석 결과에 대한 반출도 가능하다”면서 “양질의 데이터 분석 수요를 충족시키고, 민감정보가 유출될 우려를 해소할 수 있게 되었다”고 밝혔다. 과학기술통계 데이터 분석 서비스는 (https://dsz.kdata.or.kr) 또는 NTIS(https://ntis.go.kr) 배너를 통해서 신청할 수 있다.