“‘오픈 데이터’…사회적 자산이자 국가 경쟁력의 무기”

모든 정형․비정형 데이터 사회적 공유로 ‘데이터경제’ 구현 정부 ‘공공데이터2.0’ 가속화, 민관의 AI, 스마트기술 개방 미국․유럽 등 ‘오픈데이터’ 실용화, 경제․사회 각 분야 활용

2021-10-04     김홍기 기자
사진은 '2019LED엑스포'에 참여한 한 연구기관의 조명기술을 선보인 부스로서, 본문 기사와 직접 관련은 없음.

 

[애플경제 김홍기 기자]

오픈 소스가 그렇듯이, 오픈 데이터 역시 누구나 자유롭게 이용, 가공, 재배포할 수 있는 데이터를 말한다. 이는 ICT기술을 기반으로 하는 현대 정보사회에서 공동체 차원에서 협업, 각종 문제를 해결하며, 다른 데이터와 조합한 새로운 가치와 서비스를 창출하기도 한다. 이미 정부도 각 부처 합동으로 ‘공공데이터’란 이름의 오픈데이터 정책을 펼치며, 민․관에 전면 개방한 바 있다. 미국과 유럽 등에서도 이미 범 사회적인 오픈데이터 모델이나 표준을 제정, 이를 적극 실용화하고 있다.

국내에서도 지난 4월 정부는 “데이터 경제의 기본 자원으로 데이터의 역할과 중요성이 증대함에 따라 한층 다양한 데이터의 활용을 원하는 시장의 수요를 충족시킬 필요가 커졌다.”면서 범부처 합동으로 ‘데이터전략위원회’를 구성했다. 인공지능 학습과 같은 신산업분야에 필요한 이미지나 문서, 영상 등 비정형 데이터와 미개방 데이터의 사회적 공유가 절실하다는 판단이 작용한 것이다.

정부는 이런 취지의 ‘공공데이터 2.0’ 전략을 수립. “시장(수요자)이 필요로 하는 다양한 형태의 데이터를 민관협업으로 제공할 것”을 공표했다. 이미 차세대 지능형 웹이라고 할 ‘시멘틱 웹’ 분야에선 컴퓨터가 스스로 개발ㆍ표준화된 기술을 사용하는 링크드 오픈 데이터(Linked Open Data : LOD)가 잘 알려져 있다. 또한 분야ㆍ조직을 넘나들어 데이터를 쉽게 연계하는 공통어휘 설정도 구축되고 있다. 이런 원리를 기초로 미국에서는 이미 2005년에 국가데이터개방모델(NIEM), 그리고 유럽에서는 2011년에 데이터 연계 표준인 ‘SEMIC’을 만들었다. 정부의 ‘공공데이터 2.0’ 역시 이런 점을 염두에 둔 것으로 풀이된다.

이를 통해 정부는 민관합동으로 우선 금년 내에 인공지능 등 신산업의 기반이 되는 6개 영역 26개 데이터를 개방했다. 자율주행, 헬스케어, 스마트시티, 금융재정, 그리고 재난안전, 생활환경 등을 망라한다. 특히 코로나19 백신접종(접종센터위치, 누적통계 등), 재난안전 데이터 등과 같이 사회 이슈와 직접 관련되거나 문제해결을 위한 데이터는 우선 개방하고 있다. 또 “국민이 필요로 하는 미개방 데이터를 발굴, 개방하고, 공공데이터 제공신청‧분쟁조정 사례를 분석하여 제공을 거부하는 근거가 되는 법과 제도적 제약 요인을 없앨 것”이라는 입장이다.

특히 비정형데이터를 효율적으로 관리, 개방하는데 주력하고 있다. 엑셀이나 CSV 등 정형데이터를 넘어 텍스트, 이미지, 영상 등 인공지능과 신산업을 고려한 비정형데이터도 적극 개방하고 있다. 특히 정부문서는 기계가 쉽게 읽을 수 있는 개방형 표준(ODF, Open Document Format)으로 작성하고 대국민 공개문서는 표준형식에 따르도록 하여 데이터 활용성을 높이고 있다. ODF는 문서구조가 공개되어 누구나 쉽게 활용할 수 있는 개방형 문서형식이다. 대국민 공개문서는 정책연구보고서, 채용공고, 보도자료, 각종 위원회의 결정문 등 국민 수요가 많고 잠재적 활용가치가 높은 것들이다.

다만 직접 개방이 어려운 공공데이터, 즉 개인정보나 기업 영업비밀 등은 진위확인(True or False) 방식을 거쳐 제공하고 있다. 예를 들어 부동산중개, 음식배달 등 다방면으로 활용되는 사업자등록정보를 우선 확인한 후 확인 대상을 확대하고 있다. 국가자격제도나 고속철도 승차권 구매 등으로 확대할 것도 검토하고 있다. 또 보험정보나, 세금정보 등 직접 개방이 어려운 민감정보는 마이데이터 또는 안심구역 등의 방식을 통해 제공, 활용토록 한다. 이 밖에 미개방 데이터 중 개인정보를 포함하는 데이터는 ‘개인정보 보호법’에 따른 익명화‧가명화를 거쳐 공유할 수 있도록 하고 있다.

행정안전부는 포털 개방 데이터에 대한 ‘오픈API 자동변환 지원서비스’, 그리고 포털에 데이터를 요청할 경우 해당 데이터의 소관기관 담당자가 직접 답변하도록 했다. 이를 위해 “시의성 있는 데이터를 전면 표출하고, UI‧UX를 개선하여 검색 성능을 높이고 있다”는 설명이다.

행안부는 또 “시민개발자와 국민 참여(크라우드소싱) 기반으로 데이터를 수집·생성, 개방하고 있다”면서 “예를 들어 자원봉사를 통해 전국단위의 표준화된 장애인 이동권 데이터를 확보하고, 부족한 부분은 데이터 가공기업이 보완하여 개방하는 식”이라고 전했다. 인도변 점자블록이나 계단 등의 장애인 편의시설이 대표적인 케이스다. 또 “공공데이터를 쉽게 접하고 활용할 수 있도록 맞춤형 공공데이터 큐레이팅(curating) 제도도 실시하며, 공공데이터가 필요한 공공기관과 전문 데이터기업을 연결해주는 ‘기업매칭 지원사업’도 진행하고 있다”고 밝혔다.

정부의 이런 공공데이터 정책은 해외 각국에서도 ‘오픈데이터’ 정책으로 널리 시행되고 있다. 때론 오픈 데이터를 기반으로 새로운 가치를 창조하거나, 기왕의 비즈니스의 효율성과 생산성을 높이는데 활용하기도 한다.

컨설팅 및 연구기관인 IRS글로벌이 전하는 사례에 따르면 미국의 인터넷 앱 ‘Beyond Floods’도 그중 하나다. 이는 미국의 95%의 주민이 자신이 사는 장소의 홍수 리스크를 파악할 수 있게 한다. 이를 위해 미 국세조사국, 뉴욕시 정보 기술국, 미 해양대기청 등이 제공하는 표고 데이터, 과거의 홍수 피해와 관련된 오픈 데이터를 사용한다. 뿐만 아니라 이렇게 수집된 데이터는 보험료를 추정하는 데에도 활용된다는 얘기다.

독일의 임상시험 매칭 플랫폼인 ‘Viomedo’도 오픈데이터의 전형적 사례다. 이는 등록 장부 오픈 데이터를 이용한 임상시험과 임상시험의 조건에 맞는 환자를 매칭해준다. 임상시험이 필요한 제약사나 개발자와 이에 자발적으로 참여하고자 하는 사람들을 매칭하기 위한 데이터를 제공한다. 즉 환자나 참여 희망자가 임상시험을 찾기 쉽도록 정보를 정리, 제공하고 있다.

유명한 음악 스트리밍 서비스인 ‘스포티파이(Spotify)’ 역시 오픈데이터를 이용해 성공한 글로벌 기업이다. 이 회사가 제공하는 음악 메타데이터, 즉 아티스트나, 제목, 언어, 날짜, 국가, 바코드, 포맷 등은 모두 뮤직브레인즈(MusicBrainz)가 제공하는 오픈데이터다. 뮤직브레인즈는 음악 작품의 방대한 메타데이터를 업로드하여 공개하고 있다. 미국의 식품영양평가 앱인 ‘Fooducate’도 오픈데이터를 활용한 케이스다. 미 노동통계국이 식품의 총 칼로리, 음식과 음료의 칼로리 함유량 등의 오픈 데이터를 스마트폰 앱을 통해 제공하고 있다. 식품의 바코드를 스캔하기만 하면 그 안에 함유된 영양가를 볼 수 있다.

유럽의 ‘Young Europeans’는 가족, 직업, 자유시간, 공부, 인터넷에 관한 통계 데이터를 기반으로 16세부터 29세의 젊은층이 다양한 지표를 통해 자신을 EU의 평균적인 젊은이와 비교할 수 있게 한 오픈데이터 프로그램이다. 또 전 지구 변화 검출 서비스 ‘GRASP EARTH’도 위성이 제공하는 오픈데이터로 지구상의 모든 장소의 지리 공간 정보를 비교할 수 있게 하는 것이다.

미국에선 또 부동산 거래나 이사 정보 등을 위해서도 오픈데이터가 사회적으로 활성화되어 있다. 인터넷 앱 ‘NeighborhoodScout’의 경우는 특정 지역의 범죄 발생률, 주택 가격, 학교의 질 등 다양한 데이터를 제공하며, 자신이 이사할 동네나 지역에 대한 종합적 평가를 가능하게 한다.

이런 국내외 추세 속에 정부도 기왕의 ‘공공데이터전략위원회’를 중심으로 더욱 적극적으로 ‘공동데이터 2.0’을 효율적으로 추진한다는 계획이다. 행정안전부는 “현대 정보사회에선 무엇보다 공공데이터에 대한 민간 접근성을 높이는게 중요하다”면서 “수요자의 상황에 맞게 활용할 수 있도록 데이터를 다양한 형식(format)으로 개방하고, 공공데이터 포털을 개선해 편리하게 이용할 수 있도록 하고 있다”고 밝혔다.