이상감지(AD)‧SNA‧자연언어처리‧머신러닝‧음성인식‧이미지분석‧웹크롤링 등

코로나19로 인한 경기침체가 지속될 경우 자동차 보험을 비롯한 보험사기도 급증할 것으로 예상되는 가운데 AI와 빅데이터 마이닝으로 보험사기를 막아내는 기법이 날로 발달하고 있다.

종전에는 보험사고 조사자가 사기로 의심되는 건을 일일이 추출하는 방식이었으나 정보통신기술이 발달함에 따라 데이터 분석기술을 활용하는 추세로 변화하고 있다.

보험회사는 데이터 분석을 바탕으로 보험사기를 선제적으로 예방하거나 적발하고 있는데 보험금 지급 단계뿐만 아니라 계약심사단계, 계약갱신단계에서 보험사기 방지 기술을 사용하고 있는 것으로 알려졌다.

(사진=픽사베이)
(사진=픽사베이)

 

보험금 지급 단계, 계약심사 및 갱신단계서 적용

보험연구원 자료에 의하면 최근 보험사기를 방지하기 위해 활용하는 AI기술에는 이상감지(Anomaly Detection)기술, SNA(사회관계망 분석), 자연언어처리, 머신러닝, 음성인식, 이미지분석, 웹크롤링(Web Crawling) 등이 있다.

머신러닝 중 지도학습과는 달리 비지도학습(Unsupervised Learning)은 조사자가 어떠한 특정 데이터가 보험사기를 보여줄 수 있는지 알지 못할 경우 보험사기 의심 건을 적발하는 데에 매우 효과적인 것으로 나타났다.

기존의 사기 유형에 대한 정해진 답에 의존하는 지도학습보다 한층 기능이 뛰어난 것이다.

또 음성인식 기술도 활용되고 있다. 이는 감정분석(Sentiment Analysis) 알고리즘을 사용하여 사람이 인지하기 어려운 잠재적 사기행태 지표를 식별할 수 있다.

국내 보험사기 적발금액 추이(단위:억원, 왼쪽)/국내 보험사기 적발인원 추이(단위:명) (제공=금융감독원)
국내 보험사기 적발금액 추이(단위:억원, 왼쪽)/국내 보험사기 적발인원 추이(단위:명) (제공=금융감독원)

실제로 기술이 발달하면서 미리 정해진 사기 유형만을 적발해내는 ‘자동화 의심징후 적발 기능’은 상대적으로 줄어들고, 예측모형이나 이상요소 감지 예외 보고 기능, 위치 정보 분석 등의 신기술이 증가하는 추세다.

다만 자동화된 의심징후 적발 기능이나, SNA 기능은 여전히 보험사기 방지 시스템 활용기술 중 가장 비중이 큰 것으로 나타났다. 이들 기술을 통해 사기 의심 건을 더욱 정확히 추출해내고, 그로 인한 손실을 줄일 수 있다는게 업계의 반응이다.

 

보험사기 식별 오류 방지 위해 AI기술 개선도

보험연구원은 조사 보고서를 통해 “특히 가용 데이터가 늘어나면서 보험사기 방지에 인공지능(AI)을 활용하는 사례도 증가하고 있다”면서 “한때 AI기술도 보험사기가 아닌 건을 보험사기 건으로 분류하는 오류를 범하기도 했으나 최근에는 그런 우려가 크게 줄어들었다”면서 “이는 국내 보험회사들도 자동 위험징후, 예측모형, 데이터 시각화, 이상감지 등의 기술을 보험사기 방지·적발에 사용한 덕분”이라고 밝혔다.

또 자사 내 보험금청구나 계약 정보뿐 아니라 한국신용정보원 정보를 활용함으로써 더욱 정확도를 높이고 있다는 분석이다.

그렇다보니 보험업계에서 AI와 빅데이터 분석을 통해 보험사기를 방지하는 추세는 날로 두드러지고 있다. 미국의 경우 손해보험회사를 대상으로 한 설문조사에 따르면 응답자의 약 56%가 보험사기 적발에 AI를 사용하고 있는 것으로 알려졌다.

다만 AI를 활용할 경우 가장 중요한 변수가 데이터 품질과 데이터의 다양성과 양이다. 그래선지 “미국 현지 설문조사에선 응답자의 약 48%가 향후 1년간 AI에 대한 투자를 확대할 것으로 판단한다고 응답했다”고 전했다.

그럼에도 불구하고 좀더 정밀한 보험사기방지를 위한 기술 개발이 필요하다는 주문이 나오고 있다. 보험연구원의 변혜원 연구위원은 “이를 위해선 보험사기 관련 정보를 공유할 필요가 있으며, 이를 위해서는 공유하는 데이터의 정의나 형식을 표준화해야 한다”고 지적하면서 “또한 새로운 보험사기 데이터 분석기법이나 AI기법 활용을 적극적으로 고려하되, 데이터 집적단계에서의 데이터 품질 관리와 비정형 데이터 등 분석정보의 범위도 확대할 필요가 있다”고 밝혔다. 다만 AI시스템이 부당한 차별이나 사생활침해 등의 문제를 야기하지 않도록 해야 한다는 점도 강조되고 있다.

 

데이터 정의․형식 표준화 및 정보 공유 등 필요

한편 국내의 경우 금융감독원 보험사기대응단은 보험사기인지시스템(IFAS: Insurance Fraud Analysis System)을 통해 보험계약 및 사고 등을 데이터베이스로 관리·분석함으로써 보험사기 혐의자를 추출해내고 있다.

IFAS는 보험금 관련 관계의 집중도, 매개도 등을 계산하여 공모가 의심되는 그룹을 추출하기 위해 SNA를 분석하고 있다. 또한 혐의자의 보험사기 가능성을 계량적으로 측정하는 사기지표(FI: Fraud Indicator) 등도 사용하고 있다.

이는 보험 가입자 개인별로 산출(FI 76개 지표)하는데, 보험료, 보험계약 회사 숫자, 사고근접계약(보험가입 직후 보험사고 발생) 숫자, 사고 당 동승자 수(자동차의 경우) 등이 포함되어있다.

최근에는 금융감독원에 보고된 보험 사기자들이 많이 이용하는 병원, 정비업체, 설계사 등을 분석, 추출하는 방법도 도입하고 있다. 한국신용정보원도 보험계약·청구·지급 데이터베이스인 보험신용정보통합조회시스템(ICIS)을 분석하여 보험사기 유의지표와 의료기관별 통계를 제공하고 있다.

저작권자 © 애플경제 무단전재 및 재배포 금지