개인정보 ‘수문장’…5가지 PET 기술 확산

데이터 은폐, 암호화와 노이즈, 복호화 아닌 다양한 연산 등 차등프라이버시, 영지식증명, 동형암호, 다자간 연산, 신뢰환경기술 등

2025-01-22 전윤미 기자

'2024국제보안엑스포'에 참가한 보안업체 부스로서, 본문 기사와 직접 관련은 없음. (사진=에플경제)

[애플경제 전윤미 기자] 개인정보가 침해의 위험이 날로 증가하면서, 이에 대비한 개인정보강화(PET) 기술도 발전하고 있다.

크게는 아예 데이터를 은폐하는 기술이 있는가 하면, 암호기술이나 노이즈(훼손) 기법을 활용해 데이터 식별과 접근을 차단하는 방법도 보급되고 있다.

세종대학교 이종혁 교수는 데이터를 은폐하는 기술로는 ‘차등 프라이버시’와 ‘영(零, Zero)지식증명’ 기술 등을 꼽았다. 전자는 “데이터를 무작위로 입력하거나, 노이즈를 적용해 식별하기 어렵도록 하는 기술”이다. 후자, 즉 ‘영지식 증명’은 말 그대로 아예 데이터를 직접적으로 공개하지 않고 검증, 활용하는 기술이다.

최근 한국정보사회진흥원을 통해 공개한 연구 보고서에서 이 교수는 또 암호화 기법이 적용된 기술로는 ‘동형암호’(Homomorphic Encryption: HE), ‘안전한 다자간 연산’, ‘신뢰 실행환경’ 기술 등을 꼽았다. ‘동형암호’는 “‘평문’을 공개하지 않고 암호화한 후 연산을 하도록 하는 기술”이다.

‘안전한 다자간 연산’은 분산된 환경에서 모든 노드가 비밀 정보를 공개하지 않고 협력, 연산을 수행하는 것이다. 또한 ‘신뢰 실행 환경’은 애초 하드웨어 보안시스템으로 필터링한 후 데이터에 접근하도록 별도의 환경을 구축한 것이다.

동형암호 기술 세 가지

이를 구체적으로 살펴보면 ‘동형암호’는 데이터를 암호화한 상태에서 처음부터 해커들이 해제할 수 있는 복호화를 하지 않는 방식이다. 다만 덧셈이나 곱셈 중 하나, 또는 둘다 적용하는가, 이런 연산을 몇 차례 혹은 제한없이 할 것인가에 따라 세 가지로 구분된다. 즉, 부분동형암호(Partially HE: PHE), 유한동형암호(Somewhat HE: SHE), 완전동형암호(Fully HE: FHE)가 그것이다.

그 중 부분동형암호는 말 그대로 덧셈이나 곱셈 중 한 가지만 적용하는 것이다. 다만 연산 횟수에는 제한을 두지않는다. 유한동형암호는 덧셈과 곱셈 연산을 모두 허용하지만, 연산 횟수에는 제한을 둔다. 그러나 최근에는 제한없이 다양한 유형의 연산을 허용하고, 연산 횟수도 제한이 없는 완전동형암호가 널리 확산되고 있다.

이에 비해 기존 암호화 기술의 경우, 비밀키를 통해 복호화 이후 연산을 수행하기 때문에, 데이터 분석 과정에서 해킹이나 데이터 유출 위험이 존재한다. 이에 반해, 동형암호는 암호문에 대한 복호화가 필요없다. 이로 인해 데이터 분석 과정에서 해킹이나 데이터 유출의 위험을 차단할 수 있다는 장점이 있다.

중앙 및 지역적 모델의 차등프라이버시

차등프라이버시 기법도 널리 쓰이는 PET다. 기존 비식별화 모델(익명화 모델 등)은 연결 공격, 추론 공격 등에 취약하다. 그러나 임의의 데이터가 데이터베이스 내에 있는지조차 은폐함으로써 이런 공격을 막아낼 수 있다. 곧 차등프라이버시의 핵심이라고 할 수 있다.

이를 위해 데이터를 은혜한채 필요한 정보만을 제공하는 시스템인 큐레이터(curator)를 통해 노이즈(noise)가 적용된 데이터를 제공한다.

차등 프라이버시 모델에는 또한 중앙집중형 모델(central model)과 지역적 모델(local model)이 있다. 중앙집중형 모델은 데이터 제공자가 신뢰할 수 있는 큐레이터에 원시 데이터를 제공하고, 큐레이터에서 노이즈를 추가하는 방식이다. 반대로 지역적 모델은 데이터 제공자가 큐레이터를 신뢰하지 않으므로 데이터에 노이즈를 추가하여 제공하는 방식이다.

'2024국제보안엑스포'의 관람객들 모습. (사진=애플경제)

증명자-검증자의 신뢰 구축 ‘영지식증명’

영지식 증명(Zero-Knowledge Proof: ZKP)은 말 그대로 데이터를 처리할 증명자(prover)가 정보 공개 없이(零(0)의 정보와 지식), 검증자(verifier)와 신뢰 관계가 형성될 수 있도록 하는 것이다. 즉, 증명자가 특정 데이터를 공개하지 않은채, 해당 데이터를 알고 있다는 사실이 거짓이 아님을 검증자에게 입증할 수 있는 암호학적 기법이다

앞서 세종대 이종혁 교수는 “이를 만족하기 위해서 정직한 증명자는 검증자를 설득할 수 있다는 완전성(completeness), 거짓된 증명은 검증자를 설득할 수 없다는 건실성(soundness), 검증자는 증명의 참 또는 거짓 외의 정보를 알 수 없다는 영지식성(zero-knowledge)의 특성을 만족해야 한다.”고 설명했다.

영지식 증명은 또 대화형(interactive) 방식과 비대화형(non-interactive) 방식으로 구분된다. 대화형 방식은 증명자와 검증자 간의 반복적인 상호 작용(대화)을 통해 특정 데이터를 증명하는 방식이다. 다만 증명자와 검증자 간의 통신 횟수(대화, 상호작용)가 증가할수록 증명의 크기나 시간, 비용 등이 늘어나는 단점도 있다. 이를 해결하기 위한 것이 비대화형 방식이다. 이는 증명자가 정보 내지 비밀 정보를 입력값으로 활용해 나름의 증명값을 생성, 검증자에게 이를 전달함으로써 설득하는 방식이다.

안전한 다자간 연산, ‘참여자들 비공개, 공동 암호화’

안전한 다자간 연산은 기업이나 조직 구성원들이 각기 정보를 암호화, 타인에게 공개하지 않는 범위에서 공동으로 각자 데이터를 활용, 처리할 수 있게 하는 PET 기술 중 하나다. 쉽게 말해 데이터를 참여자 수만큼 나누어 분산화하는 비밀 공유(secret sharing), 암호화된 데이터를 논리 게이트와 라벨을 통해 연산하는 왜곡 회로(garbled circuits) 등의 다양한 기법이 있다. 이는 “모든 참여자가 서로의 정보를 확인할 수 없도록 하고, 참여자 간 공동 연산을 할 때도 비공개된 정보를 기반으로 동일한 연산 값을 출력할 수 있다”는 설명이다.

신뢰 실행 환경은 하드웨어 보안 시스템의 다른 표현이다. 즉, 민감 데이터에 안전하게 접근, 처리할 수 있도록 격리된 보호 환경을 제공하는 기술이다. 이런 환경에서 실행된 코드나, 영구 메모리에 저장된 데이터에 대해 그 무결성이나 기밀성을 보장하며, 제3자에게 원격 증명을 제공하는 것이다. 이는 “동적으로 안전하게 업데이트할 수 있고 소프트웨어 공격과 시스템의 메모리에서 수행되는 물리적 공격에 저항할 수 있다”는게 장점이다.