본문 바로가기
정보관리기술사

(IT 이슈) 데이터 경제와 개인정보 비식별 기술 동향

by 정보봇따리 2020. 11. 25.
728x90
반응형
SMALL


데이터 경제와 개인정보 비식별 기술 동향

I. 데이터 경제와 개인정보보호
1. 데이터 경제의 개념
- 데이터 경제의 정의 : 모든 데이터가 활용하기 쉽게 자유롭게 흘러 타 산업 발전의 촉매 역할을 하면서, 혁신적 비즈니스와 서비스를 창출하는 경제
- 데이터 경제 활성화를 위해 데이터 활용에 대한 제도의 개정과 인프라 지원 등이 필요함

2. 빅데이터 개인정보보호 동향
가. 개인정보보호 관련 법·제도 동향
- 데이터 활용의 활성화를 위해 제시된 개인정보 비식별조치 가이드라인
- 개인정보 활용을 위해 “사전검토–비식별조치–적정성평가–사후관리”의 일련의 개인정보 비식별 조치 절차와 개인정보 처리자 간 데이터의 결합을 위한 정보집합물의 결합에 대한 방법을 포함
나. 개인정보보호 관련 기술 동향
- 1세대 : 인식의 단계 - 개인정보 필터링, 개인정보 노출진단, 초기 수준의 데이터베이스 암호화 기술
- 2세대 : 관리의 단계 - 개인정보에 대한 관리적 접근, 개인정보영향평가 및 ISMS-P(ISMS,PIMS, PIPL) , 개인정보 생명주기 관리, 개인정보 파일 샌드박스
- 3세대 : 활용의 단계 - 개인정보의 보호와 개인정보의 활용이라는 양면성을 모두 만족시키는 개인정보보호 기술의 제공 , 정형데이터, 반정형데이터, 비정형데이터 포괄
다. 개인정보 비식별 기술
- 데이터 활용 단계에서 데이터 비식별(Data De-identification) 기술과 프라이버시 보호 모델을 통해 데이터의 안전한 활용을 보장
- 소프트웨어의 발전 등으로 인해 비식별 조치된 데이터는 재식별(Re-identification)이 가능

II. 개인정보 비식별 조치 동향
가. 개인정보 비식별 조치 대상과 개인정보 재식별
- 개인정보 비식별 조치 대상 : 정형 데이터, 반정형 데이터, 비정형 데이터
- 개인정보 재식별(Re-identification)
: 개인정보의 재식별로부터 정보주체의 프라이버시 보호를 위해 재식별 가능성을 측정하고 재식별 위험을 해소
: Prosecutor Attack, Journalist Attack, Marketer Attack, (In)distinguishability Attack, Inference Attack

나. 개인정보 비식별 조치 표준화
- 개인정보 비식별 조치 가이드라인
: 일반적 기법 - 데이터를 삭제하거나 조작하는 방법으로 “① 가명처리, ② 총계처리, ③ 데이터 삭제, ④ 데이터 범주화, ⑤ 데이터 마스킹” 처리 기법과 함께 총 17가지 세부기술
: 프라이버시 보호 모델 - 개인정보 재식별 방지를 위한 정량적 평가 요소
: 데이터 결합 - 임시 대체키에 대한 생성과 결합 후 삭제 절차를 통해 개인정보 재식별을 방지
- ISO/IEC 20889

III. 개인정보 비식별 조치 기술 동향
- 개인정보 비식별 조치 소프트웨어는 개인정보보호법과 관련 고시 내용을 준수하며 개인정보를 안전하게 보호하여 빅데이터를 활용할 수 있도록 기술을 제공
가. 비정형 데이터 비식별 기술
- 텍스트 데이터 비식별 기술 : 패턴 매칭(Pattern matching) 기반과 개체명 인식(Named entity recognition) 으로 탐지 -> 삭제, 대체, 태깅으로 익명화
- 영상 데이터 비식별 기술 : 이미지 필터링, 이미지 암호화, 얼굴 합성, 인페인팅
- 음성 데이터 비식별 기술 : 화자의 발화 특성(성별, 연령 등)을 변화 / VAE(Variational Auto-Encoder), GAN(Generative Adversarial Networks)
나. 암호화 도구
- 동형 암호화(Homomorphic Encryption) : 평문에 대한 연산 결과와 암호문에 대한 연산 결과가 같은 값을 가져 복호화 없이 통계 분석 가능
- 형태 보존 암호화(Format-Preserving Encryption) : 블록암호에 기반하여 특정한 형태의 평문의 값을 동일한 형태의 값으로 변환하는 암호 알고리즘, ① 트윅(Tweak)의 사용, ② Feistel 구조의 암호화 방식 기반, ③ 기존 암호화 방식의 대치 및 보완
- 순서 보존 암호화(Order-Preserving Encryption) : 평문의 순서 정보를 보존하는 암호 기술, 데이터 활용 연산에 암호화된 정보 활용 가능
다. 향상된 프라이버시 보호 모델
- 차분 프라이버시 모델(Differential Privacy Model) : 단순한 숫자의 변화가 아니라 레코드들 자체의 확률적 변형을 통해 식별 가능성을 제한하는 접근법
- 익명처리 모델 : 완벽하게 익명화 된 익명 데이터셋에서는 원본 데이터셋에 존재하는 모든 유일한 속성값 조합을 완벽하게 제거

728x90
반응형
LIST