데이터 경제와 개인정보 비식별 기술 동향
I. 데이터 경제와 개인정보보호
1. 데이터 경제의 개념
- 데이터 경제의 정의 : 모든 데이터가 활용하기 쉽게 자유롭게 흘러 타 산업 발전의 촉매 역할을 하면서, 혁신적 비즈니스와 서비스를 창출하는 경제
- 데이터 경제 활성화를 위해 데이터 활용에 대한 제도의 개정과 인프라 지원 등이 필요함
2. 빅데이터 개인정보보호 동향
가. 개인정보보호 관련 법·제도 동향
- 데이터 활용의 활성화를 위해 제시된 개인정보 비식별조치 가이드라인
- 개인정보 활용을 위해 “사전검토–비식별조치–적정성평가–사후관리”의 일련의 개인정보 비식별 조치 절차와 개인정보 처리자 간 데이터의 결합을 위한 정보집합물의 결합에 대한 방법을 포함
나. 개인정보보호 관련 기술 동향
- 1세대 : 인식의 단계 - 개인정보 필터링, 개인정보 노출진단, 초기 수준의 데이터베이스 암호화 기술
- 2세대 : 관리의 단계 - 개인정보에 대한 관리적 접근, 개인정보영향평가 및 ISMS-P(ISMS,PIMS, PIPL) , 개인정보 생명주기 관리, 개인정보 파일 샌드박스
- 3세대 : 활용의 단계 - 개인정보의 보호와 개인정보의 활용이라는 양면성을 모두 만족시키는 개인정보보호 기술의 제공 , 정형데이터, 반정형데이터, 비정형데이터 포괄
다. 개인정보 비식별 기술
- 데이터 활용 단계에서 데이터 비식별(Data De-identification) 기술과 프라이버시 보호 모델을 통해 데이터의 안전한 활용을 보장
- 소프트웨어의 발전 등으로 인해 비식별 조치된 데이터는 재식별(Re-identification)이 가능
II. 개인정보 비식별 조치 동향
가. 개인정보 비식별 조치 대상과 개인정보 재식별
- 개인정보 비식별 조치 대상 : 정형 데이터, 반정형 데이터, 비정형 데이터
- 개인정보 재식별(Re-identification)
: 개인정보의 재식별로부터 정보주체의 프라이버시 보호를 위해 재식별 가능성을 측정하고 재식별 위험을 해소
: Prosecutor Attack, Journalist Attack, Marketer Attack, (In)distinguishability Attack, Inference Attack
나. 개인정보 비식별 조치 표준화
- 개인정보 비식별 조치 가이드라인
: 일반적 기법 - 데이터를 삭제하거나 조작하는 방법으로 “① 가명처리, ② 총계처리, ③ 데이터 삭제, ④ 데이터 범주화, ⑤ 데이터 마스킹” 처리 기법과 함께 총 17가지 세부기술
: 프라이버시 보호 모델 - 개인정보 재식별 방지를 위한 정량적 평가 요소
: 데이터 결합 - 임시 대체키에 대한 생성과 결합 후 삭제 절차를 통해 개인정보 재식별을 방지
- ISO/IEC 20889
III. 개인정보 비식별 조치 기술 동향
- 개인정보 비식별 조치 소프트웨어는 개인정보보호법과 관련 고시 내용을 준수하며 개인정보를 안전하게 보호하여 빅데이터를 활용할 수 있도록 기술을 제공
가. 비정형 데이터 비식별 기술
- 텍스트 데이터 비식별 기술 : 패턴 매칭(Pattern matching) 기반과 개체명 인식(Named entity recognition) 으로 탐지 -> 삭제, 대체, 태깅으로 익명화
- 영상 데이터 비식별 기술 : 이미지 필터링, 이미지 암호화, 얼굴 합성, 인페인팅
- 음성 데이터 비식별 기술 : 화자의 발화 특성(성별, 연령 등)을 변화 / VAE(Variational Auto-Encoder), GAN(Generative Adversarial Networks)
나. 암호화 도구
- 동형 암호화(Homomorphic Encryption) : 평문에 대한 연산 결과와 암호문에 대한 연산 결과가 같은 값을 가져 복호화 없이 통계 분석 가능
- 형태 보존 암호화(Format-Preserving Encryption) : 블록암호에 기반하여 특정한 형태의 평문의 값을 동일한 형태의 값으로 변환하는 암호 알고리즘, ① 트윅(Tweak)의 사용, ② Feistel 구조의 암호화 방식 기반, ③ 기존 암호화 방식의 대치 및 보완
- 순서 보존 암호화(Order-Preserving Encryption) : 평문의 순서 정보를 보존하는 암호 기술, 데이터 활용 연산에 암호화된 정보 활용 가능
다. 향상된 프라이버시 보호 모델
- 차분 프라이버시 모델(Differential Privacy Model) : 단순한 숫자의 변화가 아니라 레코드들 자체의 확률적 변형을 통해 식별 가능성을 제한하는 접근법
- 익명처리 모델 : 완벽하게 익명화 된 익명 데이터셋에서는 원본 데이터셋에 존재하는 모든 유일한 속성값 조합을 완벽하게 제거
'정보관리기술사' 카테고리의 다른 글
(IT 이슈) 공공데이터 품질관리 (0) | 2020.11.27 |
---|---|
(IT 이슈) NoSQL 최신 데이터베이스 동향 (0) | 2020.11.25 |
(IT 이슈) 공공데이터 품질관리 중장기계획 (0) | 2020.11.25 |
정보관리기술사 한달만에 위기 (0) | 2020.11.25 |
TCP 오류제어, 흐름제어, 혼잡제어 (0) | 2020.11.19 |