Data Anonymization란?

데이터 익명화(Data Anonymization)는 개인식별정보(PII)를 제거·대체·암호화해 데이터 주체를 재식별할 수 없도록 만드는 과정입니다. 마스킹, 가명화, 일반화, k-익명성, 차등 정보보호 등이 기법이며, GDPR·HIPAA 등 규제 준수와 데이터 공유·AI 학습을 위한 전제 조건입니다. 완전 익명화와 재식별 위험 간 균형이 핵심 과제입니다.

자주 묻는 질문

데이터 비식별화란?

데이터셋에서 개인을 알아볼 수 없도록 식별 필드를 제거하거나 가리는 것입니다.

비식별화된 데이터는 AI에 써도 안전한가요?

항상 그렇지는 않습니다. 비식별화 데이터는 다른 소스와 결합하면 재식별될 수 있어, 차등 프라이버시처럼 수학적 보장을 주는 방식이 쓰입니다.

비식별화와 차등 프라이버시는 무엇이 다른가요?

비식별화는 데이터 자체를 수정해 되돌릴 수 있지만, 차등 프라이버시는 출력이 개인에 대해 드러낼 수 있는 정보의 상한을 수학적으로 보장합니다.