공공기관이 안전한 데이터 공개 및 활용을 위해 DTS를 필요로 하는 이유(2025년 공공 데이터 제공 및 데이터 기반 행정 평가 가이드라인 포함)

by CUBIG

안녕하세요, 접근할 수 없었던 데이터를 잠금 해제하는 데 전념하는 기업 CUBIG입니다. 😎

2026년에는 공공 부문 데이터 활용 기준이 변화하고 있습니다. 올해 발표된 공공 데이터 제공 및 데이터 기반 행정 평가 지침에는 “가명 데이터 제공 및 합성 데이터 공유”가 가산점 항목 으로 추가되었습니다.

이는 공공 기관이 더 이상 단순히 얼마나 많은 데이터를 공개하는지로만 평가받지 않는다는 것을 의미합니다. 이제 평가의 초점은 데이터를 얼마나 안전하고 효율적으로 변환하고 재사용할 수 있는지로 옮겨가고 있습니다. 결과적으로 합성 데이터는 공공 부문 데이터 운영에 있어 점점 더 중요한 도구로 자리매김하고 있습니다.


공공 부문 데이터는 왜 사용하기 어려울까요? 🤔

공공기관은 행정 절차를 통해 수집된 매우 민감한 정보들을 다룹니다. 주소, 연락처, 가족 정보, 건강 정보, 복지 기록, 진료 기록 등 그 목록은 끝이 없습니다.

이러한 데이터 세트는 엄청난 가치를 지니고 있지만, 특히 조직 외부에서 분석하거나 공유하기는 매우 어렵습니다.

기존의 합성 데이터 기술은 원본 데이터에서 직접 학습하는 방식에 의존하기 때문에 출처의 미묘한 흔적이 남을 수 있습니다. 모델에 대한 공격이나 오작동이 발생할 경우, 출처 노출 가능성을 완전히 배제하기 어렵습니다.

DTS는 근본적으로 이러한 위험을 방지합니다. DTS는 접근 차단 아키텍처를 기반으로 구축되어 모델이 애초에 원본 데이터를 전혀 볼 수 없습니다. 차분 프라이버시(DP)와 결합된 DTS는 공공 기관의 엄격한 보안 요구 사항을 충족합니다.


“데이터는 안전하게, 분석은 불가능하게” 📉

공공기관이 공통적으로 직면하는 과제

이 말은 공공 부문에서 자주 들을 수 있는 표현입니다. 기존의 개인정보 삭제 방식에서는 중요한 정보가 삭제됩니다. 이로 인해 결측값이 늘어나고, 편향이 심화되며, 희귀 사례가 제거되고, 구조적 관계가 파괴되어 궁극적으로 데이터셋이 분석이나 AI 개발에 부적합해집니다.

DTS는 다른 접근 방식을 취합니다.

단순히 개인 정보를 제거하는 도구가 아닙니다.
DTS는 합성 생성 과정에서 자동으로 다음 작업을 수행합니다.

• 결측값 재구성
• 희귀 클래스 재구성
• 편향 완화
• 속성 재생성

그 결과, AI에서 바로 사용할 수 있는 합성 데이터가 생성되는데, 이는 분석, 모델링 및 연구에 있어 원본 데이터보다 더 유용한 경우가 많습니다.

1 1024x572 1

공공기관은 어떻게 하면 장기 심사 절차를 단축할 수 있을까요? ⏱️

공공 부문에서 데이터 공유를 위해서는 일반적으로 다음과 같은 사항이 필요합니다.

• 보안 검토
• 재식별 위험 평가
• 법률 검토
• 다단계 내부 승인

이러한 과정은 대개 몇 달이 걸립니다.

DTS는 이 주기를 단축합니다.
합성 데이터가 생성되면 DTS는 자동으로 SynData 유효성 검사 보고서를 생성하며 , 이 보고서에는 다음 내용이 포함됩니다.

• 통계적 유사성 지표
• AI 모델 성능 비교
• 재식별 위험 점수
• 구조적 적합성 검사

데이터 전문가가 전담으로 없는 기관이라도 데이터 활용에 대해 신속하고 정보에 입각한 결정을 내릴 수 있습니다.


공공 부문 데이터는 다양한 형태로 존재합니다 📊📄📷📈

DTS는 이 모든 것들을 처리합니다.

정부 데이터는 구조화된 표 형식에만 국한되지 않습니다.
다음과 같은 형태도 포함됩니다.

• 비정형 민원 및 문서(텍스트)
• 행정 통계(표)
• CCTV 영상 및 점검 이미지(이미지)
• 도시 규모 센서 스트림(시계열)

대부분의 합성 데이터 도구는 이러한 데이터 유형 중 하나만 지원하므로 여러 개의 별도 시스템이 필요합니다.

DTS는 단일 프레임워크 내에서 테이블, 텍스트, 이미지, 시계열 등 모든 주요 데이터 형식을 지원합니다.
이를 통해 데이터 작업 효율성이 향상되고 여러 시스템을 사용할 필요성이 줄어듭니다.


“외부 연결이 불가능한” 환경에서의 합성 데이터 🔒

공공기관을 위한 실용적인 선택지

대부분의 공공기관은 외부 데이터 전송이 제한된 네트워크 분할 환경에서 운영됩니다. 기존의 합성 데이터 솔루션은 다음과 같은 요구 사항을 갖는 경우가 많습니다.

  1. 원본 데이터를 외부 서버에 업로드하거나
  2. 보안 환경으로 외부 모델을 가져오는 것

두 선택지 모두 공공 부문에서 적용시키는 것은 어렵거나 불가능합니다.

DTS는 이러한 문제를 해결합니다. DTS의 비접근 아키텍처는 원본 데이터를 외부로 이동시키지 않고도 내부 인프라 내에서
합성 데이터를 생성할 수 있도록 합니다. 매우 민감한 데이터를 다루는 기관은 안전하게 합성 데이터를 내부적으로 생성 및 공유하고 다른 조직과 협업할 수도 있습니다.


중요한 신호: 합성 데이터가 이제 공공 데이터 평가에 활용되고 있습니다 📘

2025년 평가 지침에는 “가명 처리된 데이터 제공 및 합성 데이터 공유”가 가산점 항목으로 명시적으로 포함되어 있습니다. 이는 단순히 원시 데이터를 공개하는 것 뿐 아니라 안전한 데이터 변환 및 활용을 인정하는 방향으로 기관들이 변화하고 있음을 보여줍니다 .

기관들이 데이터 보안과 점수 산정 성능 사이에서 균형을 맞추려 할 때, 합성 데이터는 두 가지 요구 사항을 모두 충족하는 대안을 제공합니다.

EC A3 BC EC 8B 9D ED 9A 8C EC 82 AC ED 81 90 EB B9 85 EB B0 B0 ED 98 B8 EC A0 95 EB AF BC EC B0 AC EC A0 9C ED 92 88 EC 82 AC EC A7 84 dts

DTS는 공공기관이 직면하는 반복적인 문제들을 해결함으로써 공공기관을 지원합니다.

• 민감한 정보로 인한 제약 사항
• 비식별화 후 데이터 품질 저하
• 길고 복잡한 승인 절차
• 다양한 데이터 형식
• 네트워크 격리 및 수출 불가 환경

각 기관마다 우선순위는 다르지만, DTS는 보다 안전하고 빠르며 효율적인 공공 부문 데이터 운영을 위해 합성 데이터를 고려하는 기관에 실용적인 선택지입니다.

여러분의 환경에 맞는 맞춤형 지침, 타당성 평가 또는 DTS 데모가 필요하시면 언제든지 문의해 주세요.


en 1 1