목차
안녕하세요, 오랫동안 활용되지 못하던 데이터의 가치를 열어 가는 기업 CUBIG입니다. 😎
2026년, 공공 데이터 활용의 기준이 달라지고 있습니다.
올해 공공데이터 제공 및 데이터기반행정 평가지침에는 “가명정보 제공 및 합성데이터 공유” 항목이 가점 항목으로 새롭게 추가되었습니다.
이는 공공기관이 더 이상 데이터를 얼마나 많이 개방했는지만으로 평가받지 않는다는 것을 의미합니다. 이제 평가의 초점은 데이터를 얼마나 안전하고 효과적으로 가공해 다시 활용할 수 있는가로 옮겨 가고 있습니다.
그 결과, 합성데이터는 공공 데이터 운영에서 점점 더 중요한 수단으로 자리 잡고 있습니다.
공공 데이터는 왜 이렇게 활용하기 어려울까요?
공공기관은 행정 과정에서 수집된 매우 민감한 정보를 다룹니다.
주소, 연락처, 가족 정보, 건강 정보, 복지 기록, 상담 이력 등 그 범위는 끝이 없습니다.
이러한 데이터셋은 막대한 가치를 지니고 있지만, 특히 기관 외부에서 분석하거나 공유하기가 대단히 어렵습니다.
기존 합성데이터 기술은 원본 데이터를 직접 학습하는 방식에 의존하기 때문에, 원본의 흔적이 미세하게 남을 수 있습니다. 모델 공격이나 오작동이 발생할 경우, 정보가 노출될 가능성을 배제하기 어렵습니다.
DTS는 이러한 위험을 근본적으로 차단합니다.
DTS는 모델이 애초에 원본 데이터를 보지 않는 비접근(non-access) 아키텍처를 기반으로 설계되었습니다. 여기에 차분 프라이버시(Differential Privacy, DP)를 결합해, DTS는 공공기관의 엄격한 보안 요건을 충족합니다.
“데이터는 안전한데… 분석을 할 수가 없어요”
공공기관이 흔히 겪는 어려움
이 말은 공공 부문에서 자주 듣게 되는 이야기입니다.
일반적인 비식별화 과정에서는 중요한 정보가 삭제됩니다. 그 결과 결측치가 늘어나고, 편향이 심해지며, 희귀 사례가 사라지고, 데이터의 구조적 관계가 깨지면서, 결국 분석이나 AI 개발에 부적합한 데이터셋이 되고 맙니다.
DTS는 다른 방식으로 접근합니다.
DTS는 단순히 개인정보를 제거하는 도구가 아닙니다.
합성데이터를 생성하는 과정에서 DTS는 다음을 자동으로 수행합니다.
• 결측치 복원
• 희귀 클래스 재구성
• 편향 완화
• 속성 재생성
그 결과, 분석·모델링·연구에 있어 원본 데이터보다 오히려 더 활용도가 높은 경우가 많은 AI-ready 합성데이터가 만들어집니다.

공공기관은 길고 복잡한 심의 절차를 어떻게 단축할 수 있을까요?
공공 부문의 데이터 공유에는 일반적으로 다음 절차가 요구됩니다.
• 보안 심의
• 재식별 위험성 평가
• 법률 검토
• 다단계 내부 결재
이러한 절차에는 흔히 수개월이 소요됩니다.
DTS는 이 주기를 단축합니다.
합성데이터가 생성되면, DTS는 다음 내용을 담은 SynData 검증 리포트를 자동으로 생성합니다.
• 통계적 유사성 지표
• AI 모델 성능 비교
• 재식별 위험 점수
• 구조적 적합성 점검
데이터 전담 인력이 없는 기관이라도, 데이터 활용에 대해 신속하고 근거 있는 의사결정을 내릴 수 있습니다.
공공 데이터는 다양한 형태로 존재합니다
DTS는 이 모든 형태를 처리합니다
공공 데이터는 정형 테이블에만 국한되지 않습니다.
다음과 같은 데이터가 포함됩니다.
• 비정형 민원·문서 (텍스트)
• 행정 통계 (테이블)
• CCTV 영상 및 점검 이미지 (이미지)
• 도시 규모의 센서 스트림 (시계열)
대부분의 합성데이터 도구는 이 중 한 가지 데이터 유형만 지원하기 때문에, 여러 개의 개별 시스템을 따로 갖춰야 합니다.
DTS는 테이블, 텍스트, 이미지, 시계열에 이르기까지 주요 데이터 형식 전체를 하나의 프레임워크 안에서 지원합니다.
이를 통해 데이터 운영의 효율을 높이고, 여러 시스템을 따로 운영할 필요를 줄여 줍니다.
“반출 불가” 환경에서의 합성데이터
공공기관을 위한 현실적인 대안
대부분의 공공기관은 외부로의 데이터 전송이 제한되는 망분리 환경에서 운영됩니다.
기존 합성데이터 솔루션은 흔히 다음 중 하나를 요구합니다.
- 원본 데이터를 외부 서버에 업로드하거나,
- 외부 모델을 보안 환경 내부로 반입하는 방식입니다.
두 방식 모두 공공 부문에서는 어렵고, 때로는 불가능하기까지 합니다.
DTS는 이 문제를 해결합니다.
비접근 아키텍처 덕분에, 원본 데이터를 외부로 옮기지 않고도 내부 인프라 안에서 합성데이터를 생성할 수 있습니다.
매우 민감한 데이터를 다루는 기관도 내부에서 안전하게 합성데이터를 만들어 공유할 수 있으며, 나아가 다른 기관과 협업하는 것도 가능합니다.
분명한 신호: 이제 합성데이터가 공공데이터 평가에서 인정받기 시작했습니다
2025년 평가지침은 “가명정보 제공 및 합성데이터 공유”를 가점 항목으로 명시적으로 포함하고 있습니다.
이는 단순한 원본 개방을 넘어 안전한 데이터 가공과 활용을 인정하는 방향으로 제도가 전환되고 있음을 보여 줍니다.
데이터 보안과 평가 성과 사이에서 균형을 잡아야 하는 기관에게, 합성데이터는 두 가지 요구를 모두 충족하는 대안이 됩니다.

DTS는 공공기관이 반복적으로 직면하는 다음과 같은 과제를 해결하며 기관을 지원합니다.
• 민감정보로 인한 제약
• 비식별화 이후 떨어지는 데이터 품질
• 길고 복잡한 결재 절차
• 다양한 데이터 형식
• 망분리 및 반출 불가 환경
기관마다 우선순위는 저마다 다르지만, 더 안전하고 더 빠르며 더 효율적인 공공 데이터 운영을 위해 합성데이터를 검토하는 기관에게 DTS는 현실적인 선택지입니다.
귀 기관 환경에 맞춘 안내나 도입 타당성 검토, 또는 DTS 데모가 필요하시다면 언제든 도와드리겠습니다.
