데이터 버저닝은 특정 시점의 데이터셋 상태를 정확히 포착해 표기함으로써, 같은 데이터를 나중에 다시 불러오거나 복원할 수 있게 하는 활동입니다. 코드 버전 관리와 비슷하게 동작하지만, 버전으로 관리하는 대상이 데이터 자체라는 점이 다릅니다. 결과가 만들어진 그 순간의 행과 스키마, 분포가 그대로 남습니다. 단순 스냅샷은 사본을 저장하고 거기서 멈춥니다. 버저닝은 한 걸음 더 나아가 각 모델 실행을 비교 가능한 특정 상태에 묶어, 두 버전을 비교(diff)해 무엇이 바뀌었는지 보고 과거 결과가 기반한 바로 그 상태로 돌아가게 합니다. AI에서는 프로덕션 데이터가 변한 뒤에도 결과를 재현 가능하게 만드는 핵심입니다.
자주 묻는 질문
데이터 버저닝이란 무엇입니까?
특정 시점의 데이터셋 상태를 정확히 포착·표기해, 이후 다시 불러오거나 재현할 수 있게 하는 활동입니다.
백업이나 스냅샷과 같습니까?
아닙니다. 스냅샷은 사본을 저장합니다. 버저닝은 각 결과·실행을 비교·재현 가능한 특정 상태에 묶습니다.
AI에 데이터 버저닝이 왜 필요합니까?
프로덕션 데이터는 계속 변합니다. 버저닝은 과거 결과 뒤의 데이터를 정확히 재현하고 무엇이 바뀌었는지 보게 합니다.