데이터 드리프트(Data Drift)는 프로덕션 AI 시스템에 들어가는 데이터가 시간이 지나며 바뀌어, 모델 코드는 그대로인데 입력이 처음 만들고 검증할 때와 더는 맞지 않게 되는 현상입니다. 피처 분포, 스키마, 값 범위, 상류 파이프라인 어디서든 일어날 수 있고, 하류 영향이 드러나기 전까지 정확도를 조용히 떨어뜨립니다.
실행마다 뒤에 있는 데이터 상태가 고정돼 있지 않으면 드리프트는 대응하기 어렵습니다. 실시간 데이터를 릴리스된 AI-Ready 기준선과 비교할 수 있으면, 어떤 필드와 분포가 움직였는지 정확히 보고 이전 상태를 재현해 원인을 확인할 수 있습니다.