RAG (Retrieval-Augmented Generation)란?

검색 증강 생성(RAG)은 AI 모델이 학습 때 익힌 내용에만 의존하지 않고, 질의 시점에 외부 지식 소스에서 관련 정보를 검색해 컨텍스트로 넣어 답변 품질을 높이는 기법입니다. 일반적인 RAG 흐름은 문서 저장소나 벡터 데이터베이스에서 가장 관련 있는 구절을 찾은 뒤, 그 구절을 근거로 모델이 답을 생성하게 합니다.

RAG는 환각을 줄이고, 재학습 없이도 최신·도메인 데이터로 답하게 해줍니다. 다만 검색된 데이터가 품질을 좌우해서, 오래되거나 중복되거나 구조가 엉성한 소스는 나쁜 답으로 이어집니다. CUBIG의 LLM Capsule은 AI를 위한 맥락 보존 데이터 레이어입니다. 통제된 기업 컨텍스트 위에서 RAG·에이전트 워크플로를 실행해, 민감한 기업 데이터가 자체 컨텍스트 통제 아래 모델 출력의 근거가 되게 합니다.

자주 묻는 질문

검색 증강 생성(RAG)이란?

RAG는 질의 시점에 외부 소스에서 관련 정보를 검색해 모델에 컨텍스트로 제공합니다. 학습 데이터에만 의존하지 않고 답변 품질을 높이는 기법입니다.

RAG를 쓰면 환각이 사라지나요?

RAG는 검색된 데이터로 답을 뒷받침해 환각을 줄입니다. 다만 정확도는 검색 소스의 품질과 최신성이 좌우합니다.

RAG와 파인튜닝 중 뭘 써야 하나요?

파인튜닝은 모델 가중치를 바꿔 문체·도메인을 입히고, RAG는 모델은 그대로 두고 질의 시점에 최신 컨텍스트를 넣습니다. 둘을 함께 쓰기도 합니다.