편집부 주: 본 기사는 RAG 기술의 일반 해설입니다. 모노시리AI는 RAG를 본 운용에서 검증한 후, 현재는 Corpus2Skill(skill 모드)을 채택하고 있습니다. 판단의 경위는 여기를 참조하세요.

"생성형 AI를 사내에 도입하고 싶은데, 우리 회사 정보를 바탕으로 답변해 주면 좋겠다." 이런 목소리가 빠르게 늘고 있습니다. 그 열쇠를 쥐고 있는 기술이 바로 RAG입니다.

RAG는 생성형 AI가 사내 문서를 "읽어가며" 답변을 만들어내는 원리로, 최근 AI 활용의 거의 모든 기반이 되고 있습니다. 이 글에서는 RAG란 무엇인지 비엔지니어도 이해할 수 있도록 설명하고, 왜 사내 문서 검색을 획기적으로 바꾸는지, 그리고 기업에서 도입할 때 반드시 짚어야 할 주의점까지 정리하여 소개합니다.

이 글에서 알 수 있는 것

RAG(Retrieval-Augmented Generation)의 기본 개념
기존 사내 문서 검색의 한계와 RAG가 가져오는 변화
RAG를 구성하는 세 가지 요소(임베딩, 벡터 검색, LLM)
기업에서 RAG를 도입할 때의 주의점

RAG란 무엇인가 -- 생성형 AI에 사내 문서를 "참조하게 하는" 원리

RAG는 **Retrieval-Augmented Generation(검색 증강 생성)**의 약자입니다. 한마디로 말하면, **"AI에게 답변을 시키기 전에 관련 정보를 검색해서 읽게 한다"**는 원리입니다.

생성형 AI는 학습한 방대한 지식을 바탕으로 자연스러운 문장을 만들어낼 수 있지만, 자사의 사내 문서는 학습하지 않았습니다. 그래서 아무런 장치 없이 "우리 회사의 연차 휴가 사용법을 알려줘"라고 물으면, 일반론이나 잘못된 답변밖에 돌려받을 수 없습니다.

RAG는 이 문제를 다음과 같은 흐름으로 해결합니다.

사용자의 질문을 받는다
사내 문서 중에서 질문과 관련 있어 보이는 부분을 검색한다
검색 결과를 AI에게 전달하고 "이 정보를 참고하여 답변해 주세요"라고 지시한다
AI가 전달받은 정보를 바탕으로 답변을 생성한다

이 "검색한 뒤에 생성한다"는 한 번의 과정이, 생성형 AI를 **"자사를 아는 AI"**로 바꾸어 줍니다.

기존 사내 문서 검색은 왜 쓰기 어려운가

RAG의 가치를 이해하기 위해 먼저 기존의 사내 문서 검색을 되돌아봅시다. 많은 기업에서 사용되는 검색은 크게 두 종류로 나뉩니다.

1. 키워드 검색

파일 서버나 그룹웨어에 탑재된 검색 기능의 대부분은 **입력한 문자열과 일치하는 단어를 찾는 "키워드 검색"**입니다. 여기에는 다음과 같은 한계가 있습니다.

표기 차이에 취약하다: "연차"라고 검색해도, 문서에 "연차 휴가"나 "유급 휴가"라고 쓰여 있으면 검색되지 않는다
유의어·다른 표현을 처리할 수 없다: "경비 정산"과 "선지급 청구"가 별개의 것으로 취급된다
검색 스킬에 의존한다: 어떤 단어를 써야 걸리는지는 검색하는 사람의 감과 경험에 달려 있다

2. 전문(全文) 검색 엔진

Elasticsearch나 OpenSearch 같은 전문 검색 엔진을 도입하면 키워드 검색보다는 유연해집니다. 그러나 근본적으로는 문자열 매칭에 가까워, 여러 문서를 가로질러 하나의 답변으로 정리할 수는 없습니다. 결국 사용자는 검색 결과 파일을 하나씩 열어 직접 답을 조립해야 합니다.

즉, 기존 검색은 "문서를 찾는 단계까지만" 해 주는 셈입니다. "답을 알고 싶을 뿐"인 사용자에게는 여전히 번거로움이 많이 남아 있습니다.

RAG가 가져오는 변화 -- "검색"에서 "답변 생성"으로

RAG의 본질은, 검색과 생성형 AI를 결합함으로써 사용자의 경험을 "문서를 찾는다"에서 "답을 받는다"로 바꾼 데에 있습니다.

같은 질문으로 기존 검색과 RAG를 비교해 봅시다.

항목	기존 키워드 검색	RAG를 활용한 AI 답변
입력	키워드(단어)	자연스러운 문장의 질문
출력	검색된 파일 목록	질문에 대한 직접적인 답변
표기 차이	취약(유의어는 별개로 처리)	강점(의미로 검색)
여러 문서의 통합	불가능(개별적으로 열어야 함)	가능(교차 참조하여 답변 생성)
근거 확인	파일을 열어 직접 찾기	답변과 함께 출처가 제시됨
사용할 수 있는 사람	검색에 익숙한 사람	신입사원을 포함한 모두

특히 중요한 것은 **"신입사원도 쓸 수 있다"**는 점입니다. 키워드 검색은 요령을 알지 못하면 제대로 활용하기 어렵지만, AI에 대한 질문은 자연스러운 말로 물으면 끝입니다. 사내 정보로의 진입 장벽이 단숨에 평평해집니다.

RAG의 원리를 조금 더 자세히 -- 세 가지 요소

RAG는 크게 임베딩(Embedding), 벡터 검색, **LLM(대규모 언어 모델)**이라는 세 가지 요소로 이루어져 있습니다. 원리를 알아두면 도입 시 툴 선정에서도 헤매지 않게 됩니다.

1. 임베딩(Embedding) -- 문장을 "숫자의 나열"로 변환한다

임베딩이란 문장의 의미를 **수백~수천 개의 숫자 나열(벡터)**로 변환하는 처리입니다. 의미가 가까운 문장끼리는 변환 후의 숫자 나열도 가까워지도록 설계되어 있습니다.

예를 들어 "연차 휴가 신청 방법"과 "유급 휴가 사용법"은 글자로는 다르지만 의미가 비슷하기 때문에 닮은 숫자 나열로 변환됩니다. 이것이 표기 차이와 유의어를 흡수할 수 있는 이유입니다.

사내 문서를 RAG에 활용할 때는, 우선 모든 문서를 이 벡터로 변환해 둡니다. 이 사전 준비 작업을 **"인덱싱"**이라고 부릅니다.

2. 벡터 검색 -- 의미가 가까운 것을 찾아낸다

질문이 들어오면, 질문 문장도 같은 방법으로 벡터로 변환한 뒤, 미리 만들어 둔 사내 문서의 벡터와 비교하여 의미가 가까운 것을 상위부터 꺼냅니다.

이것이 **"시맨틱 검색(의미 검색)"**이라고도 불리는 기술이며, RAG의 "검색 파트"의 핵심입니다. 키워드가 일치하지 않더라도 의미가 가까우면 검색된다는 것이 특징입니다.

3. LLM -- 검색 결과를 바탕으로 답변을 생성한다

마지막으로, 꺼낸 사내 문서의 발췌와 원래 사용자의 질문을 묶어 LLM(대규모 언어 모델)에 전달합니다. LLM은 전달받은 정보를 읽어가면서, **"이 자료에 따르면 연차 휴가는 원칙적으로..."**와 같이 자연스러운 문장으로 답을 정리합니다.

여기서 중요한 것은, LLM은 눈앞의 자료를 읽어가면서 답하고 있다는 점입니다. 자사의 정보에 부합하는 답변이 되기 쉽고, 근거가 된 문서를 함께 제시할 수도 있습니다.

시맨틱 검색 자체의 원리에 대해서는 사내 문서를 AI로 검색하는 방법에서 자세히 해설하고 있으니, 함께 참고해 주세요.

기업에서 RAG를 도입할 때의 주의점

RAG는 강력한 원리이지만, 도입하면 반드시 잘 되는 것은 아닙니다. 사내에 정착시키기 위해서는 몇 가지 짚어 두어야 할 포인트가 있습니다.

1. 데이터의 저장 위치와 보안을 확인한다

RAG는 사내 문서를 AI에게 읽게 하는 원리이므로, 문서 데이터가 어디에 보관되고 누가 접근할 수 있는지를 명확히 해 둘 필요가 있습니다. 해외 리전에 저장되면 컴플라이언스 요건을 충족하지 못하는 경우도 있습니다.

툴을 선택할 때는 데이터의 저장 리전, 암호화 방식, 테넌트(조직)별 분리가 어떻게 구현되어 있는지 확인합시다. 자세한 내용은 보안 정책을 함께 참고해 주세요.

2. 근거가 되는 문서가 제시되는 것을 중시한다

생성형 AI의 답변은 자연스러운 문장으로 돌아오지만, **그럴듯해 보이는 오답(할루시네이션)**을 만들어낼 때가 있습니다. 이를 막기 위해, RAG로 생성한 답변에는 근거가 된 사내 문서로의 링크나 발췌가 함께 표시되는 것이 중요합니다.

사용자는 답변을 그대로 믿는 것이 아니라, 필요에 따라 원본 문서를 확인할 수 있는 상태로 유지해 둔다. 이것이 RAG 운영의 기본 자세입니다.

3. 원본 문서의 품질이 답변 품질을 결정한다

RAG는 어디까지나 **"사내에 있는 정보를 바탕으로 답한다"**는 원리입니다. 원본 문서가 오래되었거나 서로 모순된다면, 그 모순이 그대로 답변에 드러납니다.

도입과 함께 오래된 규정의 정리, 중복 문서의 통합, FAQ의 정비를 진행하는 것이 답변 품질을 높이는 지름길입니다. AI를 도입함으로써 결과적으로 문서 정리에 대한 동기가 생긴다는 부수적인 효과도 있습니다.

4. 비용 구조를 파악한다

RAG는 질문할 때마다 "벡터 검색"과 "LLM 호출"이 실행되기 때문에, 사용량에 따라 비용이 발생하는 방식을 채택한 서비스가 일반적입니다. 사용자 수가 아닌 사용량으로 과금되는지, 정액으로 무제한 사용할 수 있는지는 서비스에 따라 크게 다릅니다.

사내 전원에게 사용하게 하고 싶다면, 사용자 수 무제한 또는 충분한 사용 한도가 있는 정액제 요금제를 선택하면 비용 예측이 쉬워집니다. 요금제를 비교 검토할 때 참고해 주세요.

5. 사용하게 만드는 동선을 설계한다

아무리 뛰어난 원리를 도입하더라도, 직원이 매일 사용하는 장소에 놓여 있지 않으면 정착되지 않습니다. 관리 화면에 로그인해야 쓸 수 있는 툴은 사용되지 못한 채 방치되기 쉽습니다.

LINE이나 채팅 위젯 등 평소의 업무 흐름에 녹아드는 형태로 접근할 수 있다는 점이 정착의 열쇠입니다. Monoshiri AI가 제공하는 기능의 자세한 내용은 기능 목록을 확인해 주세요.

보충: RAG와 그 다음 선택지

RAG는 강력한 구조이지만, 본 운용을 시작하면 「청크 분할로 인한 출처의 모호함」「벡터 인프라의 상시 비용」「재벡터화 운용 부담」 등 현실적인 과제에 직면할 수 있습니다. 사내 지식을 AI에게 물어보는 모노시리AI 자체도 RAG를 본 운용한 후, 이러한 과제를 해소하기 위해 Corpus2Skill(skill 모드)으로 전면 이행했습니다. 판단의 경위는 RAG를 그만뒀습니다 -- 모노시리AI가 Corpus2Skill(skill 모드)으로 전면 이행한 이유에서, 장문 컨텍스트를 포함한 선택지의 정리는 RAG는 이미 낡았는가? 장문 컨텍스트 시대의 지식베이스 설계에서 해설하고 있습니다.

마무리

이 글에서는 RAG(검색 증강 생성)의 원리와, 사내 문서 검색에의 활용에 대해 전해 드렸습니다. 요점을 정리해 봅니다.

RAG는 "AI에게 답변시키기 전에 관련 문서를 검색해서 읽게 하는" 원리: 생성형 AI가 학습하지 않은 자사 정보에 대해서도 정확히 답할 수 있게 된다
기존 검색과의 차이는 "문서를 찾는다"에서 "답을 받는다"로의 변화: 표기 차이와 유의어에 강하고, 여러 문서를 가로지르는 답변을 생성할 수 있다
원리는 세 가지 요소로 나뉜다: 임베딩, 벡터 검색, LLM의 조합으로 성립한다
도입의 성패는 운영에서 갈린다: 데이터 보관, 근거 제시, 문서 품질, 비용 구조, 정착 동선의 다섯 가지를 짚는 것이 중요하다

RAG는 이미 일부 선진 기업만의 것이 아니라, 사내 지식을 활용하는 데 있어 표준적인 수단이 되어가고 있습니다. 자사의 어떤 업무부터 시작할지, 어떤 문서를 가장 먼저 올릴지 생각하는 지점부터, 도입 검토를 시작해 보시는 것은 어떨까요.

RAG란 무엇인가? 사내 문서 검색을 획기적으로 바꾸는 원리를 쉽게 해설

이 글에서 알 수 있는 것

RAG란 무엇인가 -- 생성형 AI에 사내 문서를 "참조하게 하는" 원리

기존 사내 문서 검색은 왜 쓰기 어려운가

1. 키워드 검색

2. 전문(全文) 검색 엔진

RAG가 가져오는 변화 -- "검색"에서 "답변 생성"으로

RAG의 원리를 조금 더 자세히 -- 세 가지 요소

1. 임베딩(Embedding) -- 문장을 "숫자의 나열"로 변환한다

2. 벡터 검색 -- 의미가 가까운 것을 찾아낸다

3. LLM -- 검색 결과를 바탕으로 답변을 생성한다

기업에서 RAG를 도입할 때의 주의점

1. 데이터의 저장 위치와 보안을 확인한다

2. 근거가 되는 문서가 제시되는 것을 중시한다

3. 원본 문서의 품질이 답변 품질을 결정한다

4. 비용 구조를 파악한다

5. 사용하게 만드는 동선을 설계한다

보충: RAG와 그 다음 선택지

마무리

이 아티클 공유

관련 아티클

「RAG 불필요론」은 정말일까? 사내 지식 AI 판단 축 6가지

RAG는 이제 한물갔나? 롱 컨텍스트 시대의 지식 베이스 설계

Corpus2Skill이란? RAG와 skill 모드의 차이 해설

Monoshiri AI를 무료로 체험하세요

같은 카테고리의 아티클

「RAG 불필요론」은 정말일까? 사내 지식 AI 판단 축 6가지

Corpus2Skill이란? RAG와 skill 모드의 차이 해설

RAG는 이제 한물갔나? 롱 컨텍스트 시대의 지식 베이스 설계