AI Agent 전문가 모두의 AI 케인이
2025년 가장 최신의 사례의 RAG로 다시 찾아왔습니다.

LLM, RAG, 모두의 AI, 모두의 AI 케인, Agent, 에이전트

가장 빨리 학습하고 전파하는 얼리어답터
모두의 AI 케인
랭그래프로 재편된 2025 RAG

안녕하세요. 모두의 AI라는 유튜브를 운영 중이며,
‘이토록 쉬운 RAG 시스템 구축을 위한 랭체인 실전 가이드’ 저자인 케인입니다.

랭체인 공식문서에서 RAG 기초 설명이 랭체인 기반에서 이제는 랭그래프 및 그래프 기반의 설명으로 바뀌며 새로운 RAG 학습의 토대가 만들어졌습니다.

LangGraph 기반 RAG의 시작부터, RAG의 확장가능성 등을 살펴보며 Agent로 완성하는 RAG 로드맵을 이 강의에서 함께 하세요.

실무에서 맞닥뜨릴 수 있는 여러 현실적인 문제와
최신 기술(추론 모델, 에이전틱 워크플로우, 멀티모달 문서 파싱)등에 초점을 맞춰
국내에서 가장 빠르고 알기 쉽게 정리하였습니다.

여러분의 궁금증을 모아 강의를 만들었으니,
이 강의로 고도화된 RAG와 Agent의 정점에 도달하세요.
모두의 AI 유튜브 바로가기 →

케인님의 강의력과 정보력을
1만 구독자가 보증합니다.
*2025년 1월 기준, 유튜브 구독자 수 및 유튜브 댓글을 기반한 내용입니다.

ImageSlide
ImageSlide
ImageSlide
ImageSlide
ImageSlide

01. 커리큘럼

RAG의 시작부터 가장 핫한 트렌드까지!
20시간으로 끝내는 RAG/Agent 로드맵

  • 첫 번째

    2025 LLM 동향

    LLM의 3가지 발전 방향과
    RAG의 대체/보완/확장 방향을 알아봅니다.

  • 두 번째

    RAG의 전반적인 흐름 이해

    RAG를 파이프라인에 따라 구축하며 RAG 시스템 구축을 위한 실질적인 기술을 학습합니다.

  • 세 번째

    단계별 RAG 페인포인트 극복

    문서별 인덱싱, 실무에 바로 적용할 수 있는 유용한 내용을 제공합니다

  • 네 번째

    6개 agent 기반 RAG 실습

    문서 포맷과 목적에 최적화된 RAG 아키텍처를 배우고 구축 방법을 실습합니다.

  • 다섯 번째

    파이널 LLM 풀스택 프로젝트

    멀티모달 RAG, Reasoning RAG, UI까지 LLM 풀스택 웹앱을 실습으로 구현합니다.

  • 🎉🎉🥳

    2025 RAG 시스템
    완전 정복!

02. 데이터별 RAG 전처리

사람들이 가장 자주 쓰는
5개 포맷의 문서별 임베딩 방법 총정리

문서 서식에 따라 RAG 전처리의 어려움이 달라져요!
특히 어려운 인덱싱 방법이 어떻게 다른지 알려드려요.

LLM, RAG, 모두의 AI, 모두의 AI 케인, Agent, 에이전트, RAG 전처리, 전처리, 데이터 전처리, 이미지 전처리, 표 전처리

가장 자주 평가하는 5가지 문서별 RAG 전처리 특징을 비교하며,
내 문서의 데이터를 이해하는 RAG를 제작하세요.

PDF 문서에 따른 RAG 인덱싱 특징

· Layout Parsing을 통해 표, 이미지, 차트, 수식 등이 담긴 복잡한 정보를 추출합니다.
· Docling, Megaparser 등 최신 마크다운 변환기를 활용해 실무 활용도를 알아봅니다.
· 표, 이미지, 차트 등은 VLM을 통해 더 정확한 텍스트 정보로 변환합니다.


활용 스택
Docling DocLayout-Yolo GPT-4o Qwen2.5 VL LangChain

PPT 문서에 따른 RAG 인덱싱 특징

· VLM(멀티모달 LLM)을 통해 복잡한 도식화합니다.
· RAG 품질 향상에 효과적인 Contextual Retrieval을 위해 청크에 슬라이드 맥락을 더합니다.


활용 스택
Docling Qwen2.5 VL GPT-4o LangChain

워드 문서에 따른 RAG 인덱싱 특징

· 워드 내 복잡한 표나 2단 형식의 글을 Docling을 통해 올바른 순서와 형식으로 마크 다운 변환합니다.
· 정해진 템플릿 문서는 structured format으로 변환 후 특정 요소만 추출 가능합니다.


활용 스택
Docling LangChain

한글.hwp 문서에 따른 RAG 인덱싱 특징

· hwp 파일은 우리나라에서만 공문서로 활용되는 확장자이므로, 해외 오픈소스 전처리 툴을 활용하기 어렵습니다.
· hwp를 직접 다루기보다는, pdf로 변환하여 텍스트, 표 등의 정보를 추출합니다.


활용 스택
Docling win32gui

각 문서들별로 임베딩 뿐만 아니라
각 데이터 특징별로 RAG 아키텍처도 달라져요.

LLM, RAG, 모두의 AI, 모두의 AI 케인, Agent, 에이전트, RAG 아키텍처, 아키텍처, 최신 RAG

03. 데이터 별 RAG

6가지 RAG 프로젝트로
데이터 특징 별 알맞은 RAG 선택 및 구축 실습까지

각 데이터 특징별로 RAG 아키텍처도 달라져요.
6개 각기 다른 실무에서 사용하는 데이터에 알맞은 RAG 선택과 구축 방법을 익힙니다.

01 복잡한 논문 Q&A RAG 파이프라인
학습 내용 및 ︎기대효과

· 논문은 텍스트 뿐만 아니라 표, 이미지, 차트 등 다양한 정보를 담고 있기 때문에 파싱에 초점을 두고 파이프라인을 구성합니다.
· PDF 파싱 라이브러리가 표와 텍스트를 마크다운으로 변환하고, VLM으로 차트와 이미지의 캡션을 생성하여 모든 정보를 텍스트화합니다.

02 HWP 파일 RAG 파이프라인
학습 내용 및 ︎기대효과

· 한글 파일의 특성 상 파싱 라이브러리가 많지 않기 때문에, PDF로 변환 후 파싱을 진행합니다.
· Langgraph 기반의 기초적인 RAG 파이프라인을 구축해봅니다.

03 공시 보고서(10-k)/사업 보고서 복잡한 질문 Q&A
학습 내용 및 ︎기대효과

· 공시 보고서는 수치 정보가 많으며, 전문 용어가 섞여 있어 일반적인 RAG로 충분한 답변을 받을 수 없습니다.
· Multi-Query 기반의 RAG 파이프라인을 통해 더 자세하고 정확한 논리적 답변을 이끌어내는 것이 이 섹션의 목표입니다.

04 여러 회의록 Q&A
학습 내용 및 ︎기대효과

· 회의록이라는 정해진 템플릿 하의 정보를 메타데이터화하여 더 정확한 검색을 이끌어냅니다.
· Self query retriever를 통해 회의 날짜, 주제 등을 정확히 인식한 RAG 파이프라인을 구축해봅니다.

05 이커머스 데이터 Text-to-SQL
학습 내용 및 ︎기대효과

· SQL 테이블 데이터의 경우, 일반 RAG 파이프라인이 아닌 Text-to-SQL로 정확한 수치 정보를 추출해야 합니다.
· 이커머스 데이터를 예제로, 모호한 질문도 똑똑한 SQL 쿼리로 변환하는 RAG 파이프라인을 구축해봅니다

06 복잡한 보고서 PPT Q&A
학습 내용 및 ︎기대효과

· 많은 기업에서 보고서, 제안서를 PPT로 작성하지만, 많은 정보가 함축적으로 담겨 있어, 일반적인 파싱 기반의 RAG 파이프라인 구축이 어렵습니다.
· 본 섹션에서는 VLM 기반의 End-to-End 멀티모달 인덱싱을 통해 어려운 장표를 이해하는 RAG 파이프라인을 구축해봅니다.

상황 별로 가져다 쓸 수 있는
실습 강의로 RAG 설계 능력을 다지세요.

04. Final Project

멀티모달 RAG를 반영한 LLM 웹앱
풀스택 프로젝트

사람처럼 그림도 해석하고 추론도 가능한
RAG 웹앱 프로젝트까지 마스터하세요.

이 3가지 기능이
파이널 프로젝트 안에 모두 다!

Point 1
간단한 이미지부터 복합적인 이미지들까지 모두 처리 가능한 멀티모달 RAG 구축


복잡한 문서 파싱의 문제점

문서의 모든 정보를 추출하기 위해서는 표/차트 인식 모듈, 텍스트 추출을 위한 OCR 모듈, 이를 마크다운화하기 위한 코드 등 매우 복잡하고 번거로운 작업이 필요 합니다. 파싱 라이브러리를 사용하더라도 복잡한 표나 도식화된 텍스트 구조는 LLM이 이해하기 어려워, RAG에 부적합한 데이터가 생성됩니다.


여러 정보를 상세한 텍스트로 쉽게 변환 가능한 파싱

멀티모달 LLM(VLM)을 활용하면, 표, 텍스트, 이미지, 차트 등 정보의 형태와 상관없이 시각 정보를 텍스트 정보로 한번에 변환할 수 있습니다. 프롬프트 엔지니어링을 통해, 사람이 이해하듯이 생성한 텍스트로 Full-text RAG 파이프라인을 쉽게 구축할 수 있습니다.

Point 2
웹검색에 추론모델을 덧붙인 딥시크 수준의 RAG 성능 고도화 : *Search-o1 논문의 아키텍처 구현


웹검색에서만 답변을 도출하는 RAG

일반 웹검색 RAG에서는 사용자의 질문을 단순 웹검색 쿼리로 변환 후 검색을 진행합니다. 이 과정에서, 복잡한 질문에 대한 인터넷 문서를 찾지 못하거나,
논리적이지 않은 답변이 생성될 수 있습니다.


웹검색에 추론모델을 더한 RAG

추론 모델은 사람처럼 주어진 문제를 해결하기 위한 단계적 추론을 거칩니다. 이러한 장점을 활용해, 추론 과정에서 웹 검색이 필요할 때마다 검색을 수행하여 복잡한 질문도 대답할 수 있는 웹 검색 RAG를 구축해봅니다.

Point 3
AI 툴을 활용하여 실제 사용할 수 있는 UI까지 제작하기


OpenWebUI를 활용한 AI 챗봇 UI 개발

구현 기능
프론트엔드 코드를 작성해주는 AI 툴인 OpenWebUI을 활용하여 ChatGPT 같은 답변 스트리밍 챗봇 기능과 웹검색+추론을 활성화하는 기능을 개발합니다.

| 활용되는 Stack

| 단계별 구현 과정

ImageSlide
ImageSlide
ImageSlide
ImageSlide
ImageSlide

완성형으로 단계를 밟아가며,
실제 상품 수준의 풀스택 앱개발을 경험하세요.


90% 이상의 실습 과정에 Ollama 기반의 오픈소스 LLM 실습 포함!
실습에 큰 돈 들이지 말고 학습하세요!

05. 아키텍쳐 설계

RAG 트렌드와 방향성에 따른
7가지 아키텍처까지

결국 내가 원하는 성능의 LLM 앱을 만들려면 복잡한 아키텍처 설계 능력이 중요해요.
RAG와 Agent 아키텍처들와 특징을 다양하게 보며 선택 능력을 기르세요.

떠오르는 트렌드, KAG, CAG

ImageSlide <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     KAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     지식 그래프의 논리 추론과 벡터 검색을 결합해 Logical Form으로 제어하는 전문 도메인 지식 증강 프레임워크입니다.  </span>

KAG
지식 그래프의 논리 추론과 벡터 검색을 결합해 Logical Form으로 제어하는 전문 도메인 지식 증강 프레임워크입니다.
KAG의 특징
· 기본 RAG의 단점인 청크 간 의미 관계를 Graph로 보완합니다.
· 복잡한 질문도 더 작은 하위 작업으로 나누어 제대로 답변합니다.
· 도메인 지식을 더 잘 인덱싱하기 때문에 전문 영역 RAG에 적합합니다.
ImageSlide <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     CAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     외부 지식을 미리 모델에 로드해 사전 계산된 캐시를 활용함으로써 retrieval 없이 빠르고 정확한 답변을 생성하는 기법입니다. </span>

CAG
외부 지식을 미리 모델에 로드해 사전 계산된 캐시를 활용함으로써 retrieval 없이 빠르고 정확한 답변을 생성하는 기법입니다.
KAG의 특징
· 문서를 청크 단위로 쪼개지 않고 전부 LLM에게 전달하기 때문에 답변 품질이 더 뛰어납니다.
· 질문이 바뀔 때마다 실시간 검색을 하는 기존 RAG 대비 답변 시간이 빠릅니다.

RAG를 보완하는 ModularRAG, Agentic RAG, Graph RAG

ImageSlide <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     Modular RAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     RAG 파이프라인의 A-Z를 모듈별로 최적화하는 개념입니다. </span>

Modular RAG
RAG 파이프라인의 A-Z를 모듈별로 최적화하는 개념입니다.

Modular RAG의 특징
· 성능이 부족한 모듈만 따로 최적화하여 맞춤형 RAG 제작이 용이합니다.
· 모듈별로 작업을 수행할 수 있기 때문에, 유지보수가 용이합니다.
· 질문, 벡터DB, 검색 성능 등 모든 영역을 사용자의 도메인 맞춤형으로 조정가능합니다.
ImageSlide <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     Agentic RAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     RAG 파이프라인에 LLM의 지능을 결합해, 더 유연하고 확장성 높은 에이전트 시스템을 구현하는 방식입니다. </span>

Agentic RAG
RAG 파이프라인에 LLM의 지능을 결합해, 더 유연하고 확장성 높은 에이전트 시스템을 구현하는 방식입니다.

Agentic RAG의 특징
· 일방향적인 기존 RAG 대비 더 다양한 상황에 유연하게 대처 가능합니다.
· 벡터DB 외의 도구를 하나의 시스템에 통합할 수 있습니다.
· 기존 RAG에서 불가능한 방법을 LLM 결합으로 쉽게 구축할 수 있습니다.
ImageSlide <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     Graph RAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     외부 지식에서 개체를 추출하고, 개체 간의 관계를 그래프로 형성하여 이를 LLM 답변에 활용합니다. </span>

Graph RAG
외부 지식에서 개체를 추출하고, 개체 간의 관계를 그래프로 형성하여 이를 LLM 답변에 활용합니다.

Graph RAG의 특징
· 단순 벡터 유사도만으로 추출하기 어려운 수치적/논리적 질문에 정확히 답변합니다.
· 수학/과학적 인과 관계나 상관관계가 중요한 영역에서 좋은 성능을 발휘합니다.
· 문서 특정 부분이 아닌 전체에서 포괄적 이해가 필요한 질문에 답변할 수 있습니다.

RAG의 확장판, Reasoning RAG, Multimodal RAG

ImageSlide <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     Reasoning RAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     사용자의 질문에 CoT 추론을 기반으로 논리적인 계획을 구성하고, 검색이 필요한 경우 RAG를 활용하는 방법입니다. </span>

Reasoning RAG
사용자의 질문에 CoT 추론을 기반으로 논리적인 계획을 구성하고, 검색이 필요한 경우 RAG를 활용하는 방법입니다.

Reasoning RAG의 특징
· Case별로 Flow를 구성해야하는 Agentic RAG 대비, 추론 모델의 Reasoning 능력으로 더 유연한 답변이 가능합니다.
· 복잡한 사용자의 질문에 답변하기 위해 CoT로 차근차근 해결합니다.
· 추론 과정에서 필요한 정보를 실시간으로 검색하고, 정보가 더 필요한 경우 자율적으로 탐색하여 완전한 답변을 생성합니다.
ImageSlide  <hr style="border: none; margin: 6px 0; /* 위아래 여백*/">  <span style="color: #FF5C16; font-size:20px; font-weight: 700; ">     Multimodal RAG<br> </span>   <span style="color: #222222; font-size:14px; font-weight: 500; ">     멀티모달 모델을 통해 텍스트뿐만 아니라 표/차트/이미지와 같이 시각적 정보까지 인덱싱하고 답변에 활용합니다. </span>

Multimodal RAG
멀티모달 모델을 통해 텍스트뿐만 아니라 표/차트/이미지와 같이 시각적 정보까지 인덱싱하고 답변에 활용합니다.

Multimodal RAG의 특징
· 문서 인덱싱 단계에서 텍스트 추출만으로 정보가 충분히 모이지 않는 경우에 멀티모달 인덱싱으로 풍부하게 만들 수 있습니다.
· PPT 보고서와 같이 도식화가 포함된 경우도 VLM을 통해 텍스트 정보로 변환하고 활용할 수 있습니다.

06. 부가 혜택 모음

케인이 한땀한땀 준비한
혜택 모음집을 살펴보세요!

사전 지식 없이도
편하게 실습하고 학습하세요.

오직 패스트캠퍼스 수강생을 위한
오픈 커뮤니티 질의응답까지

강사님 답변 기간 : 2025.03.30 ~ 2027.02.23
* 강사님이 현업 중 답변 하시기에 답변까지 영업일 기준 7일 내외 시간이 소요될 수 있습니다.
* 강의와 무관한 질문에 대해서는 답변이 필수로 제공되지 않습니다.

한 번의 구매로 평생 소장!
언제든, 몇 번이든 다시!

한 번 결제로 평생 동안 무제한 반복 학습이 가능합니다.
바쁜 일정에 걱정할 필요 없이, 원하는 때에 학습하고 필요할 때마다 복습하세요.

사전예약자들의 질문을 모은 QnA

Question 1
LLM, RAG 사전 지식이 없어도
파이썬만 할 줄 알면 들을 수 있는 강의일까요?
LLM에 대한 사전지식이 없어도,
기본적인 파이썬 프로그래밍이 가능한 사람이라면 이해할 수 있는 강의입니다.
파이썬 문법이 부족하시다면
부록 강의로도 파이썬 문법에 대한 기초를 채우실 수 있게끔 구성했습니다.
langgraph 기초 및 RAG 파이프라인부터 탄탄히,
실무 수준의 정말 유용한 agent 기반 RAG까지 알려드리도록 하겠습니다.

Question 2
사전 예약자 27%가 말한
실전 RAG에서 가장 어려운 점인 아키텍처 설계,
어떻게 배우나요?
로컬에서 다양한 사항에 답변하는 RAG 설계 능력을 키우기 위해
다양한 RAG 구축 프로젝트 케이스 6가지를 직접 실습하고
RAG 트렌드와 방향성에 따른 7가지 아키텍처까지 학습합니다.
끝으로 딥시크와 같은 추론 모델 기반의 RAG(Reasoning augmented generation)와
오픈소스 VLM 기반 문서 전처리로 도식화된 그림도 이해하는 멀티모달 RAG 앱개발 및
본 LLM의 프론트까지 구현하는 파이널 프로젝트로 강의를 마무리합니다.

Question 3
강의를 수강한 후에 어떤 내용을 학습할 수 있나요?
Langgraph로 업데이트된 최신 RAG 파이프라인으로 RAG 기초를 완성합니다.
실무에서 마주칠만한 이슈들을 해결하는데 참고할 수 있는 내용들을 배울 수 있습니다. 어떤 RAG 아키텍처가 내게 필요한지 알고 요구사항에 맞는 RAG를 찾을 수 있습니다. 최신 트렌드를 반영한 AI/LLM 관련 정보를 습득할 수 있습니다.

Question 4
어떤 기술스택들이 활용되나요?
Python 3.10 이상,
LlamaIndex 및 Langchain, LangGraph latest ver.
Docling, DocLayOut-Yolo 등 파싱 라이브러리,
GPT-4o, Qwens 2.5VL,
LLM 풀스택 개발을 위한 Qdrant,OpenWebUI, Misty, AnythingLLM,
배포를 위한 Docker