모두의 AI 케인의 Agent로 완성하는 RAG: 데이터 별 아키텍처 설계를 중심으로
AI Agent 전문가 모두의 AI 케인이
2025년 가장 최신의 사례의 RAG로 다시 찾아왔습니다.
가장 빨리 학습하고 전파하는 얼리어답터
모두의 AI 케인의
랭그래프로 재편된 2025 RAG
안녕하세요. 모두의 AI라는 유튜브를 운영 중이며,
‘이토록 쉬운 RAG 시스템 구축을 위한 랭체인 실전 가이드’ 저자인 케인입니다.
랭체인 공식문서에서 RAG 기초 설명이 랭체인 기반에서
이제는 랭그래프 및 그래프 기반의 설명으로 바뀌며
새로운 RAG 학습의 토대가 만들어졌습니다.
LangGraph 기반 RAG의 시작부터, RAG의 확장가능성 등을
살펴보며 Agent로 완성하는 RAG 로드맵을 이 강의에서 함께
하세요.
실무에서 맞닥뜨릴 수 있는 여러 현실적인 문제와
최신 기술(추론 모델, 에이전틱 워크플로우, 멀티모달 문서 파싱)등에 초점을 맞춰
국내에서 가장 빠르고 알기 쉽게 정리하였습니다.
여러분의 궁금증을 모아 강의를 만들었으니,
이 강의로 고도화된 RAG와 Agent의 정점에 도달하세요.
모두의 AI 유튜브 바로가기 →
케인님의 강의력과 정보력을
1만 구독자가 보증합니다.
*2025년 1월 기준, 유튜브 구독자 수 및 유튜브 댓글을 기반한 내용입니다.
01. 커리큘럼
RAG의 시작부터 가장 핫한 트렌드까지!
20시간으로 끝내는 RAG/Agent 로드맵
-
첫 번째
2025 LLM 동향
LLM의 3가지 발전 방향과
RAG의 대체/보완/확장 방향을 알아봅니다. -
두 번째
RAG의 전반적인 흐름 이해
RAG를 파이프라인에 따라 구축하며 RAG 시스템 구축을 위한 실질적인 기술을 학습합니다.
-
세 번째
단계별 RAG 페인포인트 극복
문서별 인덱싱, 실무에 바로 적용할 수 있는 유용한 내용을 제공합니다
-
네 번째
6개 agent 기반 RAG 실습
문서 포맷과 목적에 최적화된 RAG 아키텍처를 배우고 구축 방법을 실습합니다.
-
다섯 번째
파이널 LLM 풀스택 프로젝트
멀티모달 RAG, Reasoning RAG, UI까지 LLM 풀스택 웹앱을 실습으로 구현합니다.
-
🎉🎉🥳
2025 RAG 시스템
완전 정복!
02. 데이터별 RAG 전처리
사람들이 가장 자주 쓰는
5개 포맷의 문서별 임베딩 방법 총정리
문서 서식에 따라 RAG 전처리의 어려움이 달라져요!
특히 어려운 인덱싱 방법이 어떻게 다른지 알려드려요.
가장 자주 평가하는 5가지 문서별 RAG 전처리 특징을 비교하며,
내 문서의 데이터를 이해하는 RAG를 제작하세요.
PDF 문서에 따른 RAG 인덱싱 특징
· Layout Parsing을 통해 표, 이미지, 차트, 수식 등이 담긴 복잡한 정보를 추출합니다.
· Docling, Megaparser 등 최신 마크다운 변환기를 활용해 실무 활용도를 알아봅니다.
· 표, 이미지, 차트 등은 VLM을 통해 더 정확한 텍스트 정보로 변환합니다.
활용 스택
Docling DocLayout-Yolo GPT-4o Qwen2.5 VL LangChain
PPT 문서에 따른 RAG 인덱싱 특징
· VLM(멀티모달 LLM)을 통해 복잡한 도식화합니다.
· RAG 품질 향상에 효과적인 Contextual Retrieval을 위해 청크에 슬라이드 맥락을 더합니다.
활용 스택
Docling Qwen2.5 VL GPT-4o LangChain
워드 문서에 따른 RAG 인덱싱 특징
· 워드 내 복잡한 표나 2단 형식의 글을 Docling을 통해 올바른 순서와 형식으로 마크 다운 변환합니다.
· 정해진 템플릿 문서는 structured format으로 변환 후 특정 요소만 추출 가능합니다.
활용 스택
Docling LangChain
한글.hwp 문서에 따른 RAG 인덱싱 특징
· hwp 파일은 우리나라에서만 공문서로 활용되는 확장자이므로, 해외 오픈소스 전처리 툴을 활용하기 어렵습니다.
· hwp를 직접 다루기보다는, pdf로 변환하여 텍스트, 표 등의 정보를 추출합니다.
활용 스택
Docling win32gui
각 문서들별로 임베딩 뿐만 아니라
각 데이터 특징별로 RAG 아키텍처도 달라져요.
03. 데이터 별 RAG
6가지 RAG 프로젝트로
데이터 특징 별 알맞은 RAG 선택 및 구축 실습까지
각 데이터 특징별로 RAG 아키텍처도 달라져요.
6개 각기 다른 실무에서 사용하는 데이터에 알맞은 RAG 선택과 구축 방법을 익힙니다.
01
복잡한 논문 Q&A RAG 파이프라인
학습 내용 및 ︎기대효과
· 논문은 텍스트 뿐만 아니라 표, 이미지, 차트 등 다양한 정보를 담고 있기 때문에 파싱에 초점을 두고 파이프라인을 구성합니다.
· PDF 파싱 라이브러리가 표와 텍스트를 마크다운으로 변환하고, VLM으로 차트와 이미지의 캡션을 생성하여 모든 정보를 텍스트화합니다.
02
HWP 파일 RAG 파이프라인
학습 내용 및 ︎기대효과
· 한글 파일의 특성 상 파싱 라이브러리가 많지 않기 때문에, PDF로 변환 후 파싱을 진행합니다.
· Langgraph 기반의 기초적인 RAG 파이프라인을 구축해봅니다.
03
공시 보고서(10-k)/사업 보고서 복잡한 질문 Q&A
학습 내용 및 ︎기대효과
· 공시 보고서는 수치 정보가 많으며, 전문 용어가 섞여 있어 일반적인 RAG로 충분한 답변을 받을 수 없습니다.
· Multi-Query 기반의 RAG 파이프라인을 통해 더 자세하고 정확한 논리적 답변을 이끌어내는 것이 이 섹션의 목표입니다.
04
여러 회의록 Q&A
학습 내용 및 ︎기대효과
· 회의록이라는 정해진 템플릿 하의 정보를 메타데이터화하여 더 정확한 검색을 이끌어냅니다.
· Self query retriever를 통해 회의 날짜, 주제 등을 정확히 인식한 RAG 파이프라인을 구축해봅니다.
05
이커머스 데이터 Text-to-SQL
학습 내용 및 ︎기대효과
· SQL 테이블 데이터의 경우, 일반 RAG 파이프라인이 아닌 Text-to-SQL로 정확한 수치 정보를 추출해야 합니다.
· 이커머스 데이터를 예제로, 모호한 질문도 똑똑한 SQL 쿼리로 변환하는 RAG 파이프라인을 구축해봅니다
06
복잡한 보고서 PPT Q&A
학습 내용 및 ︎기대효과
· 많은 기업에서 보고서, 제안서를 PPT로 작성하지만, 많은 정보가 함축적으로 담겨 있어, 일반적인 파싱 기반의 RAG 파이프라인 구축이 어렵습니다.
· 본 섹션에서는 VLM 기반의 End-to-End 멀티모달 인덱싱을 통해 어려운 장표를 이해하는 RAG 파이프라인을 구축해봅니다.
상황 별로 가져다 쓸 수 있는
실습 강의로 RAG 설계 능력을 다지세요.
04. Final Project
멀티모달 RAG를 반영한 LLM 웹앱
풀스택 프로젝트
사람처럼 그림도 해석하고 추론도 가능한
RAG 웹앱 프로젝트까지 마스터하세요.
이 3가지 기능이
파이널 프로젝트 안에 모두 다!
Point 1
간단한 이미지부터 복합적인 이미지들까지 모두 처리 가능한 멀티모달 RAG 구축
복잡한 문서 파싱의 문제점
문서의 모든 정보를 추출하기 위해서는 표/차트 인식 모듈, 텍스트 추출을 위한 OCR 모듈, 이를 마크다운화하기 위한 코드 등 매우 복잡하고 번거로운 작업이 필요 합니다. 파싱 라이브러리를 사용하더라도 복잡한 표나 도식화된 텍스트 구조는 LLM이 이해하기 어려워, RAG에 부적합한 데이터가 생성됩니다.
여러 정보를 상세한 텍스트로 쉽게 변환 가능한 파싱
멀티모달 LLM(VLM)을 활용하면, 표, 텍스트, 이미지, 차트 등 정보의 형태와 상관없이 시각 정보를 텍스트 정보로 한번에 변환할 수 있습니다. 프롬프트 엔지니어링을 통해, 사람이 이해하듯이 생성한 텍스트로 Full-text RAG 파이프라인을 쉽게 구축할 수 있습니다.
Point 2
웹검색에 추론모델을 덧붙인 딥시크 수준의 RAG 성능 고도화 : *Search-o1 논문의 아키텍처 구현
웹검색에서만 답변을 도출하는 RAG
일반 웹검색 RAG에서는 사용자의 질문을 단순 웹검색 쿼리로 변환 후 검색을 진행합니다. 이 과정에서, 복잡한 질문에 대한 인터넷 문서를 찾지 못하거나,
논리적이지 않은 답변이 생성될 수 있습니다.
웹검색에 추론모델을 더한 RAG
추론 모델은 사람처럼 주어진 문제를 해결하기 위한 단계적 추론을 거칩니다. 이러한 장점을 활용해, 추론 과정에서 웹 검색이 필요할 때마다 검색을 수행하여 복잡한 질문도 대답할 수 있는 웹 검색 RAG를 구축해봅니다.
Point 3
AI 툴을 활용하여 실제 사용할 수 있는 UI까지 제작하기
OpenWebUI를 활용한 AI 챗봇 UI 개발
구현 기능
프론트엔드 코드를 작성해주는 AI 툴인 OpenWebUI을 활용하여 ChatGPT 같은 답변 스트리밍 챗봇 기능과 웹검색+추론을 활성화하는 기능을 개발합니다.
| 활용되는 Stack
| 단계별 구현 과정
완성형으로 단계를 밟아가며,
실제 상품 수준의 풀스택 앱개발을 경험하세요.
90% 이상의 실습 과정에 Ollama 기반의 오픈소스 LLM 실습 포함!
실습에 큰 돈 들이지 말고 학습하세요!
05. 아키텍쳐 설계
RAG 트렌드와 방향성에 따른
7가지 아키텍처까지
결국 내가 원하는 성능의 LLM 앱을 만들려면 복잡한 아키텍처 설계 능력이 중요해요.
RAG와 Agent 아키텍처들와 특징을 다양하게 보며 선택 능력을 기르세요.
떠오르는 트렌드, KAG, CAG
RAG를 보완하는 ModularRAG, Agentic RAG, Graph RAG
RAG의 확장판, Reasoning RAG, Multimodal RAG
06. 부가 혜택 모음
케인이 한땀한땀 준비한
혜택 모음집을 살펴보세요!
사전 지식 없이도
편하게 실습하고 학습하세요.
오직 패스트캠퍼스 수강생을 위한
오픈 커뮤니티 질의응답까지
강사님 답변 기간 : 2025.03.30 ~ 2027.02.23
* 강사님이 현업 중 답변 하시기에 답변까지 영업일 기준 7일 내외 시간이 소요될 수 있습니다.
* 강의와 무관한 질문에 대해서는 답변이 필수로 제공되지 않습니다.
한 번의 구매로 평생 소장!
언제든, 몇 번이든 다시!
한 번 결제로 평생 동안 무제한 반복 학습이 가능합니다.
바쁜 일정에 걱정할 필요 없이, 원하는 때에 학습하고 필요할 때마다 복습하세요.
사전예약자들의 질문을 모은 QnA
LLM, RAG 사전 지식이 없어도
파이썬만 할 줄 알면 들을 수 있는 강의일까요?
기본적인 파이썬 프로그래밍이 가능한 사람이라면 이해할 수 있는 강의입니다.
파이썬 문법이 부족하시다면
부록 강의로도 파이썬 문법에 대한 기초를 채우실 수 있게끔 구성했습니다.
langgraph 기초 및 RAG 파이프라인부터 탄탄히,
실무 수준의 정말 유용한 agent 기반 RAG까지 알려드리도록 하겠습니다.
사전 예약자 27%가 말한
실전 RAG에서 가장 어려운 점인 아키텍처 설계,
어떻게 배우나요?
다양한 RAG 구축 프로젝트 케이스 6가지를 직접 실습하고
RAG 트렌드와 방향성에 따른 7가지 아키텍처까지 학습합니다.
끝으로 딥시크와 같은 추론 모델 기반의 RAG(Reasoning augmented generation)와
오픈소스 VLM 기반 문서 전처리로 도식화된 그림도 이해하는 멀티모달 RAG 앱개발 및
본 LLM의 프론트까지 구현하는 파이널 프로젝트로 강의를 마무리합니다.
강의를 수강한 후에 어떤 내용을 학습할 수 있나요?
실무에서 마주칠만한 이슈들을 해결하는데 참고할 수 있는 내용들을 배울 수 있습니다. 어떤 RAG 아키텍처가 내게 필요한지 알고 요구사항에 맞는 RAG를 찾을 수 있습니다. 최신 트렌드를 반영한 AI/LLM 관련 정보를 습득할 수 있습니다.
어떤 기술스택들이 활용되나요?
LlamaIndex 및 Langchain, LangGraph latest ver.
Docling, DocLayOut-Yolo 등 파싱 라이브러리,
GPT-4o, Qwens 2.5VL,
LLM 풀스택 개발을 위한 Qdrant,OpenWebUI, Misty, AnythingLLM,
배포를 위한 Docker


















