한국형 딥시크 개발자가 알려주는 LLM의 모든 것 : 데이터생성부터 RAG 파인튜닝, 성능 최적화까지

한국형 딥시크 개발자가 알려주는 LLM의 모든 것 : 데이터생성부터 RAG 파인튜닝, 성능 최적화까지

정가~~570,000원~~

할인 금액(-55%) 316,000원

현재 판매가254,000원

월 21,167원

* 12개월 무이자 할부 시

바로 구매하기

LLM, 파인튜닝, 데이터생성, RAG, 성능 최적화, 딥시크, LLM 활용, LLM 개발, GPT-4o급, LLM 파이프라인, 성능 개선, Supervised Fine-Tuning, Direct Policy Optimization, Router 모델, Ko-R1, LLM 트렌드

이제 어려움은 끝!
LLM 활용의 모든 것을 담았습니다.
핵심 개념 부터 실제 어려움을 겪는 포인트까지 한 번에!

따로 따로 배워야했던
데이터 생성, 구조화, RAG, 파인튜닝, 일관성 유지, 성능 최적화 라우터까지
한 곳에 모은 LLM 올.인.원. 강의

강의 핵심 POINT

핵심 이론부터 프로젝트·논문리뷰까지!
LLM 활용의 모든 것

개념 및 이론
LLM 문제를 정확히 정의하기 위해
꼭 필요한 개념을 먼저 짚습니다.

LLM에서 반복적으로 발생하는 오류·품질 문제를 해결하기 위해 필수적인 LLM 기본 개념, 학습 구조, 데이터 설계 원리를 먼저 이해합니다. “왜 모델이 틀리는가?”를 구조적으로 해석하는 능력을 갖추는 단계입니다.

프로젝트
데이터 생성 & 구조화 & 파인튜닝 & 최적화까지!
핵심 Point 기반 4개 프로젝트

Text-to-JSON, RAG, 대화 일관성, Router/효율화 등 현업에서 가장 막히는 문제들을 그대로 가져와 프로젝트로 해결합니다. 데이터 생성 → 벤치마크 → 학습 → 평가 → 개선까지 전 과정을 직접 경험합니다.

논문 리뷰
LLM 흐름을 실무 관점에서 해석하며
직접 적용할 인사이트를 얻습니다.

각 프로젝트와 직접 연결되는 핵심 논문을 선정하여 리뷰합니다. 복잡한 수식을 넘어서 “이 기술이 실제로 무엇을 해결하는가?”에 집중하며, 모델 개선의 근거와 방향성을 스스로 판단할 수 있도록 훈련합니다.

업데이트 및 Q&A
새롭게 등장하는 LLM 트렌드를 업데이트하고
강사님에게 직접 궁금한 것을 물어봅니다.

Router, Reward Model, 실무 효율화 전략 등 커리큘럼 흐름과 맞물린 최신 논문 리뷰를 업데이트 합니다. 또한 궁금한 것을 강사님에게 직접 물어보는 Q&A를 진행합니다.

*추가로 업데이트 되는 논문은 26년 6월까지, 총 2번 진행됩니다.
*Q&A는 패스트캠퍼스 커뮤니티에서 진행됩니다 (~28.12.21)

프로젝트

데이터 생성 & 구조화 & 파인튜닝 & 최적화까지! 
핵심 기술을 모두 짚는 4가지 프로젝트

핵심 기술을 바탕으로 한 4개 프로젝트 를 소개합니다

프로젝트01

MCP 활용 & 구조화 안정성을 위한 LLM 학습 파이프라인 구축

개념 학습
LLM 구조화 출력 안정화와 검증·개선 방법을 이해합니다.

프로젝트 실습
Text-to-JSON (구조화 안정화 + 학습 파이프라인)

| SPECIAL 학습 포인트
· Text-to-JSON 문제 유형 정의 및 데이터 수집
· 합성 데이터 생성 (Json↔Prompt 양방향)
· Benchmark·평가 구조 설계 및 Baseline 측정
· SFT 기반 구조화 생성 모델 학습
· Validator 기반 RL 학습으로 구조 안정성 개선

| 프로젝트 결과물
· Text-to-JSON Synthetic 데이터셋
· Validator 기반 구조화 품질 검증 코드
· 나만의 Benchmark & 평가 스크립트(Json Content Validator 포함)
· Hallucination 억제된 JSON 생성 LLM 파이프라인 완성

프로젝트02

RAG 성능 극대화 및 개선을 위한 파인튜닝

개념 학습
RAG 오류 진단과 다양한 파인튜닝 방법, 개선 원리를 이해합니다.

프로젝트 실습
RAG 모델 평가 → 분석 → 파인튜닝 개선

| SPECIAL 학습 포인트
· Positive/Negative 데이터 구축
· Benchmark 설계 & 지표 기반 평가
· SFT → ORPO를 통한 검색·생성 일관성 개선
· RAG의 품질 저하 원인을 진단하고 실험으로 개선하는 역량 강화

| 프로젝트 결과물
· RAG용 데이터셋
· RAG Benchmark 데이터 및 평가 코드
· SFT 기반 RAG 개선 모델
· ORPO 적용한 RAG 개선 모델
· RAG 품질 향상 실험 리포트

프로젝트03

실제 제품 환경과 같은 일관성을 위한 성능 평가·검증

개념 학습
대화 데이터 생성과 일관성 유지 방식을 이해합니다.

프로젝트 실습
서비스 수준의 Persona Chatbot 구축을 위한 데이터 생성 및 정제 · 평가

| SPECIAL 학습 포인트
· 페르소나가 필요한 대화 시나리오 정의
· 합성 페르소나 데이터 단계별 생성
· 멀티턴 대화 구조를 반영한 학습 데이터 구성
· SFT 기반 멀티턴 대화 모델 학습·평가
· LLM-Judge를 활용한 응답 품질 평가 체계 구성

| 프로젝트 결과물
· 페르소나 시드 데이터셋
· Synthetic Persona & Multi-turn 대화 데이터 (대화 증강 포함)
· SFT 기반 Persona 챗봇 모델
· LLM-Judge 평가 시스템 (응답 품질 평가 자동화, 점수화 가능)
· 최종 Multi-turn Persona 챗봇 프로토타입

프로젝트04

효율적인 LLM 운영을 위한 Router 기반 성능·비용 최적화

개념 학습
모델 라우팅 전략과 보상 기반 개선 방식을 이해합니다.

프로젝트 실습
Router를 활용한 효율적 모델 서빙

| SPECIAL 학습 포인트
· Router 적용이 필요한 문제 유형 식별
· Word Embedding 기반 입력 표현 구성
· TF-IDF / Word2Vec 기반 Router 구성 방식 비교
· LLM 기반 Router 전략 적용

| 프로젝트 결과물
· 페르소나 시드 데이터셋
· 입력 조건에 따라 모델을 분기하는 Router 설계 구조
· Router 성능을 판단하기 위한 평가 기준 및 지표 정의
· 비용 대비 성능을 최적화한 LLM 서빙 전략

커리큘럼

개념부터 구조, 학습과 평가까지
차근차근 배우는 LLM 활용의 흐름

LLM을 어디서부터 어떻게 다뤄야 하는지” 전체 지도를 먼저 그립니다.
전체 LLM 파이프라인 짚고 가기 : 구조화

파인튜닝은 해도 RAG 성능이 오르지 않던 이유를 단계별로 이해합니다.
성능 개선을 위한 단계 이해하기 : 다양한 파인튜닝

일관성은 모델 문제가 아니라 데이터와 평가 문제임을 짚고갑니다.
LLM의 일관성 유지하기 : 데이터 생성 및 증강

더 큰 모델이 아니라, 더 잘 고른 모델로 성능을 만듭니다.
성능만이 아니라, 효율까지 고려하는 LLM 운영 : 비용 절감

처음 부터 시작해도 가능할 수 있도록!

강사님

국내 최초 한국형 딥시크 모델 개발자 LLM 찐 전문가 손규진 강사님

손규진 강사님
LLM 활용의 모든 것을 알려줄 손규진 입니다.

· 현) 現 OneLineAI, CDO
 · 현) 모두의연구소 HAERAE LAB, 공동 랩장
· 현) 연세대학교, 해례(KMMLU, HAERAE Bench) 팀 리드
· 전) Qraft Technologies Financial NLP Researcher
· 전) FuturePlay Data Analyst

[연구]
· [ACL 2025 (Main)] Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning
· [ACL 2025 (Industry)] Won: Establishing Best Practices for Korean Financial NLP
· [ICLR 2025] On the Robustness of Reward Models for Language Model Alignment
· [NAACL 2025 (Main)] KMMLU: Measuring Massive Multitask Language Understanding in Korean
· [NAACL 2025 (Main)]The BIGGEN BENCH: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models
· [ACL 2024 (Main)] Multi-Task Inference: Can Large Language Models Follow Multiple Instructions at Once?

[강연]
· [모두팝] R1 파헤치기, Ko-R1 개발기
· [모두팝] 한국어 언어모델 "잘" 평가하기
· [모두콘2023] 언어 모델은 어떻게 평가해야 할까?

LLM 모델을 실무에서 직접 다뤄보고 국내 최초로 GPT-4o급 성능 에 근접한 전문가

안녕하세요, OneLineAI에서 인공지능 연구를 하고 있는 손규진입니다.
LLM을 학습하는 과정은 데이터 생성, 파라미터 튜닝, 모델 학습과 평가에 이르기까지 전 과정에서 많은 자원(GPU, API 비용 등)을 필요로 합니다. 또한 긴 시간에 걸쳐 진행되다 보니 실수가 발생하기 쉽고, 내가 올바른 방향으로 가고 있는지에 대한 의구심이 들기도 합니다.

이번 강의에서는 실무에서 자주 활용되는 세 가지 핵심 태스크인 구조화된 생성(LLM to JSON), 멀티턴 채팅, Retrieval-Augmented Generation을 중심으로 데이터 수집부터 모델 학습 및 평가까지의 전 과정을 함께 다룹니다. 수강생 여러분이 다양한 학습 파이프라인을 직접 살펴보고 따라 해볼 수 있도록 구성하였습니다. 여러 적용 사례를 통해 LLM 학습 과정을 경험하며, 이후 새로운 태스크에도 확장 적용할 수 있는 ‘LLM을 효과적으로 학습하는 방법’을 익히시길 바랍니다.

ㅣ LLM의 실무 전문가 손규진님의 다양한 강연 활동

2025 [모두팝] R1 파헤치기, Ko-R1 개발기

2024 [모두팝] 한국어 언어모델 "잘" 평가하기

2025 [판교 일할맛] 6월 파인튜닝, 12월 AI 흐름 연사님

2025 [패스트캠퍼스 ] LLM 실전 2-DAY 워크숍 : 고성능 & 저비용 LLM 효율 극대화 완성하기 with. Reasoning 강사님

트렌드 이해하기

LLM 트렌드를 한 눈에 정리하는 시간
필수 논문 리뷰 + 다가오는 학습 트렌드 이해하기

언어 모델 연구 마스터, 언어 인공지능 LAB장 손규진 강사님이
LLM / 데이터셋 / 추론 / 파인튜닝 전 영역 을 아우르는 
핵심 논문을 직접 분석합니다.

빠르게 바뀌는 LLM 트렌드에 대비할 수 있도록
새롭게 등장하는 최신 논문 리뷰 영상 업데이트

학습 범위를 넘어서 더 깊이 있는 이해를 원하는 분들을 위해
별도 부록으로 엄선된 추천 논문 2편 리뷰 가 추가 제공됩니다.

*일부 논문은 강의에 필요한 핵심 내용만 발췌해 다룹니다.
*추가로 업데이트 되는 논문은 25년 6월부터 26년 6월까지, 총 2번 진행됩니다.
*추가로 업데이트 되는 논문은 [LLM 모델 개발부터 4개 프로젝트로 완성하는 도메인 특화 파인튜닝 w.추론]에 제공되는 부록과 동일합니다.

수강생들을 위한 보너스 부록 영상

최근 LLM 학습은 단순히 정답 데이터를 많이 쌓는 방식에서 벗어나, 
모델이 환경과 상호작용하며 스스로 개선하는 방향으로 빠르게 확장되고 있습니다.
이 부록 영상에서는 강화학습(RL)이 LLM 학습에서 어떤 역할을 하게 되는지, 
그리고 Environment라는 개념이 왜 중요해지고 있는지를 큰 흐름에서 살펴봅니다.

특별 혜택

본 강의 수강생 분들께만 드리는 혜택!

* 정리본은 강의 전체 오픈 시 Github 형태로 제공됩니다.
* 질의응답은 패스트캠퍼스 커뮤니티에서 진행됩니다. (25.12.22~28.12.21)

한국형 딥시크 개발자가 알려주는 LLM의 모든 것 : 데이터생성부터 RAG 파인튜닝, 성능 최적화까지

정가~~570,000원~~

할인 금액(-55%) 316,000원

현재 판매가254,000원

월 21,167원

* 12개월 무이자 할부 시

바로 구매하기

QUESTION 01

어떤 분들이
수강하시면 좋을까요?

LLM을 공부하고 싶은 누구나
파인튜닝은 해봤지만 성능 개선 방법을 체계적으로 배우고 싶은 사람
최신 논문 기반 튜닝 전략을 실전 프로젝트로 익히고 싶은 분
적은 돈으로 최고의 성능을 보고 싶으신 분

QUESTION 02

학습 비용이
별도로 발생하나요?

클라우드 GPU Runpod 비용 약 10만원 정도가 발생합니다.
데이터는 제공드릴 예정입니다.

QUESTION 03

기술 스택을 알려주세요.

프로그래밍 언어: Python
사용되는 라이브러리: transformer, verl, axolotl, wandb, pandas, datasets
클라우드 GPU: Runpod

* 25년 12월 기준 정보
* 툴이나 프로그램 사용 환경과 버전 업데이트 등에 따라, 강의에서의 UI와 기능과 실제 수강에 차이가 있을 수 있습니다.
* 본 강의는 특정 시점의 학습 흐름과 개념 전달에 중점을 두고 있으며, 버전 업데이트에 따른 내용 수정이나 추가는 별도로 제공되지 않습니다.

Fast Campus