한국형 딥시크 개발자가 알려주는 LLM의 모든 것 : 데이터생성부터 RAG 파인튜닝, 성능 최적화까지
이제 어려움은 끝!
LLM 활용의 모든 것을 담았습니다.
핵심 개념 부터 실제 어려움을 겪는 포인트까지 한 번에!
따로 따로 배워야했던
데이터 생성, 구조화, RAG, 파인튜닝, 일관성 유지, 성능 최적화 라우터까지
한 곳에 모은 LLM 올.인.원. 강의
강의 핵심 POINT
핵심 이론부터 프로젝트·논문리뷰까지!
LLM 활용의 모든 것
LLM 문제를 정확히 정의하기 위해
꼭 필요한 개념을 먼저 짚습니다.
LLM에서 반복적으로 발생하는 오류·품질 문제를 해결하기 위해 필수적인 LLM 기본 개념, 학습 구조, 데이터 설계 원리를 먼저 이해합니다. “왜 모델이 틀리는가?”를 구조적으로 해석하는 능력을 갖추는 단계입니다.
데이터 생성 & 구조화 & 파인튜닝 & 최적화까지!
핵심 Point 기반 4개 프로젝트
Text-to-JSON, RAG, 대화 일관성, Router/효율화 등 현업에서 가장 막히는 문제들을 그대로 가져와 프로젝트로 해결합니다. 데이터 생성 → 벤치마크 → 학습 → 평가 → 개선까지 전 과정을 직접 경험합니다.
LLM 흐름을 실무 관점에서 해석하며
직접 적용할 인사이트를 얻습니다.
각 프로젝트와 직접 연결되는 핵심 논문을 선정하여 리뷰합니다. 복잡한 수식을 넘어서 “이 기술이 실제로 무엇을 해결하는가?”에 집중하며, 모델 개선의 근거와 방향성을 스스로 판단할 수 있도록 훈련합니다.
새롭게 등장하는 LLM 트렌드를 업데이트하고
강사님에게 직접 궁금한 것을 물어봅니다.
Router, Reward Model, 실무 효율화 전략 등 커리큘럼 흐름과 맞물린 최신 논문 리뷰를 업데이트 합니다. 또한 궁금한 것을 강사님에게 직접 물어보는 Q&A를 진행합니다.
*추가로 업데이트 되는 논문은 26년 6월까지, 총 2번 진행됩니다.
*Q&A는 패스트캠퍼스 커뮤니티에서 진행됩니다 (~28.12.21)
프로젝트
데이터 생성 & 구조화 & 파인튜닝 & 최적화까지!
핵심 기술을 모두 짚는 4가지 프로젝트
핵심 기술을 바탕으로 한 4개 프로젝트 를 소개합니다
프로젝트01
MCP 활용 & 구조화 안정성을 위한 LLM 학습 파이프라인 구축
개념 학습
LLM 구조화 출력 안정화와 검증·개선 방법을 이해합니다.
프로젝트 실습
Text-to-JSON (구조화 안정화 + 학습 파이프라인)
· Text-to-JSON 문제 유형 정의 및 데이터 수집
· 합성 데이터 생성 (Json↔Prompt 양방향)
· Benchmark·평가 구조 설계 및 Baseline 측정
· SFT 기반 구조화 생성 모델 학습
· Validator 기반 RL 학습으로 구조 안정성 개선
· Text-to-JSON Synthetic 데이터셋
· Validator 기반 구조화 품질 검증 코드
· 나만의 Benchmark & 평가 스크립트(Json Content Validator 포함)
· Hallucination 억제된 JSON 생성 LLM 파이프라인 완성
프로젝트02
RAG 성능 극대화 및 개선을 위한 파인튜닝
개념 학습
RAG 오류 진단과 다양한 파인튜닝 방법, 개선 원리를 이해합니다.
프로젝트 실습
RAG 모델 평가 → 분석 → 파인튜닝 개선
· Positive/Negative 데이터 구축
· Benchmark 설계 & 지표 기반 평가
· SFT → ORPO를 통한 검색·생성 일관성 개선
· RAG의 품질 저하 원인을 진단하고 실험으로 개선하는 역량 강화
· RAG용 데이터셋
· RAG Benchmark 데이터 및 평가 코드
· SFT 기반 RAG 개선 모델
· ORPO 적용한 RAG 개선 모델
· RAG 품질 향상 실험 리포트
프로젝트03
실제 제품 환경과 같은 일관성을 위한 성능 평가·검증
개념 학습
대화 데이터 생성과 일관성 유지 방식을 이해합니다.
프로젝트 실습
서비스 수준의 Persona Chatbot 구축을 위한 데이터 생성 및 정제 · 평가
· 페르소나가 필요한 대화 시나리오 정의
· 합성 페르소나 데이터 단계별 생성
· 멀티턴 대화 구조를 반영한 학습 데이터 구성
· SFT 기반 멀티턴 대화 모델 학습·평가
· LLM-Judge를 활용한 응답 품질 평가 체계 구성
· 페르소나 시드 데이터셋
· Synthetic Persona & Multi-turn 대화 데이터 (대화 증강 포함)
· SFT 기반 Persona 챗봇 모델
· LLM-Judge 평가 시스템 (응답 품질 평가 자동화, 점수화 가능)
· 최종 Multi-turn Persona 챗봇 프로토타입
프로젝트04
효율적인 LLM 운영을 위한 Router 기반 성능·비용 최적화
개념 학습
모델 라우팅 전략과 보상 기반 개선 방식을 이해합니다.
프로젝트 실습
Router를 활용한 효율적 모델 서빙
· Router 적용이 필요한 문제 유형 식별
· Word Embedding 기반 입력 표현 구성
· TF-IDF / Word2Vec 기반 Router 구성 방식 비교
· LLM 기반 Router 전략 적용
· 페르소나 시드 데이터셋
· 입력 조건에 따라 모델을 분기하는 Router 설계 구조
· Router 성능을 판단하기 위한 평가 기준 및 지표 정의
· 비용 대비 성능을 최적화한 LLM 서빙 전략
커리큘럼
개념부터 구조, 학습과 평가까지
차근차근 배우는 LLM 활용의 흐름
LLM을 어디서부터 어떻게 다뤄야 하는지” 전체 지도를 먼저 그립니다.
전체 LLM 파이프라인 짚고 가기 : 구조화
파인튜닝은 해도 RAG 성능이 오르지 않던 이유를 단계별로 이해합니다.
성능 개선을 위한 단계 이해하기 : 다양한 파인튜닝
일관성은 모델 문제가 아니라 데이터와 평가 문제임을 짚고갑니다.
LLM의 일관성 유지하기 : 데이터 생성 및 증강
더 큰 모델이 아니라, 더 잘 고른 모델로 성능을 만듭니다.
성능만이 아니라, 효율까지 고려하는 LLM 운영 : 비용 절감
처음 부터 시작해도 가능할 수 있도록!
강사님
국내 최초 한국형 딥시크 모델 개발자 LLM 찐 전문가 손규진 강사님
LLM 활용의 모든 것을 알려줄 손규진 입니다.
· 현) 現 OneLineAI, CDO
· 현) 모두의연구소 HAERAE LAB, 공동 랩장
· 현) 연세대학교, 해례(KMMLU, HAERAE Bench) 팀 리드
· 전) Qraft Technologies Financial NLP Researcher
· 전) FuturePlay Data Analyst
[연구]
· [ACL 2025 (Main)] Linguistic Generalizability of Test-Time Scaling in Mathematical Reasoning
· [ACL 2025 (Industry)] Won: Establishing Best Practices for Korean Financial NLP
· [ICLR 2025] On the Robustness of Reward Models for Language Model Alignment
· [NAACL 2025 (Main)] KMMLU: Measuring Massive Multitask Language Understanding in Korean
· [NAACL 2025 (Main)]The BIGGEN BENCH: A Principled Benchmark for Fine-grained Evaluation of Language Models with Language Models
· [ACL 2024 (Main)] Multi-Task Inference: Can Large Language Models Follow Multiple Instructions at Once?
[강연]
· [모두팝] R1 파헤치기, Ko-R1 개발기
· [모두팝] 한국어 언어모델 "잘" 평가하기
· [모두콘2023] 언어 모델은 어떻게 평가해야 할까?
LLM 모델을 실무에서 직접 다뤄보고 국내 최초로
GPT-4o급 성능
에 근접한 전문가
안녕하세요, OneLineAI에서 인공지능 연구를 하고 있는 손규진입니다.
LLM을 학습하는 과정은 데이터 생성, 파라미터 튜닝, 모델 학습과 평가에 이르기까지 전 과정에서 많은 자원(GPU, API 비용 등)을 필요로 합니다. 또한 긴 시간에 걸쳐 진행되다 보니 실수가 발생하기 쉽고, 내가 올바른 방향으로 가고 있는지에 대한 의구심이 들기도 합니다.
이번 강의에서는 실무에서 자주 활용되는 세 가지 핵심 태스크인 구조화된 생성(LLM to JSON), 멀티턴 채팅, Retrieval-Augmented Generation을 중심으로 데이터 수집부터 모델 학습 및 평가까지의 전 과정을 함께 다룹니다. 수강생 여러분이 다양한 학습 파이프라인을 직접 살펴보고 따라 해볼 수 있도록 구성하였습니다. 여러 적용 사례를 통해 LLM 학습 과정을 경험하며, 이후 새로운 태스크에도 확장 적용할 수 있는 ‘LLM을 효과적으로 학습하는 방법’을 익히시길 바랍니다.
ㅣ LLM의 실무 전문가 손규진님의 다양한 강연 활동
트렌드 이해하기
LLM 트렌드를 한 눈에 정리하는 시간
필수 논문 리뷰 + 다가오는 학습 트렌드 이해하기
LLM / 데이터셋 / 추론 / 파인튜닝 전 영역 을 아우르는
핵심 논문을 직접 분석합니다.
빠르게 바뀌는 LLM 트렌드에 대비할 수 있도록
새롭게 등장하는 최신 논문 리뷰 영상 업데이트
학습 범위를 넘어서 더 깊이 있는 이해를 원하는 분들을 위해
별도 부록으로 엄선된 추천 논문 2편 리뷰
가 추가 제공됩니다.
*일부 논문은 강의에 필요한 핵심 내용만 발췌해 다룹니다.
*추가로 업데이트 되는 논문은 25년 6월부터 26년 6월까지, 총 2번 진행됩니다.
*추가로 업데이트 되는 논문은 [LLM 모델 개발부터 4개 프로젝트로 완성하는 도메인 특화 파인튜닝 w.추론]에 제공되는 부록과 동일합니다.
수강생들을 위한 보너스 부록 영상

최근 LLM 학습은 단순히 정답 데이터를 많이 쌓는 방식에서 벗어나,
모델이 환경과 상호작용하며 스스로 개선하는 방향으로 빠르게 확장되고 있습니다.
이 부록 영상에서는 강화학습(RL)이 LLM 학습에서 어떤 역할을 하게 되는지,
그리고 Environment라는 개념이 왜 중요해지고 있는지를 큰 흐름에서 살펴봅니다.
특별 혜택
본 강의 수강생 분들께만 드리는 혜택!
* 정리본은 강의 전체 오픈 시 Github 형태로 제공됩니다.
* 질의응답은 패스트캠퍼스 커뮤니티에서 진행됩니다. (25.12.22~28.12.21)
어떤 분들이
수강하시면 좋을까요?
파인튜닝은 해봤지만 성능 개선 방법을 체계적으로 배우고 싶은 사람
최신 논문 기반 튜닝 전략을 실전 프로젝트로 익히고 싶은 분
적은 돈으로 최고의 성능을 보고 싶으신 분
학습 비용이
별도로 발생하나요?
데이터는 제공드릴 예정입니다.
기술 스택을 알려주세요.
사용되는 라이브러리: transformer, verl, axolotl, wandb, pandas, datasets
클라우드 GPU: Runpod
* 25년 12월 기준 정보
* 툴이나 프로그램 사용 환경과 버전 업데이트 등에 따라, 강의에서의 UI와 기능과 실제 수강에 차이가 있을 수 있습니다.
* 본 강의는 특정 시점의 학습 흐름과 개념 전달에 중점을 두고 있으며, 버전 업데이트에 따른 내용 수정이나 추가는 별도로 제공되지 않습니다.


























![ImageSlide<span style="color:#fff;">2025 [모두팝] R1 파헤치기, Ko-R1 개발기</span>](https://cdn.day1company.io/prod/uploads/202512/171453-1424/강사소개-04.webp)
![ImageSlide<span style="color:#fff;">2024 [모두팝] 한국어 언어모델 "잘" 평가하기</span>](https://cdn.day1company.io/prod/uploads/202512/171456-1424/강사소개-05.webp)
![ImageSlide<span style="color:#fff;">2025 [판교 일할맛] 6월 파인튜닝, 12월 AI 흐름 연사님</span>](https://cdn.day1company.io/prod/uploads/202512/144546-1424/강사소개-6.webp)
![ImageSlide<span style="color:#fff;">2025 [패스트캠퍼스 ] LLM 실전 2-DAY 워크숍 : 고성능 & 저비용 LLM 효율 극대화 완성하기 with. Reasoning 강사님</span>](https://cdn.day1company.io/prod/uploads/202512/144555-1424/강사소개-7.webp)


