처음에 미세조정할 때 사용할 CoT 데이터셋은 어떻게 만드나요?

강의 질문

AI TECH

처음에 미세조정할 때 사용할 CoT 데이터셋은 어떻게 만드나요?

2025.05.17 10:21 작성

안녕하세요. GRPO 이전에 추론 능력 및 방법 step을 알려주기 위해 SFT를 하려고 하는데, 이를 더 큰 LLM으로 생성할 것 같은데 공식 프롬프트가 있을까요? 쉬운 Task에 대해서는 추론 단계를 작게 가져갈 수 있나요? 즉, 자도응로 난이도에 따라 알아서 CoT 데이터셋 생성이 가능한가요?

아니면 이 부분은 GRPO에서 해결해야 할 부분일까요?

Fast Campus

처음에 미세조정할 때 사용할 CoT 데이터셋은 어떻게 만드나요?

답변

연관 질문

실습 환경 질문드립니다.

COT steering 데이터

root layout

실습 환경 질문드립니다.

COT steering 데이터