- 강의 질문
- AI TECH
Seed dataset과 Eval dataset의 관계 질문
2025.07.17 20:40 작성
강의 내용 중에 다음 설명들이 조금 충돌하는 것 같은 느낌이 나서 정리를 부탁드립니다.
1. Seed dataset 을 확장하여 eval dataset을 구성한다
2. eval dataset은 완전히 랜덤한것보단 모델에게 기대하는 출력을 반영하여야 한다
3. seed dataset은 다양한 도메인에서 다양한 난이도의 태스크를 포함해야한다.
그럼 seed dataset 또는 eval dataset은 내가 원하는 출력의 경향성을 띄어야 하나요, 아니면 다양해야하나요?
제가 원하는 출력의 방향으로 이끌려면 다양성이 떨어질 것 같은데 어떻게 이해해야 하나요?