- 강의 질문
- AI TECH
passage dependency 필터 적용 의도 확인 요청
QA 클래스의 batch_filter 함수는 True인 row를 남기는 로직입니다. 프롬프트에서 "단락 의존적(passage dependency)입니까?(True/False)"로 물어보기 때문에, 필터 적용 목표인 "단락 독립성(passage independency)"이 없는 값들만 남게 됩니다. 프롬프트를 passage independecy로 고치는 방법 대신 결과를 따로 받아서 사용하고 있습니다.
강의 내 설명에서 필터 passage dependecy의 의도가 단락 독립성(passage independency)을 갖는 row를 남기는 것이 맞을까요? (단락 종속성을 갖는 row 제거)
=== autorag/data/qa/schema.py
def batch_filter(
self, fn: Callable[[Dict, Any], Awaitable[bool]], batch_size: int = 32, **kwargs
) -> "QA":
(생략)
return QA(self.data[masks], self.linked_corpus)
==== 대체 코드
import copy
filtered_qa = copy.deepcopy(first_qa)
filtered_qa.data['has_passage_dependency'] = first_qa.batch_apply(
passage_dependency_filter_llama_index,
llm=llm,
lang="en",
).data