在讨论 BM25 的原理之前,先理解它在本项目 RAG Pipeline 中存在的必要性。 向量检索(稠密检索)的核心能力是语义匹配——用户说"挂科了怎么办",向量检索能匹配到"课程成绩不及格的处理办法",因为两者在语义空间中距离很近。但向量检索有一个系统性盲区 ...