-
Notifications
You must be signed in to change notification settings - Fork 10
3. 排序模型
LongxingTan edited this page Oct 17, 2024
·
7 revisions
之前介绍的向量模型讲究速度,借助向量与ANN快速从大量候选中筛选出部分文档。那么排序模型讲究的就是精度了,此时候选集已经够少,可以极尽所能的提升精度。排序模型针对query和少量的候选集,输出更优的候选集顺序。
cross-encoder是最常见的排序模型,如果说向量模型是一种query和document迟交互的模型,那cross-encoder就是一种早交互的模型,越早交互,模型就能够越好的融合多个实体的信息。
大模型有着更出色的理解和推理能力,因此也有越来越多的尝试将大模型用于重排。有两种不同的思路,一种是生成式(generative),一种是表征式(representative)。
表格汇总
论文Large Language Models for Information Retrieval: A Survey总结了大模型在排序上的应用
Zero-Shot Listwise Document Reranking with a Large Language Model
RankVicuna: Zero-Shot Listwise Document Reranking with Open-Source Large Language Models
Large Language Models are Effective Text Rankers with Pairwise Ranking Prompting
Few-shot Reranking for Multi-hop QA via Language Model Prompting