当你向 RAG 系统提出一个问题,系统会:
使用 Embedding 模型 将问题转换为向量。
在向量数据库中检索语义相近的文本片段(chunk),完成初步筛选。
然后使用 Reranking 模型 对这些候选 chunk 进行精排,挑选出相关性排名前几的 chunk,作为上下文和用户问题一起组成 prompt,供大模型生成答案。
版权归属:
江南的风
许可协议:
本文使用《署名-非商业性使用-相同方式共享 4.0 国际 (CC BY-NC-SA 4.0)》协议授权
评论区