Skip to content

5. RAG应用

LongxingTan edited this page Nov 14, 2024 · 5 revisions

5.1 RAG

RAG主要解决大模型幻觉与知识库频繁更新问题。

5.2 GraphRAG

5.3 Agentic RAG

5.4 多模态RAG

5.4 Router

  • if-else就是一个最基础的router

5.5 其他

  • 文件解析

  • 图表问答

最简单的思路,图片可以caption转化为text.

  • 多轮问答

优化

HyDE 以及 inverted HyDE

  • prompt通过LLM生成答案,检索与生成答案语义相似的文档
  • 对文档chunk通过LLM生成多个可能的问题,检索与prompt类似的生成问题

文档拆分chunk

  • 每个chunk中添加指向其上下文(前后chunk)的引用,确保模型可以理解前后文关系。例如,可以在每个chunk的开头和结尾附加一些上下文内容
  • 使用层级结构来表示文档的逻辑关系。每个chunk可以包含指向父chunk和子chunk的链接,以确保模型可以理解和追踪文档的层级结构和逻辑关系。
  • 构建知识图谱,明确文档内各部分的关联和层次结构

其他优化

  • 输入大模型的retrieval文档顺序