上文介绍了我们自己开发的RAG智能客服,本篇聊下RAG中,关于用户输入,模型输出的过程:
1.用户输入
用户提出的任意问题
2.优化问题
这个部分主要对用户输入的问题做优化,优化的过程是,
1)生成相似问题
2)生成子查询
3)生成回退问题
最终结论:由1个问题最后生成4个问题
3.分别向量
这个部分主要将上述的问题,分别向量化,为后面的召回做准备
4.混合检索
将上述所有向量化分别进行做相似检索和原文进行全文检索,查询top_k条数据
5.文本重排
将上述的结果进行文本重排序
6.答案切片
通过上述查询到的结果去关系型数据库中,找到对应的答案数据
7.切片上下文
通过上述找到的答案ID后,再查询当前ID可能包含的上下文答案,比如 文档的结构是:
标题1
-----内容1
当我们查询的是标题1时,根据切片上下文关系,可以查出它的下文,即“内容1”
8.LLM总结
将上述所有的有关联性的切片汇总到一起,由LLM根据问题去总结答案。
结束=====
欢迎大家讨论,有需要试用RAG智能客服,评论“智能客服”获取试用地址