RAG智能客服查询时,我是这样做的

上文介绍了我们自己开发的RAG智能客服,本篇聊下RAG中,关于用户输入,模型输出的过程:

1.用户输入

用户提出的任意问题

2.优化问题

这个部分主要对用户输入的问题做优化,优化的过程是,

1)生成相似问题

2)生成子查询

3)生成回退问题

最终结论:由1个问题最后生成4个问题

3.分别向量

这个部分主要将上述的问题,分别向量化,为后面的召回做准备

4.混合检索

将上述所有向量化分别进行做相似检索和原文进行全文检索,查询top_k条数据

5.文本重排

将上述的结果进行文本重排序

6.答案切片

通过上述查询到的结果去关系型数据库中,找到对应的答案数据

7.切片上下文

通过上述找到的答案ID后,再查询当前ID可能包含的上下文答案,比如 文档的结构是:

标题1

-----内容1

当我们查询的是标题1时,根据切片上下文关系,可以查出它的下文,即“内容1”

8.LLM总结

将上述所有的有关联性的切片汇总到一起,由LLM根据问题去总结答案。

结束=====

欢迎大家讨论,有需要试用RAG智能客服,评论“智能客服”获取试用地址

原文链接:,转发请注明来源!