知识库对话效果
知识库是用来管理你的 私有知识 的容器,可将自有的知识内容上传到知识库中,LinkAI将会自动解析你的文档,提供给AI“训练”。面对用户提问时,根据问题检索语义相似的知识库语料,然后把问题及匹配的语料提供给大模型,由大模型结合检索到的知识库语料以及应用设定(系统提示词)来做出回复。
如果上传知识库并测试问答之后,觉得并没有结合知识库内容回答或回答效果不好,请参考以下步骤进行问题排查和优化:
1. 确定应用类型及绑定知识库
1.1 使用知识库应用

LinkAI平台上的应用分为轻量应用和知识应用,使用知识库的前提是需要创建知识应用。如果创建的是轻量应用,可以按照下图指示,升级为知识应用。

1.2 绑定知识库
如果已是知识应用,进入应用配置界面,确认绑定了相关的知识库。知识库只有在应用或工作流中进行使用才能发挥作用。

2. 查看使用记录
在使用知识应用 或 使用工作流(内含应用节点或知识库节点)对话时,每次对话都可在我的账户页面 查看使用记录详情。

在使用记录详情中,除了本次对话的请求(提问)、结果(回复),还可以查看本次对话的提问命中了哪些 知识库语料 。
如未命中,则代表本次对话未检索到符合要求的知识库内容;如命中,可查看命中的语料是否符合预期(即是否和问题相关,是否是自己上传的知识库中应该用于回答该问题的相关内容)。
在使用详情中可直接点击【查看详情】一键跳转至知识库中查看该条语料,并进行编辑修改。

注意:如果分别在渠道端(如企业微信)和网页端对话测试时,回复效果有明显差异时,可以检查:
在 客户端配置 - 对话应用 处(或 使用记录 - 应用名称 处)检查渠道端所配置的应用/工作流,是否与网页端所测试的应用/工作流一致。
在一致的前提下,需检查「使用记录」中两个渠道的上下文记忆情况是否一致。
上下文记忆会影响回复的效果,例如,第一次回答的结论是错误的,修改对应知识库后,再次询问相同问题,会受第一次错误回答的记忆所影响,仍然回复相同的错误答案:
在修改知识库语料或应用设定的前后进行测试时,需确保已经清空记忆,才能得到最准确的效果。网页端调试可点击输入框的“垃圾桶”图标来清空上下文记忆,渠道端则需间隔一段时间(停止对话时长超过应用配置中设置的记忆保留时长)待记忆自动失效后再测试。
3. 检索测试
在第2步中,通过查看使用记录详情,确定了这次提问命中的知识库内容有哪些,如过并未命中我们预期的、可用于回复问题的知识库内容,可进一步使用知识库的检索测试功能来排查:
3.1 检索测试结果
在 知识库-检索测试 功能中,可模拟用户来提问进行检索,预览与问题关联度最高的十条知识库语料。

检索方式 选择应用配置中知识库检索策略部分所设置的检索方式,然后把问题复制粘贴到测试文本框内,点击检索。
检索结果会按照与问题的相关性展示语义检索结果(左)和全文检索结果(右,如使用增强检索则有):
语义检索结果是根据问题和知识库语料的语义相似度(通过向量算法评估)来排序;
全文检索即关键词检索,是根据用户问题中的关键词与知识库内容中的关键词匹配程度进行排序。
在使用全文关键词检索时,系统会将用户的问题根据常用语义拆分成若干个关建词组,然后在知识库中检索包含这些关键词组的知识库语料。这种方法对于知识库内容和用户问题中包含姓名、字母、数字、代号(如产品型号)等内容的情形检索效果更好。当仅使用语义检索的效果不够理想时,尝尝推荐使用增强检索(即语义检索+全文检索的模式)来提升整体检索效果。
进行检索测试后,如发现预期应该检索到的知识库内容,在检索测试结果中排序比较低(即相似度较低),那么应用配置-知识库检索策略配置中的语义检索相似度阈值需要适当调低,可参考3.2进行修改
如果你导入的知识库内容是问答(即Q&A)格式,且检索测试结果中预期的语料语义相似度较低,则需检查在导入时是否设置为了“同时检索问题和答案”,如是,则语义相似度是将问题和答案内容打包进行评估计算的。

3.2 知识库配置
知识库检索测试的结果如何被使用,取决于我们在应用配置-知识库检索策略配置中设置的:检索方式、语义相似度阈值、检索条数(语义检索条数、全文检索条数)等。

以上图配置为例:
- 单次检索条数含义是每次提问会把检索测试结果中的4条语料(例如语义检索前3条+全文关键词检索1条)提供给AI大模型生成最终回复;
- 语义相似度阈值含义是检索测试结果中语义相似度高于0.78的语料才会提供给AI大模型。
- 语义检索的相似度阈值、语义检索的条数、全文检索的条数上限,均可自主配置,如下图:
知识库检索策略配置可参考《知识库章节》中第5部分「使用并配置知识库检索策略」的解释。
通过检索测试结果,我们可以清晰地知道当一个用户提问时,哪些知识库内容会被检索到,并发给AI大模型来生成回复。针对不同的情况可调整对应的参数进行优化,例如:
- 如果检索测试时,语义检索结果中知识库语料的相似度都普遍偏低,我们可以降低知识库检索策略配置中的语义相似度阈值;反之,则调高。
- 如果知识库语料彼此之间相似度差别比较大,我们可以降低检索条数,避免检索到和问题关系不大的知识库语料】,同时降低token消耗;反之,如果知识库中对于同一个问题有很多相关的语料,且相似度较近,我们要适当提高检索条数,以保证回答问题所需语料的完整性。
- 同时,根据场景善用增强检索模式,通过全文关键词匹配来提升知识库检索效果。
4. 模型配置
最后,知识库检索结果达到较理想水平时,我们还需要关注AI模型的情况。LinkAI支持用户一键切换不同的大语言模型,需要说明的是,不同模型的能力表现往往不一样。一般来说,模型的参数越大,理解应用设定(提示词)及推理的能力越强,但输出速度越慢。例如,LinkAI系列模型中LinkAI-4o-mini、LinkAI-4o的模型参数依次提升,推理能力依次提升,但响应速度递减,成本递增。
简单来说:在不考虑复杂问题响应速度的前提下,越贵的模型往往效果越好。你可以根据不同使用场景下不同模型的表现效果测试,结合成本的考虑,选择合适的模型。

4.1 模型
不同的模型对应用设定遵循的程度不一样,回复效果可能也差别很大,可以多测试对比,目前一般推荐LinkAI-4o-mini
模型,性能接近LinkAI-4o
且单价不到LinkAI-3.5-Turbo
的一半,是目前最具性价比的模型之一。如果你的场景较为复杂(例如应用设定较为个性化,对智能体回复效果的要求较高),建议使用更强大的模型,例如LinkAI-4o
、Claude3.5 Sonnet
、DeepSeek V3
等。
4.2 温度
温度越高回复越具有创意和不确定性,越低越具有严谨性。在知识库问答场景,一般要求回复要尽可能准确,建议取值在0~0.2之间。
4.3 应用设定
应用设定非常重要。针对知识库问答场景,通过应用设定我们可以进一步控制大模型如何回复,例如:
场景1:我们希望大模尽可能遵循知识库来回复,知识库中没有提供答案的问题不随意回复,则可以在应用设定中这么写(示例,仅供参考):
## 你的角色
你是xxxx,你的任务是根据提供的知识库内容回复用户的问题,注意回答要准确,易读。
## 注意
- 严格根据提供的知识库信息回答问题,如提供的知识库信息无法回答用户的问题(或没有提供知识库信息),请告知用户联系人工客服。场景2:检索到的知识库信息可能与用户的问题并不相关,我们希望 AI 先进行判断再决策是否要参考这些信息,则可以在应用设定中这么写(示例,仅供参考):
## 你的角色
你是xxxx,你的任务是根据提供的知识库内容回复用户的问题,注意回答要准确,易读。
## 注意
- 可能会提供给你一条或多条知识库信息,你需要先判断其是否和用户的问题相关,如相关即可基于知识库内容进行回复;如不相关则不能参考知识库信息。场景3:用户提问比较模糊,可能与知识库中多个内容相关,我们希望 AI 先进一步确认用户的具体问题再回复,则可以在应用设定中这么写(示例,仅供参考):
## 你的角色
你是xxxx,你的任务是根据提供的知识库内容回复用户的问题,注意回答要准确,易读。
## 注意
- 必须确认用户的问题是清晰、明确的;如果用户的问题不够清晰明确(例如提供给你的知识库信息中有多个疑似与用户问题相关的内容,但无法确认应该根据哪个内容回复),则追问用户,委婉地请用户明确自己的问题(需要你基于提供给你的知识库信息,结合用户的问题,生成2~3个可能代表用户提问意图的问题,请用户确认具体是询问其中哪个问题)。场景4:知识库中存在文件、图片或视频的 URL 链接,如需大模型将素材直接发出,则可以在应用设定中这么写:
## 你的角色
你是xxxx,你的任务是根据提供的知识库内容回复用户的问题,注意回答要准确,易读。
## 注意
- 请把提供的知识库信息中的图片/视频/文件链接直接发送出来,不要省略也不要改写。
如果你有其他的要求,可以将你的需求通过自然语言描述的方式直接写在应用设定里,AI会理解并遵循你的要求进行回复。需要知悉的是:
- 大模型不知道你或者用户所在的国家、地区、时区、当地时间、用户昵称(如有),这类信息AI并不掌握,所以与此相关的应用设定提示词并没有效果。
- 同时,AI大模型并不能直接访问互联网,即AI并不了解网络上的实时信息,如果需要AI访问互联网搜索信息,写在应用设定中也是没有效果的,需要开启插件中联网搜索相关的插件来实现。
- 最后,AI大模型对应用设定提示词的遵循能力有强有弱,总体上无法做到100%遵循应用设定,我们只能一定程度上通过应用设定提示词来部分优化AI的回复效果。