使用PAI LangStudio创建RAG知识库及联网搜索聊天机器人

我们知道PAI还有LangStudio,类似百炼、Coze、Dify的工作流机制。下面我们使用LangStudio来创建知识库和联网搜索聊天机器人。
基于LangStudio&DeepSeek的RAG及联网搜索聊天机器人解决方案
SerpAPI注册
首先,请先去serpapi.com注册账号。
部署LLM和Embedding模型
该步骤可以直接使用Model Gallery部署,请参考自建Dify平台与PAI EAS LLM大模型
LangStudio创建连接
我们首先创建LLM连接和Embedding连接。
然后我们需要配置SerpAPI连接。在服务连接配置 > 自定义连接页签下单击新建连接,创建SerpApi连接。配置前请确保注册并获取的api_key然后复制,同时请确保打勾”私密”再确定。
创建知识库索引
进入LangStudio,选择工作空间后,在知识库页签下创建知识库。需要注意的是,我们建议把数据源OSS路径与输出OSS路径分开,方便之后索引。
同理,创建运行时也用另一个OSS路径。数据库为了快速验证,我选择了FAISS。
然后创建运行时,同理,我们选择另外一个独立路径。上传好文件即可点击更新索引。
创建并运行应用流
进入LangStudio,选择工作空间后,在应用流页签下单击新建应用流,创建基于Web搜索和RAG的聊天助手应用流。这里并没有特别难的点。
不过,我的做法和模板稍微不一样的是,在联网搜索前,放一个大模型来将用户内容总结成一句话再输出给搜索。
无知识库联网搜索
我们先把知识库节点废置(删除节点或下一个节点输入参数和系统提示词都删除对应变量),直接问“请问如何下载Windows 11”看看效果。
从“查看链路”中可以看出,第一个LLM将我的话总结成”如何下载Windows 11”,然后开始联网搜索并返回答案。
知识库+联网搜索
我们重新把删除的变量补充回去,然后问同样的问题。
从图中看,他已经收集到知识库的数据并与联网结果结合。
AI安全护栏
我们其实在AI有Guardrails用于防止提示词攻击、对内容生成和结果进行检测并拦截。原理上大致和内容安全检测一致,如下图。
除了SDK, API方式接入,他同时支持工作流方式接入,大大减少企业开发成本。
阿里云 - Dify平台工作流集成AI安全护栏
最后,我们看几个越狱的例子(现阶段模型已经对该提示词做了预防):
1 | ### DAN测试 |
- 标题: 使用PAI LangStudio创建RAG知识库及联网搜索聊天机器人
- 作者: 暗香疏影
- 创建于 : 2025-07-16 10:00:00
- 更新于 : 2025-07-16 10:00:00
- 链接: https://blog.pptcar.com/2025/07/16/2025-07-16-PAI-LangStudio-RAG-Web/
- 版权声明: 本文章采用 CC BY-NC-SA 4.0 进行许可。