Technical Guide
29. 验收与部署
把研究型 Agent 从一次本地演示推进到可长期使用:验收任务、配置安全、日志、回滚和部署边界。
本地跑通不等于完成
终局实战最后一步是验收和部署。
本地能跑,只说明开发链路通了。要长期使用,还要看稳定性、安全和排错能力。
验收任务
准备三个任务:
简单主题:验证基本流程
中等主题:验证搜索、抓取、报告
困难主题:验证不确定性和失败处理
不要只用一个成功样例。
验收清单
至少检查:
模型配置正确
搜索能返回可靠来源
工具失败时有清楚错误
报告有来源
文件能保存和读取
tracing 能看到关键步骤
部署前检查
部署前重点看:
API key 是否安全
MCP 权限是否过大
sandbox 是否隔离
日志是否可查
文件存储是否可控
如果接了有写权限的外部系统,先不要开放给多人使用。
回滚和降级
保留一个最小可用模式:
只用模型 + 搜索 + 报告生成
MCP、Memory、Sub-agent 都可以后续再开。
这一篇你要记住
验收不是看它能不能成功一次。
而是看它失败时能不能定位,长期运行时边界是否清楚。
三个验收任务示例
简单任务:
总结 DeerFlow 是什么,输出 800 字报告。
中等任务:
对比 DeerFlow 的 Tools、Skills、MCP,说明三者边界。
困难任务:
基于官方仓库,分析 DeerFlow 如何支持研究型 Agent,并标注不确定点。
三个任务都通过,才说明它不是只会演示。
部署后监控什么
至少看:
失败率
平均耗时
token 消耗
工具失败次数
报告生成成功率
这些指标比“用户觉得不错”更能发现问题。
什么时候不要部署
如果还不能稳定拿到来源、不能保存文件、不能排查失败,就先不要部署成长期服务。
先把最小链路打稳。