Technical Guide

29. 验收与部署

把研究型 Agent 从一次本地演示推进到可长期使用:验收任务、配置安全、日志、回滚和部署边界。

本地跑通不等于完成

终局实战最后一步是验收和部署。

本地能跑,只说明开发链路通了。要长期使用,还要看稳定性、安全和排错能力。

验收任务

准备三个任务:

简单主题:验证基本流程
中等主题:验证搜索、抓取、报告
困难主题:验证不确定性和失败处理

不要只用一个成功样例。

验收清单

至少检查:

模型配置正确
搜索能返回可靠来源
工具失败时有清楚错误
报告有来源
文件能保存和读取
tracing 能看到关键步骤

部署前检查

部署前重点看:

API key 是否安全
MCP 权限是否过大
sandbox 是否隔离
日志是否可查
文件存储是否可控

如果接了有写权限的外部系统,先不要开放给多人使用。

回滚和降级

保留一个最小可用模式:

只用模型 + 搜索 + 报告生成

MCP、Memory、Sub-agent 都可以后续再开。

这一篇你要记住

验收不是看它能不能成功一次。

而是看它失败时能不能定位,长期运行时边界是否清楚。

三个验收任务示例

简单任务:

总结 DeerFlow 是什么,输出 800 字报告。

中等任务:

对比 DeerFlow 的 Tools、Skills、MCP,说明三者边界。

困难任务:

基于官方仓库,分析 DeerFlow 如何支持研究型 Agent,并标注不确定点。

三个任务都通过,才说明它不是只会演示。

部署后监控什么

至少看:

失败率
平均耗时
token 消耗
工具失败次数
报告生成成功率

这些指标比“用户觉得不错”更能发现问题。

什么时候不要部署

如果还不能稳定拿到来源、不能保存文件、不能排查失败,就先不要部署成长期服务。

先把最小链路打稳。