Technical Guide

29. 验收与部署

把研究型 Agent 从一次本地演示推进到可长期使用：验收任务、配置安全、日志、回滚和部署边界。

本地跑通不等于完成

终局实战最后一步是验收和部署。

本地能跑，只说明开发链路通了。要长期使用，还要看稳定性、安全和排错能力。

准备三个任务：

简单主题：验证基本流程
中等主题：验证搜索、抓取、报告
困难主题：验证不确定性和失败处理

不要只用一个成功样例。

至少检查：

模型配置正确
搜索能返回可靠来源
工具失败时有清楚错误
报告有来源
文件能保存和读取
tracing 能看到关键步骤

部署前重点看：

API key 是否安全
MCP 权限是否过大
sandbox 是否隔离
日志是否可查
文件存储是否可控

如果接了有写权限的外部系统，先不要开放给多人使用。

保留一个最小可用模式：

只用模型 + 搜索 + 报告生成

MCP、Memory、Sub-agent 都可以后续再开。

验收不是看它能不能成功一次。

而是看它失败时能不能定位，长期运行时边界是否清楚。

简单任务：

总结 DeerFlow 是什么，输出 800 字报告。

中等任务：

对比 DeerFlow 的 Tools、Skills、MCP，说明三者边界。

困难任务：

基于官方仓库，分析 DeerFlow 如何支持研究型 Agent，并标注不确定点。

三个任务都通过，才说明它不是只会演示。

至少看：

失败率
平均耗时
token 消耗
工具失败次数
报告生成成功率

这些指标比“用户觉得不错”更能发现问题。

如果还不能稳定拿到来源、不能保存文件、不能排查失败，就先不要部署成长期服务。

先把最小链路打稳。