Technical Guide
03. 配置文件:看懂 config.yaml
把 config.example.yaml 当成地图,先看模型、搜索、MCP、sandbox、tracing 这些会影响运行结果的配置。
配置文件不是填表
很多人跑 Agent 项目,会把配置文件当成“缺什么填什么”。
DeerFlow 不太适合这样看。
它的配置会直接影响任务怎么跑:模型怎么调用、搜索怎么接、MCP server 怎么加载、sandbox 怎么执行、tracing 怎么记录。
所以这一篇先建立配置地图。
先从样例文件看
官方样例在仓库根目录:
config.example.yaml
实际使用时,通常复制成:
config.yaml
不要直接在样例文件上改。这样后面更新官方仓库时,比较容易对照差异。
第一组:模型配置
模型配置决定 Agent 用哪个 provider 和哪个模型。
你需要关心:
provider
model
api_key
base_url
timeout
第一轮只配一个主模型。不要同时配多个 provider,否则出问题时很难判断是哪个模型在响应。
验证方式也很简单:启动后发一个短任务,看日志里是否真的打到了你配置的 provider。
第二组:搜索和抓取
研究型 Agent 需要资料来源。
搜索相关配置一般决定:
用哪个搜索 provider
是否需要 API key
返回多少结果
是否允许抓取网页正文
这里最容易出现的问题是:搜索返回了标题和摘要,但没有拿到正文。写研究报告时,只靠摘要很容易产生幻觉。
所以后面做终局实战时,会强调“拿不到正文就不要硬写”。
第三组:MCP 配置
MCP 让外部工具变成 Agent 可调用能力。
配置里通常会出现 server、transport、command、args、env 这类字段。
建议第一轮只接只读服务。
不要一上来接有写权限的数据库、云服务或内部系统。Agent 还没稳定前,先降低副作用。
第四组:Sandbox 配置
Sandbox 解决的是执行边界。
你要看清楚:
执行在哪里发生
文件保存到哪里
是否允许访问宿主机路径
是否用 Docker 隔离
如果你后面要让 Agent 生成报告、写文件、执行脚本,这一组配置就很关键。
第五组:Tracing 和运行记录
Agent 失败时,最怕只看到一句“任务失败”。
tracing 配置可以帮你看:
模型调用
工具调用
中间事件
最终输出
DeerFlow 仓库里有 tracing 相关模块,配置也会影响能不能把一次 run 看清楚。
推荐配置顺序
不要一次全开。
更稳的顺序是:
模型
|
搜索
|
sandbox
|
tracing
|
MCP
|
memory
每加一组配置,就跑一次小任务验证。
这一篇你要记住
config.yaml 不是启动前的杂项。
它决定了 DeerFlow 这个 Agent 系统能用什么模型、能看什么资料、能调用什么工具、能不能安全地产生文件,以及出错后能不能查清楚。
下一篇开始看整体架构。