最近一直在做 AI 相关的功能,写着写着突然有点懵——我这个东西,到底算不算 Agent?MCP 和 Tool Use 是一回事吗?Workflow 和 Agent 的区别又在哪?

网上的文章和视频也是越看越乱,概念繁多,颇有种大模型黑话的感觉。

直到看到了 Claude 官方的课程:Building with the Claude API,我才算把这些概念捋清楚了。

网址在这里:

https://anthropic.skilljar.com/claude-with-the-anthropic-api

发现这个课程其实是来自于知乎的一个问题:如何成为一名 AI Agent 工程师?

有从 LangChain, LangGraph 入手的,也有说从 Workflow 入手的。

有一个高赞答案吸引了我:

相比于其他的回答,确实可谓是四两拨千斤了,真正学习这个课程后,确实收获颇多。

关键亮点

对于我这种看事情喜欢看原理的人来说,这门课程简直是大福利。

就比如一开始的多轮对话,其实在看之前,就会好奇,多轮对话,上下文到底是谁在维护?

实际上确实不是大模型服务测在提供,每次对话都需要携带完整的历史上下文,token 消耗会随对话轮数线性增长——这也是为什么长对话会越来越贵,context window 的大小如此重要。

这个课程一个流程图就说清楚了,因为大模型服务提供者,不做存储:

当然,这个点应该绝大部分同学都知道了。

接下来解答我困惑的就是 Tool Use 的原理。本质上就是请求大模型的时候多传递了一个 tools 列表,模型自行选择,同时将需要使用的 tool name 和入参传递给客户端,客户端内部再调用工具将结果返回,之后大模型再返回回答。一般而言这时候我们界面上就能看到模型的回答了。

另一个就是 MCP 了,它本质就是定义了其他人如何将 tool 的定义和实现传递给我们的客户端。

一般这个 tools 是由 app 或者说 client 自己实现,但是借由 MCP 这个协议,client 可以直接获取到其他人写好的 tool 并且让对方来完成 tool 的执行。

所以两者其实是互补的: MCP 重点在于客户端和工具提供方如何传递和执行 tool,而 Tool Use 讲的是客户端和大模型服务如何交互实现工具的调用和结果的返回。

而最后就是 Agent 和 Workflow 了。相比大家应该都看过类似的文章 or 视频:Agent Workflow 已死什么的。

刚巧我最近就在做一些和大模型对话的功能,有多轮对话,拿到结果后自己写代码做结果校验。就很迷惑,我做的工作算 Agent 吗?啥是 workflow,这两者有区别吗?

答案也很简单,有区别:

最后发现,其实是 Workflow。而这个课程,最终给的结论,何时使用 Agent,何时使用 Workflow,也讲的很清楚。

简单来说:流程固定、步骤可预期,用 Workflow,比如自动生成热点文章;任务路径不固定、需要模型自主规划和决策,用 Agent,比如 Claude Code,或者豆包、元宝这类对话产品。

一些课程中遇到的问题

  1. 账号问题

可能很多人一直没有使用 Claude,就是因为要输入其他国家手机号以及充值等问题。

不过这里课程站是独立出来的,并不需要手机号验证或者充值验证这样的操作。所以打破网络问题之后,直接用邮箱注册之后即可学习这个课程。

  1. API Key 的问题

教程中需要使用 API Key,这一点是必须付费购买,也需要手机号验证,比较麻烦。

一方面,可以直接去第三方 API 代理平台购买,本身课程完整走下来花费不了太多的 token。

另一方面,可以使用一些平台免费赠送的额度。

这里我直接用的是 Vercel AI Gateway 赠送的 5 美金额度,访问 https://vercel.com/ai 注册即可领取,不需要绑卡。

领取后在控制台生成一个 API Token,然后把代码中的 base_url 和 model 替换成以下内容:

client = Anthropic(
    base_url="https://ai-gateway.vercel.sh",
)
model = "anthropic/claude-haiku-4.5"

最后

如果你也处于”看了很多文章但依然一头雾水”的阶段,强烈推荐从这门课入手。相比各种二手解读文章,官方课程在概念准确性上确实要高出不少。

需要注意的是,课程内容稍微有些滞后,一些新概念(比如 Skill, Computer Use、Extended Thinking)还没有覆盖,可以学完后再去看 Claude 官方文档补充。