跳转到主要内容

开发者们不再追求智能Agent,竟然转向了一种全新技能架构!

日期: 栏目:快讯速递 浏览:

编辑 | LSLS

出品 | 本站

自10月份 Claude Skills 上线以来,很多开发者都亲自上手构建了这套技能,小编也经常能刷到各种讨论和经验贴。

例如一位网友做的文生图 Skill :

图片图片

或者一个编码浏览器 Skill:

图片图片

Skills是什么?官方定义:Skill = 一个带有指令、脚本与资源的文件夹,Claude 在需要时自动加载,让 Claude 能调用特定“技能”完成专业任务。

前几天,Anthropic 工程师、Skills功能的创造者Barry Zhang 和 Mahesh Murag做客《AI Engineer》节目,分享了他们的最新观点:停止构建 Agent ,开始构建 Skills 吧!

图片图片

他们指出,当前的 Agent 虽足够智能,但缺乏实际工作所需的领域专长,难以像人类专家一样提供稳定可靠的执行力。

为了解决这个问题,他们提出了一种全新的架构范式:Agent Skills。技能本质上是文件和文件夹的集合,用于打包可组合的程序性知识,让Agent从一个聪明的“通才”转变为一个专业的“专家”。

他们呼吁开发者停止重复构建独立的Agent,而应该开始为通用的Agent构建和分享技能。

一、Agent的现状:智能但不专业

随着Agent技术的发展,其核心脚手架已变得通用化。Anthropic的Claude Code Agent证明了代码是通向数字世界的通用接口。

由此他们提出一个理念:代码就是你所需要的(Code is all you need)。

图片图片

Agent可以调用API、组织数据、用Python分析并输出结果,其核心可以精简到只需要Bash和文件系统 。

同时,Claude团队也发现:不同领域的 Agent 底层其实很通用,其实没必要做这么多Agent,财务,数据分析,全都能用代码搞定。

图片图片

这当然很好,但也随之而来另一个问题:Agent 虽然聪明,但并不专业。

Barry打了一个有趣的比方:

“你希望谁来帮你处理税务?是拥有300智商的数学天才Mahesh,还是经验丰富的税务专家Barry?”

图片图片

现有的 Agent 就像是智商 300 的Mahesh,它们很聪明,但在缺乏重要上下文时,无法很好地吸收专业知识,也无法随时间学习,难以持续、一致地执行特定领域的任务。我们需要的是Barry那样的领域专家,能够基于现有知识提供一致性执行。

为了解决这个问题,Claude 团队推出了 Agent Skills。

二、Skills:为 Agent 提供可组合的专业能力

Skills 本质上是有组织的文件夹,用来打包程序化知识。

内容可以是脚本、代码、文件,也可以是工具或资源。

任何人或 Agent 都可以创建和使用。

支持版本管理,方便团队共享和迭代。

图片图片

举例来说,Claude 可以重复写一个 Python 脚本给幻灯片加样式。通过将脚本保存到 Skill 中,未来再次使用时可直接调用,效率更高,也更一致。

Skills 的出现让“记忆”变得具体:它记录了 Agent 在特定任务中的程序化知识,并可以在未来版本中复用。

图片图片

Skills的优势如下:

1.兼容性与版本控制:技能作为文件夹,可以直接使用现有基础设施进行管理,如在Git中版本控制、存入Google Drive,或打包分享。

2.代码作为工具:技能文件夹内可以包含脚本作为工具。这解决了传统工具的几个问题:传统工具说明模糊、无法修改。传统工具总是占据上下文窗口的宝贵空间 。而脚本自我文档化、可被Agent修改,并且只在文件系统中等待,直到真正被需要时才被调用。

3.渐进式披露:为了保护上下文窗口,Agent初次只会看到技能的元数据。只有当Agent决定使用某项技能时,它才会读取技能文件夹中的skill.md文件(包含核心指令)及其他内容。

图片图片

三、Skills 的三大类型

据Mahesh介绍,在短短五周内,Skills 生态迅速扩展,形成三类:

1.基础技能

为 Agent 提供通用能力或新领域能力。

例如,Claude 团队开发的文档技能,让 Claude 可以创建、编辑专业级办公文档。

图片图片

2.第三方技能

由生态合作伙伴为自家工具或产品构建。

例如,Browserbase 的 Stagehand 技能让 Claude 更高效地操作浏览器;Notion 推出一系列技能,帮助 Claude 更好地理解用户的 Notion 工作区,并在整个工作区中进行深入研究。

图片图片

3.企业定制技能

企业内部针对业务流程和内部软件定制的技能。

《财富》100 强企业和大型开发团队已经使用 Skills 教 Agent 公司最佳实践、代码风格等。

图片图片

三类 Skills 的共同点是:任何人都可以创建,任何 Agent 都能获得新的能力。

随着发展,团队观察到:

  • 技能越来越复杂:可能包含软件、可执行文件、脚本等,而不仅仅是 markdown 文件。
  • 与 MCP 服务器协同:MCP 提供外部连接,Skills 提供专业知识,两者结合可完成更复杂任务。
  • 非技术人员也能构建技能:财务、招聘、法律等岗位都能为 Agent 提供专业知识(这是最让他们惊喜的一点)。

图片图片

四、通用Agent的新兴架构

Mahesh指出,Agent技能的出现,正在推动通用Agent的架构进行融合:Agent Loop (循环) + Runtime (运行时环境) + MCP Servers (外部工具/数据) + Skills Library (技能库) 。

图片图片

  • Agent Loop帮助管理模型的内部上下文,并管理输入和输出的 token
  • Agent运行时环境提供文件系统和代码读写能力
  • MCP服务器提供与外部世界的连接和数据(如搜索引擎、数据库连接)
  • 技能库则提供专业知识

通过将Agent配备上正确的MCP服务器和相应的技能库,Anthropic能够迅速将Claude部署到新的垂直领域。在Skills发布之后,Anthropic在金融服务和生命科学领域都推出了新的产品。

图片图片

五、Skills的未来:开启持续学习的新模式

Mahesh指出,Skills的长期价值在于其共享和分发的能力。它能为组织内部和更广阔的社区创建一个集体、不断演进的知识库。

图片图片

1.持续学习和记忆: 技能的设计是实现持续学习的具体步骤。它将Agent的记忆概念具象化,不捕捉所有信息,只捕捉Agent可在特定任务上使用的程序性知识。

2.可转移的学习: Agent写下的任何程序性知识,都可以被未来的自己高效使用,这使得学习真正具有可转移性。

3.Agent创建技能: Claude现在已经可以利用“技能创建者”技能(Skill Creator Skill)来为用户创建技能。

Barry还提出:

我们的目标是:Claude 在与用户合作的第 30 天,要比第 1 天更聪明。

图片图片

未来,团队计划把技能像软件一样对待:测试、评估、版本控制和依赖管理,让 Agent 在不同环境下更可预测、更可靠。

六、终极比喻:模型=处理器,Agent Runtime=操作系统

最后,Claude 团队将 Agent 架构类比为计算机:

模型像处理器,潜力巨大但单独使用有限。

Agent 运行时像操作系统,管理输入输出、协调资源,让模型更有价值。

Skills 就像应用软件,编码专业知识和独特视角,让 Agent 真正“有用”。

也就是说,真正的价值不在模型本身,而在模型之上构建的应用层,而 Skills 正是打开这个层的钥匙,让每个人都能通过简单地将文件放入文件夹来解决具体的、复杂的问题。

图片图片

停止重复造 Agent,把精力放在 Skills 上,Agent 就能更聪明、更专业、更高效,也更易扩展和复用。

Claude团队最后呼吁:是时候停止造 Agent 了,开始造 Skills 吧!

评论区的各位大佬们:

你有尝试构建 Skills 吗?体验如何?

欢迎写下你的看法。

参考链接:https://www.youtube.com/watch?app=desktop&v=CEvIs9y1uog

标签: