AI 的能力悬置
这篇文章把“AI 的能力悬置”定义为:模型能力提升的速度,已经明显快过企业把这些能力真正嵌入工作流的速度。这个概念到底在说什么编码场景已经出现了可以长时间运行、承担大型项目的 agent,而大多数知识工作仍停留在“智能助手”阶段。作者的核心判断不是模型能力不够,而是能力突破与组织落地之间存在巨大落差。真正的问题不只是…
转载说明:本文翻译并转载自 Aaron Levie 于 2026-03-29(GMT)发布在 X 的长文 https://x.com/i/status/2037928306977509601。正文基于 Jina Reader 对 X Article 的完整提取整理;原页面有两处行内链接锚文本在镜像提取时丢失,本文仅移除了空占位,未对无法核实的人名做推断补全。AI 的能力悬置 文章配图 “未来早已到来,只是分布得还不均匀。” - 威廉·吉布森 如果你身处科技行业,你一定能强烈感受到当下 AI agent 世界里正在发生什么。一个接一个的例子表明,编程 agent 已经可以处理更长时间运行的任务,承担大得多的开发项目,越来越多的团队甚至公开表示,他们的产品现在几乎完全是靠 agent 写出来的。模型的编码能力已经强得惊人,而围绕编码构建的 agent 系统也迅速向前狂奔,把这一类工作率先彻底改造了。 然而,当你去和科技行业之外的知识工作者交流时,甚至包括行业内部的很多人,你会很清楚地发现,我们其实仍然处在非常早期的阶段。AI 往往还是一个非常有帮助的助手,能回答一些快速问题、帮忙查找信息,但大规模产出工作成果、真正实现自动化,这件事仍然处于起步阶段。即便只看今天的技术,能做的事情也远比现在落地的要多得多。正如 Ethan Mollick 所指出的那样,“如果我们现在立刻停止 AI 开发,它依然会在当前模型限制之内,重塑相当大一部分白领工作。” 而且,这些限制本身也在迅速消失。越来越多的前沿 AI 模型正在几乎所有知识工作领域接受训练,而且只会随着时间推移变得越来越强。它们懂得冷门的法律议题,理解医疗和生命科学中的深层专业内容,也越来越擅长营销、写作等创造性工作;对于它们一开始不知道的内容,还可以立刻调起工具、连接数据源,补足所需的信息。至少在离散任务层面上,它们几乎肯定会在未来几年内超越各自领域中的任何人类专家。 随着 AI 模型在各种知识工作领域里越来越聪明,如今摆在构建 agent 的公司和部署 agent 的企业面前的最大机会是:怎样把模型里涌现出来的突破性能力,真正接到企业工作流中,让 agent 能够在知识工作实际发生的环境里交付真实产出。Agent 的上下文鸿沟 部署 agent 仍然面临的最大挑战之一,就是如何把正确的上下文交给 agent。 有人曾把大多数 agent 工作流自动化的问题概括得非常精炼:“现在,甚至也许一直以来,增长的瓶颈都是上下文,因为任何拥有完整上下文的工作都可以被自动化。眼下的竞赛,就是让组织的集体大脑变得能被 AI 读懂。” 对于大多数诞生在 agent 时代之前的企业来说,agent 完成工作所需要的上下文,往往并不是以一种干净、可直接提供给 agent 的格式存在。Dwarkesh Patel 在与 Dario Amodei 的对谈中提出一个判断:编码之所以与其他工作不同,是因为完成这项工作所需的大量关键上下文,就活在代码库本身里。和编码不同,其他知识工作里的关键上下文往往来自割裂的系统、视频会议、线下会议、公司及其客户周围发生的外部事件,等等。 即便这些上下文已经被数字化,大多数企业仍深陷在各种遗留而割裂的系统之中。尽管云计算已经增长了这么多年,仍有相当一部分软件、数据和基础设施被困在本地部署或笨重的系统里,无法轻松与运行在云端的 agent 对接。我们在 Box 一直能看到这种情况:很多公司仍把大量非结构化数据堆在永远无法与 agent 良好协作的系统里,现在才终于开始把它们迁移到云上。未来几年,这些平台一定会被激进地重构为 cloud-native 和 AI-native 架构,但在那之前,agent 还无法真正自由地在整个组织中穿梭并自动化工作。 接下来还有权限和访问控制的问题。在大多数组织里,没有两个用户能访问完全相同的信息,这本来就是刻意设计出来的。经理能看到直属下属的薪酬细节,但看不到同级同事的;顾问可以看到自己正在参与的项目,却看不到同一家咨询公司里竞争客户的项目。组织内部存在近乎无限种访问控制组合,它们本来是为了防止人接触错误信息,但当 agent 在系统中执行的工作量达到人的 100 倍甚至 1000 倍时,这些机制会引入全新的复杂性。在某些场景里,agent 应该拥有远超用户传统权限的访问范围;而在另一些场景里,agent 又应该比用户技术上拥有的权限少得多。这两种情况都很难被正确管理。 最后,企业还要面对一个快速变化的技术版图。它们刚刚落地一种方案,最佳实践就又变了,需要再来一次整体重构。企业究竟应该把全部数据都索引进向量数据库,用 RAG 做检索?还是让 agent 去调用不同 SaaS 工具暴露出来的 MCP server?又或者应该让代码执行型 agent…
正在初始化 WebAssembly 引擎…
首次编译原生模块可能需要数秒
就绪后,页面交互将以接近原生的速度运行