AI 的能力悬置

转载说明：本文翻译并转载自 Aaron Levie 于 2026-03-29（GMT）发布在 X 的长文 https://x.com/i/status/2037928306977509601。正文基于 Jina Reader 对 X Article 的完整提取整理；原页面有两处行内链接锚文本在镜像提取时丢失，本文仅移除了空占位，未对无法核实的人名做推断补全。AI 的能力悬置文章配图 “未来早已到来，只是分布得还不均匀。” - 威廉·吉布森如果你身处科技行业，你一定能强烈感受到当下 AI agent 世界里正在发生什么。一个接一个的例子表明，编程 agent 已经可以处理更长时间运行的任务，承担大得多的开发项目，越来越多的团队甚至公开表示，他们的产品现在几乎完全是靠 agent 写出来的。模型的编码能力已经强得惊人，而围绕编码构建的 agent 系统也迅速向前狂奔，把这一类工作率先彻底改造了。然而，当你去和科技行业之外的知识工作者交流时，甚至包括行业内部的很多人，你会很清楚地发现，我们其实仍然处在非常早期的阶段。AI 往往还是一个非常有帮助的助手，能回答一些快速问题、帮忙查找信息，但大规模产出工作成果、真正实现自动化，这件事仍然处于起步阶段。即便只看今天的技术，能做的事情也远比现在落地的要多得多。正如 Ethan Mollick 所指出的那样，“如果我们现在立刻停止 AI 开发，它依然会在当前模型限制之内，重塑相当大一部分白领工作。” 而且，这些限制本身也在迅速消失。越来越多的前沿 AI 模型正在几乎所有知识工作领域接受训练，而且只会随着时间推移变得越来越强。它们懂得冷门的法律议题，理解医疗和生命科学中的深层专业内容，也越来越擅长营销、写作等创造性工作；对于它们一开始不知道的内容，还可以立刻调起工具、连接数据源，补足所需的信息。至少在离散任务层面上，它们几乎肯定会在未来几年内超越各自领域中的任何人类专家。随着 AI 模型在各种知识工作领域里越来越聪明，如今摆在构建 agent 的公司和部署 agent 的企业面前的最大机会是：怎样把模型里涌现出来的突破性能力，真正接到企业工作流中，让 agent 能够在知识工作实际发生的环境里交付真实产出。Agent 的上下文鸿沟部署 agent 仍然面临的最大挑战之一，就是如何把正确的上下文交给 agent。有人曾把大多数 agent 工作流自动化的问题概括得非常精炼：“现在，甚至也许一直以来，增长的瓶颈都是上下文，因为任何拥有完整上下文的工作都可以被自动化。眼下的竞赛，就是让组织的集体大脑变得能被 AI 读懂。” 对于大多数诞生在 agent 时代之前的企业来说，agent 完成工作所需要的上下文，往往并不是以一种干净、可直接提供给 agent 的格式存在。Dwarkesh Patel 在与 Dario Amodei 的对谈中提出一个判断：编码之所以与其他工作不同，是因为完成这项工作所需的大量关键上下文，就活在代码库本身里。和编码不同，其他知识工作里的关键上下文往往来自割裂的系统、视频会议、线下会议、公司及其客户周围发生的外部事件，等等。即便这些上下文已经被数字化，大多数企业仍深陷在各种遗留而割裂的系统之中。尽管云计算已经增长了这么多年，仍有相当一部分软件、数据和基础设施被困在本地部署或笨重的系统里，无法轻松与运行在云端的 agent 对接。我们在 Box 一直能看到这种情况：很多公司仍把大量非结构化数据堆在永远无法与 agent 良好协作的系统里，现在才终于开始把它们迁移到云上。未来几年，这些平台一定会被激进地重构为 cloud-native 和 AI-native 架构，但在那之前，agent 还无法真正自由地在整个组织中穿梭并自动化工作。接下来还有权限和访问控制的问题。在大多数组织里，没有两个用户能访问完全相同的信息，这本来就是刻意设计出来的。经理能看到直属下属的薪酬细节，但看不到同级同事的；顾问可以看到自己正在参与的项目，却看不到同一家咨询公司里竞争客户的项目。组织内部存在近乎无限种访问控制组合，它们本来是为了防止人接触错误信息，但当 agent 在系统中执行的工作量达到人的 100 倍甚至 1000 倍时，这些机制会引入全新的复杂性。在某些场景里，agent 应该拥有远超用户传统权限的访问范围；而在另一些场景里，agent 又应该比用户技术上拥有的权限少得多。这两种情况都很难被正确管理。最后，企业还要面对一个快速变化的技术版图。它们刚刚落地一种方案，最佳实践就又变了，需要再来一次整体重构。企业究竟应该把全部数据都索引进向量数据库，用 RAG 做检索？还是让 agent 去调用不同 SaaS 工具暴露出来的 MCP server？又或者应该让代码执行型 agent…