a16z 的 2026 年 AI 智能体论断为审批闭环背书。这对增长意味着什么。
a16z 对 AI 应用的 2026 年论断认为,制胜的智能体模式是这样一种:智能体先把活儿干完,最后才寻求审批——它发现问题、诊断根因、调研方案、落地解决办法,然后才来找你说“请批准我找到的这个方案”。这不是自主性。这是一个把人放在审批环节的提议→审阅→执行闭环——正是 Ceres 对每一个外发营销动作所采用的模式。
有意思的是,这曾经是个不起眼的立场。两年来,声量最大的 AI 智能体营销宣传的恰恰相反:完全自主的工作者,在你睡觉时替你运营某个职能,不需要人在回路。到了 2026 年,市场终于追上了这道算术题。Gartner 预测,到 2027 年底将有超过 40% 的智能体 AI 项目被取消,而如今一家顶级风投正在把寻求审批的智能体——而非自主的那种——描述为人人真正想要的东西。
本文照单全收 a16z 的框架,把它放到监管机构和分析师如今通用的智能体自主性光谱上,并指出一款诚实的增长工具落在哪里。简而言之:审批级别的智能体才是经得起时间考验的设计,而它正是我们造出来的东西。
a16z 的 2026 年论断到底是怎么说 AI 智能体的?
在 Notes on AI Apps in 2026 中,a16z 合伙人 Marc Andrusko 用最有主动性的那类员工来类比理想的智能体。用他的话说,最好的员工“发现问题、诊断根因、落地解决方案,然后才来找你说:请批准我找到的这个方案。”在文中别处,a16z 描绘了一位产品经理的画面:他每天早上来审阅“模型一夜之间构想出的 2-3 个功能”——这位经理并没有交出钥匙,而是审阅并签字放行。
请仔细读这段,因为结构比氛围更重要。智能体被信任去无人监督地完成大量工作:调研、诊断、起草,甚至是一份拟议的实施方案。它不被信任去做的,是在没有人类过目的情况下发出会带来后果的动作。这是一个提议→审阅→执行闭环。人类是审批者,不是操作者——但也不是缺席者。作为一个方向性的押注,a16z 和 Alex Rampell 主张,AI 能把一个约 $300B 的软件市场转化为约 $13T 美国劳动力市场中的一块(这是 a16z 自己的方向性说法,并非经核实的市场规模)。但请注意,在他们的 2026 应用框架里,那个智能体在动手前仍然会先问。
- a16z 的 2026 年智能体论断把制胜模式描述为:诊断 -> 起草一份草案 -> 然后才寻求审批。这是提议→审阅→执行,不是完全自主。
- Gartner 预测,到 2027 年底将有超过 40% 的智能体 AI 项目被取消,部分原因是风险控制不足以及“智能体洗白”——据 Gartner,数千家自称“智能体”的厂商中只有约 130 家是真的。
- 在英国监管机构的 5 级自主性光谱上,诚实的增长工具落在第 4 级:用户作为审批者——被纳入回路,为有后果的动作签字放行。
- Ceres 正是按这种审批级别的智能体来构建的:每一个外发动作(帖子、冷邮件、广告投放、发布)都需审批;可逆的轻量互动则不受审批门控运行,但会被记录。
- 你是智能体老板(agent boss)。专家智能体负责起草和提议;要发出门外的内容由你来批准。
一款诚实的 AI 智能体落在自主性光谱的哪个位置?
“智能体”并非单一一种东西。英国的联合监管机构——CMA、FCA、ICO 和 Ofcom,以数字监管合作论坛(Digital Regulation Cooperation Forum)的形式协作——于 2026 年 3 月 31 日发布了一份前瞻报告,给出了一个五级的智能体自主性光谱。对一款增长工具而言要紧的是第 4 级:用户作为审批者,即在遇到阻碍时以及为有后果的动作签字放行时把用户纳入回路。如今很少有企业在生产环境运行第 5 级(完全自主)。下面是这个光谱,并对应到买家真正听到的那套营销词汇:
| 阶段 / 词汇 | 谁掌控动作 | 典型说法 | 落在何处 |
|---|---|---|---|
| 助手(Assistant) | 人类做一切;工具回答问题 | “有问题尽管问” | 聊天机器人、文案工具 |
| 副驾(Copilot) | 人类操作;工具在行内给建议 | “边打字边给建议” | 编辑器副驾、自动补全 |
| 智能体(任务型) | 工具按请求执行一个有边界的任务 | “运行这个工作流” | 单任务自动化 |
| 队友 / 审批者(DRCF 第 4 级) | 工具起草并提议;人类批准有后果的动作 | “先诊断、起草,再请你批准” | Ceres、Devin 的合并前审阅 |
| AI 工作者 / AI 员工 | 工具基本自行行动;人类抽查 | “你的第一个 AI 员工” | 自主性赛道的定位 |
| 完全自主(DRCF 第 5 级) | 工具无需签字放行即行动 | “在你睡觉时替你运营职能” | 生产环境中罕见;波及面巨大 |
Ceres 稳稳落在队友 / 审批者级别。十一位专家智能体——由一位AI 增长官统筹编排——会自主地把工作推进到产生后果的那条线为止:他们调研、诊断、起草。然后每一个外发动作都停下来等待人类。这就是 DRCF 第 4 级,也是 a16z 的 2026 年模式,是同一个设计点。要看更深入的品类拆解,参见 AI 营销团队 vs AI 员工 vs AI 智能体。
为什么自主性至上的那条赛道在 2026 年变安静了?
诚实要求我们为另一条赛道做最有力的辩护,因为那里确实有好产品。Cognition 的 Devin 把自己描述为一个“协作式 AI 队友”,据报道 Goldman Sachs 把它称作他们的“第一个 AI 员工”——但关键的细节是,Devin 的工作在合并前要经过审阅。即便是最激进的编程智能体定位,也带着审批的意味。这对我们的论点是友好的,而非敌对的。
这条赛道更尖锐的边缘,在于营销跑到了产品前面。Artisan 的“AI SDR”Ava 打出过一场“停止雇人(Stop Hiring Humans)”的广告牌战役;Artisan 自家的 CEO 后来说这场战役“主要只是为了博眼球”。独立评测指出 Ava 连处理邮件回复这类基础事都很吃力,它在 G2 上的评分约为 3.8/5。我们并不是说 Artisan 鲁莽——他们的 CEO 把心照不宣的那句话说了出来,这份坦诚很有用:它是直接的证据,表明自主性赛道一直被夸大了。
- Gartner 的取消预测 Gartner 预测,到 2027 年底将有超过 40% 的智能体 AI 项目被取消,理由是成本不断攀升、价值不明,以及风险控制不足(Gartner 新闻稿,2025 年 6 月 25 日)。
- 智能体洗白 Gartner 发现,在数千家以“智能体”为卖点做营销的厂商中,真正算数的只有约 130 家——其余都是改头换面的聊天机器人、RPA 和助手。我们在 营销中的智能体洗白 一文中专门讲了这一模式在营销领域的表现。
- “AI 员工”这个框架本身 一篇 HBR 文章(2026 年 5 月)主张,把 AI 智能体当成“员工”是一种品类错误,会稀释问责——如果智能体就是那个员工,那它发出了错误的东西时,该由谁负责?
这一切并不意味着自主性是坏事。它意味着自主性中无人监督的外发那个版本,才是项目折戟的地方——折在成本上、折在信任上、折在一次谁也没批准的失误上。审批闭环正是那批被取消的项目所缺的风险控制。
Ceres 是如何实现提议→审阅→执行闭环的?
这个闭环不是一句口号;它是架构。借用 Microsoft 在其 "Work Trend Index" 中的说法,你是智能体老板:人类指挥并监督这些智能体,智能体负责起草。在 Ceres 中,每一个外发动作都流经一个提议 -> 审阅 -> 执行的状态机,而执行那一步只会在拿到已批准的签字放行后才触发。
- 诊断 一位专家智能体——SEO 内容、冷邮件、Twitter/X 增长、付费广告,或十一位中的另一位——拉取实时数据、发现机会,并把每一项发现都扎根于附带证据引用之上。没有来源,任何结论都不会发出。
- 起草并提议 它写出真正的产物:那条帖子、那套冷邮件序列、那段广告文案、那处页面改动。这正是 a16z 所描述的智能体在干活——不是来问该做什么,而是把它已经做好的东西拿来提议。
- 审阅 你看到草案,以及它背后的证据。可逆的轻量互动(一次点赞、一次关注)不受审批门控运行,但会被记录并设有频率上限。一切有后果的动作——社交帖子、冷邮件、广告投放、发布——都在这里停下来。
- 批准并执行 你批准。只有到那时它才会被发出门外。系统从不绕过审批,已过期或被拒绝的签字放行无法执行。
它是完全托管的——你无需运维任何基础设施——凭据在静态时加密(AES-GCM)。重点不是拖慢你;诊断和起草都以智能体的速度进行。重点在于:唯一那个不可逆的步骤——会署上你名字的那件事——等着你。这就是一个审批级别的队友,与一个你还得替它善后的“AI 员工”之间的全部区别。完整流程参见 运作方式,或查看十一个角色。
审批闸门难道不就是一款更弱、自主性更低的产品吗?
这是个值得正面回答的反对意见,因为两年来市场把自主性定价为高端功能,把人在回路当成打折版本。a16z 的 2026 年框架把这一点彻底翻转了。人人真正想要的那个智能体——在他们的类比里那个“S 级员工”——恰恰是先把活儿干完、再请你批准的那种。审批这一步不是廉价版本。它是当下最看好 AI 的投资人正在描述为目标的那种设计。
而且其价值是具体的,不是哲学层面的。审批闸门正是让你能把一支 AI 增长团队摆到你的受众面前、又不至于在凌晨三点对你的品牌来一次失误的那个东西。它正是把一个臆造的数字挡在已发布帖子之外的那个东西,因为每一项发现都附带证据引用,而且你在它发出前就过目了。它正是 Gartner 点名其缺失、并以此解释为什么 40% 以上智能体项目被取消的那个风险控制。我们在 人在回路的 AI 营销实战手册 中做了更全面的论证。
你不该相信的是:任何工具,包括我们的,能让你脱离对判断的依赖。我们不会在你睡觉时替你运营营销,也不会那样去卖它。你来运营一支 AI 营销团队;团队负责起草;要发出去的东西由你批准。这是诚实的立场,而到了 2026 年,它同时也是顺应趋势的那个立场。
在你自己的增长上试一试这个审批闭环
如果 a16z 的论断是对的——市场朝它的修正表明它很可能是对的——那么正确的做法不是去等待一种或许永远无法安全到来的完全自主营销。而是现在就让一支审批级别的 AI 增长团队动起来:它会诊断、起草,并在任何触及外部世界的事情上等待你的签字放行。
Ceres 就是这样一支团队,由你来运营,面向独立创始人和 1-5 人的 SaaS 小队。套餐分为 Starter $19、Plus $59、Pro $199 和 Growth $499(每月),并提供 14 天免费试用,无需信用卡,让你在做决定前先看着这个提议→审阅→执行闭环跑起来。如果你想先在一个真实的场景上看看这个闭环,我们的生成式引擎优化策略师会出一份免费 GEO 审计——这是一份在任何其他事情发生之前先由你批准的诊断。
- 看看提议→审阅→执行闭环的实际运行——开始免费试用(14 天,无需信用卡)。
- 想先读一读?在 AI 营销团队 vs AI 员工 vs AI 智能体 中对比这些品类。
FAQ
- a16z 真的为需审批的 AI 智能体背书了吗?
- a16z 的 2026 年论断(Notes on AI Apps in 2026)用类比描述了理想的智能体:a16z 合伙人 Marc Andrusko 说,最好的员工发现问题、诊断根因、落地解决方案,然后才来找你说“请批准我找到的这个方案”。文中另一段则设想了一位产品经理在审阅模型“一夜之间构想出”的 2-3 个功能。这种结构——先干活,再寻求审批——就是提议→审阅→执行闭环。我们把它读作 a16z 对制胜模式的框架性表述,而非字面意义上的产品背书,而它恰好直接对应于一款需审批的增长工具的运作方式。
- 什么是提议→审阅→执行(审批)闭环?
- 它是一种三阶段模式:智能体提议一份完成的草案(诊断加上一个拟议的动作),人类连同附带的证据引用一起审阅,只有一份已批准、未过期的签字放行才能执行那个有后果的动作。在 Ceres 中,每一个外发动作——社交帖子、冷邮件、广告投放、发布——都跑这个闭环。像点赞或关注这样的可逆轻量互动不受审批门控运行,但会被记录并设有频率上限。它对应英国监管机构智能体自主性光谱上的“第 4 级:用户作为审批者”。
- 大多数 AI 智能体项目真的会失败吗?
- Gartner 预测,到 2027 年底将有超过 40% 的智能体 AI 项目被取消,理由是成本不断攀升、商业价值不明,以及风险控制不足(Gartner 新闻稿,2025 年 6 月 25 日)。Gartner 还描述了普遍存在的“智能体洗白”——把聊天机器人和 RPA 改头换面成智能体——估计数千家自称“智能体”的厂商中只有约 130 家是真的。要点不是说智能体不管用;而是说无人监督、治理不善的部署才是会折戟的那一类。审批闭环正是那批项目所缺的风险控制。
- Ceres 是一个替我运营营销的完全自主 AI 员工吗?
- 不是,我们也不会那样去描述它。Ceres 是一支由你来运营的托管式 AI 营销团队。AI 增长官统筹编排十一位专家智能体,它们会自主地诊断、调研和起草——但每一个外发动作在发出前都会停下来等你审批。你是智能体老板;专家负责提议,你来批准。这种人在回路的设计是刻意为之的:它正是让你的品牌和你的名字保持安全的东西,也正是 a16z 的 2026 年论断所描述的、人人真正想要的那种模式。
- 需审批与那些“AI SDR”或“AI 工作者”工具有什么不同?
- 自主性赛道营销的是基本自行行动的智能体——“你的第一个 AI SDR”“停止雇人”。其中有些是真实而有用的(Cognition 的 Devin,一个“协作式 AI 队友”,仍会让工作经过合并前审阅)。也有些被公开夸大了——Artisan 的 CEO 说它那场“停止雇人”的战役“主要只是为了博眼球”,评测者也指出它的 Ava 智能体在处理邮件回复上很吃力。Ceres 的差异在于理念,而非炒作:需审批的外发、附带证据引用的发现,以及完全托管的基础设施。我们竞争的是人类站在哪个位置,而不是谁宣称的自主性最高。
- 审批闸门会让 Ceres 比自主工具更慢吗?
- 诊断和起草都以智能体的速度进行——专家们调研和撰写时不必等你。唯一要等的,是那个单一的不可逆步骤:把署着你名字的东西发到外部世界去。实际操作中那是一次快速审阅,而非瓶颈,并且远比替一次无人监督的失误善后要快得多。a16z 自己的 2026 年框架把这个审批步骤当作目标状态,而非一种代价:先把活儿干完、再请你批准的那个智能体,正是他们所描述的理想之选。