聊聊 Harness 时代 AI-First 的组织架构：从信任人到信任 AI

硅谷101 · E238 | 2026-05 | 嘉宾：Peter、陈凯、Clark（Creo 三位创始人）

过去三年，我们经历了大模型工程能力的三次概念进化。2023 年，所有人都在聊 prompt engineering——怎么写好提示词让模型给出更好的答案。2024 年，焦点变成了 context engineering——怎么给模型提供更完整的上下文。到了 2026 年，一个新的词开始在硅谷流行：harness engineering。

Harness 在英文里原本指马具——套在马身上用来引导和约束马的那套装备。现在它被用来形容一件事：你怎么样去围绕大模型搭建一套能够让它在真实世界中持续工作、自我修复、还能自我提升的系统。这不再是关于怎么跟模型对话，而是关于怎么构建一个让模型可靠运行的完整工程体系。

本期硅谷101邀请了 Creo 的三位创始人——CTO Peter（前 Meta Llama 基础模型团队研究科学家、前苹果多模态模型工程师）、CEO 陈凯，以及负责 GTM 的 Clark——来分享他们如何在 AI 快速进化的一年里，重新组织公司的架构，把"信任人"变成了"信任 AI"。

Harness Engineering 是什么？ 继 Prompt Engineering（2023）和 Context Engineering（2024）之后，2026 年硅谷最热的新概念——如何围绕大模型搭建一套能自我修复、自我提升的系统。

25 人公司，99% 代码由 AI 生成 Creo 用亲身实践证明了 AI-first 组织架构的可能性：传统 6 周的迭代周期被压缩到一天之内。

从"信任人"到"信任 AI" 组织架构的核心转变不是引入 AI 工具，而是让 AI 成为生产力的主导——这要求整个公司重新设计流程和角色。

开发速度远超市场速度 Feature 多到卖不过来——marketing 团队从"等 roadmap"变成"从菜篮子里挑 feature"。这是 AI-first 组织最直观的外部表现。

一、AI 工程能力的三次进化

Peter 在节目中清晰地梳理了这三次跃迁的脉络。Prompt engineering 和 context engineering 的关注点都在怎么和 LLM 这个大模型本身进行交互——优化 prompt、优化 context。它们的 scope 相对较小，而且是静态的：你优化的是一个模型，你优化的任务也是一个相对 vertical 的任务。

但 harness engineering 完全不同。它不只是关于 LLM 本身的 harness，而是整个系统的 harness——包括基础设施建设、tooling 的使用、安全的保证。它涉及 sandbox 的架构设计、host service 之间怎么安全交互、sandbox 启动时间是多少、延迟是多少。这些全部都是 harness 的一部分。

  作者概括：如果把前两个阶段比作学会跟一匹马沟通（prompt）和了解它的习性（context），那 harness 就是给这匹马配上全套马具——缰绳、马鞍、马镫——让它真正能上路跑起来，而且跑得又快又稳。

从静态到动态，是 harness 最本质的区别。Peter 强调，他们认知中的 harness 是一个动态的过程：系统怎么能够从一个静态的状态真的"活起来"，能够 self-improve，能够不停 adapt 新的 signal——不管是 marketing signal、产品本身的 signal、还是用户的行为 signal。

二、AI-First 不是"用 AI 工具"——是重新设计组织

这是本期对话最核心的观点。陈凯开门见山地说："我们如果想要做到所谓的 AI first 或者 AI native 这样的一个状态，那它并不是在现有的流程上面去使用 AI 的工具，而是要围绕 AI 的能力去重新的构建你的工作流程和组织形态。"

他举了一个反例：在很长一段时间里，每个工程师都在用 AI 写代码，每个产品经理都在用 AI 写 PRD，每个设计师都在用 AI 作图。但这样并没有增加效率——反而因为每个人的工作进度和节奏不一样，导致 alignment 的成本变得非常高。

问题的根源在于：如果人还是工具的使用者，效率提升就有一个天然的上限——可能最多就 10 倍。要追求 100 倍、1000 倍的效率提升，AI 必须是生产力的主导，而人的角色要从"实际工作者"变成"方向的设定者和结果的审核者"。

  核心洞察：大多数公司所谓的"AI first"都是假的。他们只是在现有流程上叠加 AI 工具——就像给马车装了一个引擎，但马车还是马车。真正的 AI-first 是从头设计一辆汽车。

三、信任的转移：组织架构的核心变革

陈凯把组织架构变革提炼为一个核心问题：信任。传统组织信任的是人——每个角色、每层汇报、每次对齐都建立在"人靠谱"的假设上。AI-first 组织要做的，是把信任对象从人转移到系统。

"原来你组织信任的是人嘛，那人本身是这个组织最核心的那一环。但现在当你把 AI 拿进来之后，其实你要先解决第一个问题，就是你能不能信任你的 AI 做决策或去执行任务。"

这个信任不是凭空产生的——它需要通过 harness 系统建立大量的 guardrails 和机制，保障 AI 做的所有工作——不管是决策、planning、还是执行——最终能被信任。

当信任建立起来之后，组织内部的对齐方式就发生了根本变化。以前 marketing 团队和 engineering 团队需要互相沟通、达成共识、对齐之后才能推进。现在，AI 主导告诉 marketing team 开发团队要发布什么功能，marketing 不再需要跟 engineer 反复沟通。对齐成本大幅降低。

四、"一天迭代完传统六周的工作"

Peter 在 Twitter 上发了一篇帖子，获得了 187 万的流量，引发了广泛共鸣。帖子的核心内容可以浓缩成一句话：一家 25 个人的公司，99% 的代码都是 AI 来写的。早上 10 点写了一个功能，中午就进行了 AB test，下午 3 点根据数据反馈砍掉了一部分功能，5 点又重写了更好的版本。这是一天的时间——而传统开发流程需要六周。

这个节奏之所以可能，是因为 AI 辅助 coding 让实现一个 feature 的时间从几周变成了一到两个小时。当实现成本降到这么低，传统的 design 和 testing 流程就成了瓶颈。因此必须把 design planning 和 testing 也纳入 harness 体系——让 AI 来驱动整个 pipeline，而不仅仅是 coding 这个环节。

五、开发速度远远超过市场速度

AI-first 组织带来的一个反直觉结果是：开发团队的产出远远超过了 marketing 团队能消化的速度。

Clark 描述了这个变化："我最大的体会就是，现在我们确实不用跟 engineer 过多的沟通说你要做什么 feature，然后你什么时候能 deliver，因为 feature 现在的数量已经远远超过我们能够去卖它的这个能力了。开发的速度是远远超过于市场这边的进度的。"

他用了一个生动的比喻——"菜篮子"：就像有一个百宝箱，如果今天市场需求是一个苹果，就从篮子里挑一个苹果去卖；如果需求是一个香蕉，就挑一个香蕉去卖。不再需要讨论 product roadmap 是什么，只需要讨论市场需求在哪里。

  反转：传统 SaaS 公司里，销售团队超前产品 4-5 个月——用户看到的是几个月后才会发布的功能。在 Creo，技术团队反过来超前 marketing 团队 3-5 个月。整个运营方式和组织结构都因此发生了变化。

六、自我修复系统：Bug 修复从一周变成一小时

AI 写的代码也会产生 bug——这是不可避免的。但关键区别在于发现和修复 bug 的速度。

Peter 描述了他们的两层防线系统。第一层是 ship 前拦截：AI-driven 的 testing（比如用 Playwright 做 fully end-to-end testing），保证 ship 的代码中没有明显会 break 产品的 bug。第二层是 ship 后快速修复：多个 agent 并行 identify bug（一到两分钟），自动 triage、assign 给工程师（几秒钟），工程师再用 agent investigate 和提出 solution。

结果：整个 bug cycle 从一周压缩到了一到两个小时。

更激进的是，他们建立了一套 auto-fixing 系统。50% 以上的 issue 是通过 auto-fixing 自动完成的。对于风险较小的文件，AI 自动提交 PR，工程师只需要简单 approve 一下就上线。只有触及安全或 agent behavior 等敏感文件时，才需要深度 review。

一个有意思的副作用：bug list 和 feature wishlist 都没有了。Bug 及时发现及时修复，feature 多到用不完。以前团队总是争吵"先修 bug 还是先做 feature"，现在这个问题消失了。

七、两种工程师：Architecture 与 Operator

Peter 在文章和对话中都强调了一个重要区分：在 AI 环境下的工程团队分为两种人——architecture（架构师）和 operator（操作者）。

Architecture 负责决定系统的整体架构：sandbox 和 host 之间怎么交互、安全边界在哪、延迟怎么优化。AI 会给你一个 solution，但通常有安全或延迟隐患——架构师的价值在于判断和优化。Operator 则负责执行和运营：用 AI 快速实现 feature、分析数据、根据 feedback 做判断。

最惊人的数字是：以前搭建同样规模的 agent 系统需要 10 到 20 个人，现在只需要 1 个 architecture，在一周之内就能完成。Peter 坦言："2026 年我就没有写过一行代码。"

八、初级工程师 vs 资深工程师：谁更能适应 AI？

Peter 的观察引发了很多讨论：初级的工程师比资深的工程师更能适应 AI 的环境。

原因在于，初级工程师的 tech debt 和思想束缚更少。他们愿意 extend 自己的 scope——不只是写代码，还参与产品设计、数据分析、feature deploy 后的效果判断。而资深工程师花 10 到 20 年积累的 specialty（怎么写最简洁的代码、怎么设计最好的架构）在 AI 时代价值在降低——因为 AI coding 已经很强了，以后会变得更强。

但是，Peter 也特别强调：资深工程师的 value 仍然不可被取代。最难找、也最 valuable 的人是：资深 + 拥抱 AI mindset + 有产品 sense + 懂 marketing。"以前需要 10 到 50 个这样的人，现在可能只需要 1 到 2 个。"

九、产品经理这个角色正在被"组织化"

Creo 做了一个大胆的组织决定：取消产品经理这个独立的岗位。不是因为它不重要，而是因为它太重要了以至于不能被局限在一个人身上。

陈凯解释了背后的逻辑：在大多数公司，产品经理是矛盾最集中的角色——同时要跟市场沟通、跟开发沟通，所有的对齐成本都汇聚在 PM 身上。但在 AI-first 的组织里，PM 的职责被拆解到了每一个工程师和工程管理者身上。

前提是：需要有一套机制能保证在没有 PM 的情况下，团队之间还能互相信任和协作——决策的信任成本不因为没有这个角色而变高，反而变得更低。

Peter 补充了另一个维度：未来的产品需要有产品 sense，但关键是这个人必须具备 implementation 能力——能在一到两小时内把自己的 idea 直接带进产品。"如果你需要把你的 idea 传递给另外一个人，那你交流和 alignment 的成本就远大于 implementation 的成本。"

十、复合型人才的黄金时代

一个非常明显的趋势正在出现：复合型人才——或者比较 general 的人——在 AI 环境下可以 thrive 得更好。

不管是工程师有产品 sense 和 marketing sense，还是产品经理有 implementation 能力，都会非常重要。Peter 特别提到了两个角色的未来价值：

第一是懂 implementation 的 designer——不是传统的只出图不写代码的设计师，而是能把设计直接实现到产品里的 UI/UX designer。第二是有产品 sense 的 engineer——不只是写代码，还判断 feature 的商业价值和市场反馈。

更深层的趋势是：在传统软件时代，一个"灵魂人物"产品经理可能成就一个产品。在 AI 时代，一个组织可能做出好产品被市场接受。角色本身在被"组织化"，而非"个人化"。

十一、不要把 AI 当智能——把它当系统

这是陈凯提出的一个核心认知转变，可能也是本期节目最重要的 insight："我们要把 AI 当成一个系统来看待，不要把它当成一个智能来看待。"

虽然系统是由智能所驱动的，但核心的差距在于：当 AI 或者说这个系统发生错误的时候，不要想着怎么纠正这个智能，要想着怎么弥补这个系统。前者是在跟一个黑箱较劲，后者是在搭建一层层的 guardrail 和 feedback loop。

他用了养孩子的类比来帮助理解：与其每次纠正孩子的具体错误，不如给他一套规则和价值体系，让他在规则内变得越来越好。Harness 就是在给用户提供"培训师"——弥补 AI 出错之后该怎么办。

十二、你的内容，到底被谁消费？

Clark 提出了一个被很多人忽视的现实：你生产的内容——文章、视频、marketing asset——未来的受众可能不是人，而是 AI agent。

他以自己的亲身经历举例：找 SOC 2 合规服务商时，第一步是 让 agent 先做 research，然后基于 agent 的结果再筛选。那些服务商的内容，第一层消费者已经是 agent 了。

这个趋势也在推动 SaaS 产品的转型。以前人用 dashboard 管理 task，现在团队更关心的是agent 能不能通过 MCP 和 API 来操作这些 task，prioritize 这些 task。面向人的 UI 在一个 agent 驱动的世界里，重要性在下降。

一个更深层的洞察：从人的审美来看可能不够好的内容，如果投放到市场后由 agent 读取、数据反馈回来可能更好。要根据"谁在消费你的工作结果"来调整 harness 系统——而不是固守"人觉得好不好看"的标准。

十三、转型的节奏与中小企业的机会

Creo 的转型并不是第一天就完成的。2025 年上半年，他们还处于"AI 辅助人做事"的阶段，人是主导。到了下半年，他们发现效率提升非常有限——核心问题是没有真正把生产力工具的使用者从人转变到 AI。

真正的重构发生在 2026 年 1 月——用两周时间重构了整个产品架构，Peter "一行 code 没有写"，只是 criticize AI 的 plan，AI 根据反馈给出 revised version。到现在，10 人以下的 engineering 团队支撑着整个产品。

陈凯认为，中小企业（SMB）是 AI-first 转型的第一批受益者。大企业有太多合规问题、人的因素、legacy 数据库和旧系统——规模越大，转型阻力越大。而 30 人以下的团队没有太多 legacy 包袱，最容易完成这种转变。而且，核心难点不在行业属性——科技公司还是传统公司都可以——而在于创始人是否真的相信 AI，以及是否理解转型意味着什么。

  关键区分："很多人愿意拥抱 AI 只是愿意用 AI 工具给自己提升效率。但不愿意构建一个系统让未来工作完全由 AI 驱动，自己在里面扮演的角色都发生变化。这是两种完全不一样的心态。"

十四、人在 AI 时代的不可替代价值

当 AI 能写代码、能做 planning、能自我修复 bug、能自动生成 marketing content——人还剩什么价值？

三位创始人的回答高度一致。陈凯说："技术发展方向永远是人的需求和社会的需求。只要人这个物种还存在，它的价值是不太会变化的——它定义的是需求的方向和技术迭代的方向。"

由此延伸出两个不可替代的人的价值：需求的定义和最终结果的审核。"人在需求的定义和最终的结果的审核上的价值是没有办法被取代的——除非说人作为这个物种本身的重要性已经不存在了。"

Clark 补充了更具哲学意味的一点："人未来的价值就是判断任何事情是否还有价值。"对价值的定义本身就是人最大的价值——当我们知道自己想要什么的时候，才能判断一件事情是否真的有价值。

而从工程师的角度，Peter 认为核心能力从 implement feature 变成了架构 AI 系统和维护 AI 系统。不管是 engineering 还是 marketing——怎么搭建一套能自主运行的 agent 系统，是未来最稀缺的能力。

核心金句

"真正的 AI-first 不是在现有流程上使用 AI 工具，而是围绕 AI 的能力重新构建工作流程和组织形态。" — 陈凯（CEO），论 AI-first 的本质

"我们要把 AI 当成一个系统来看待，不要把它当成一个智能来看待。AI 出错了，不要想着纠正智能，要想着弥补系统。" — 陈凯，论 harness 的核心理念

"百分之五十以上的 issue 是通过 auto-fixing 的形式进行的，人在里面的参与可能只是简单的 approve。" — Peter（CTO），论自我修复系统

"feature 现在的数量已经远远超过我们能够去卖它的这个能力了。开发速度远远超过市场进度。" — Clark（Cofounder, GTM），论供需反转

"人未来的价值就是判断任何事情是否还有价值。需求的定义和最终结果的审核——人的这两个价值没办法被取代。" — Clark & 陈凯，论人不可替代的价值

"以前搭建同样规模的 agent 系统需要 10-20 个人，现在只需要 1 个 architecture，在一周之内就能完成。" — Peter（CTO），论 AI 时代的生产力