142. 雨森的创投观察第2集:Harness、下一个字节、2026大机会和Stanley Druckenmiller
被打脸是常态
2025 年底,真格基金管理合伙人代雨森在《商业访谈录》第 124 集中预言 2026 年是"Year of R"——一个现实与回调之年。他在年前清空了所有二级市场股票。半年过去,AI 行业非但没有回调,反而更加疯狂。许多人说他的一部分观点"被打脸"了。
在短暂的内心挣扎后,代雨森决定继续录制这个系列。他说:"打脸是个常态,并且呢,如果有人怕被打脸,那永远不说,永远不判断,那绝对不会被打脸。"
他复盘了自己的判断:看对的部分是 OpenAI 的 C 端变现——订阅制难以提价,5000 万付费用户已经把愿意为 AI chatbot 付费的人群筛选了出来,广告和电商的进度也低于预期。看错的部分则是完全没预料到 Anthropic 的 coding 收入会在半年内爆发——Claude 4.5 和 4.6 带来了从量变到质变的提升。
代雨森的二级市场偶像是 Stanley Druckenmiller——索罗斯曾经的操盘手。他引用二级市场的一句格言:"strong opinion weakly held"——你要有很强的观点,但不要被自己的观点所绑架。关键在于知道你的观点是怎么来的,当支撑观点的原因发生变化时,一个真正的聪明人应该去调整自己的看法。
正如他所说:"世界本质上是个贝叶斯的世界,你前面发生的概率对后面事件判断就是有影响。"在观察到 Anthropic 用量大幅上涨、自己频繁使用 Claude Code 并获得强烈的体感之后,他加回了一些仓位——存储、光模块、CPU 等硬件瓶颈环节。
AI 模型王座的六次更迭
代雨森回顾了过去 6-8 个月中 AI 行业叙事的多次转换:2025 年 11-12 月,OpenAI 如日中天,DAU 8 亿,宣布合作股价就跳涨。12 月,Google Gemini 3 发布,大家认为 Google 凭借 TPU、算力和原生多模态成为模型之王。2026 年 1 月,Claude 的 coding 能力引起关注。3 月,Anthropic 的 Claude Code 全民爆火,二手市值超过 OpenAI,叙事变成"Anthropic 一骑绝尘"。到了 5 月,Codex 的新用户增速超过 Claude Code,GPT 5.5 表现追平——市场又开始觉得 OpenAI 卷土重来。
他的核心洞察是:头部几家模型公司并没有拉开真正的差距。谁最后发模型,谁就显得最厉害——后发就有后发优势。但如果用这个规律过度推演,也可能出问题。
为什么 Anthropic 能跑出来
代雨森在今年 3 月的硅谷之行后,形成了一个关于组织形态的判断。AI 的探索期适合自下而上的发散型组织——OpenAI 就是典型,明星研究员各自探索不同方向,Sam Altman 的角色更像天使投资人,鼓励各种小项目。但这个模式的副作用是:很多项目做出来了,上线了,然后没人管了。
而 AI 进入高速竞技期后,适合的是自上而下、价值观高度对齐的聚焦型组织。Anthropic 正是如此——他们有价值观面试,Dario 每两周写一次全员 memo,方向高度对齐。代雨森形容:"它是一个管杀也管埋的组织,OpenAI 的很多产品有点像管杀不管埋,到后面就没人维护的感觉。"
Claude Code 几十天内迭代了几十个功能,经常打开桌面端就发现又升级了。相比之下,OpenAI 的 GPTs、浏览器、Operator、Sora——这些项目有的消失了,有的没人记得了。
但代雨森也指出,这不是终局判断。如果一两年的窗口期内范式不变,Anthropic 的专注优势会很大。但如果下一个范式诞生,可能又会回到需要发散型组织的探索阶段。这恰好是他去年"Year of R"里第二个 R——Research——所关注的:硅谷 New Lab 的诞生。
智力阈值:烧到 100°C 才有蒸汽机
代雨森用一个比喻解释为什么提前预测 AI 能力的质变如此困难:"把水烧开了才有蒸汽机,那如果烧到 99 度,其实也不会有蒸汽机。但是这个道理多少度是烧开,这个提前预计我觉得是比较难的。"
把 AI 的智力从猫的智力提高到智商 80 是重大成就,但没有商业价值——就像 99°C 的水不会产生蒸汽机。一定要突破某个阈值,才会突然出现巨大的商业价值。但阈值在哪里,很难提前知道。
Claude 4.5 不叫 Claude 5,说明 Anthropic 自己对这次升级也没有那么大的预期。没有新架构,没有新训练方式——但 4.5 到 4.6 的过程带来了 coding 体验的本质变化。背后的原因,普遍认为是高质量用户 coding 数据和 agentic RL 的积累,让原本跑不起来的 agentic loop 跑起来了。
更重要的是,coding 不是一个垂直领域——它是 horizontal 的。它能加强办公室工作、医疗、研究等一切需要编程的场景。但这个认知是"做出来看到之后变得很显然,在这之前并不是那么显眼"。
Return 问题:投入→产出→结果的断裂
代雨森提出了本期最核心的分析框架:一个三步的链条——投入、产出、结果。投入端正在大规模进行——2026 年 AI 硬件端的利润达到 7000 亿美金,Anthropic 的 ARR 年底预期达到 1000 亿美金。产出端也在增加——代码产出提升 10 倍。但结果端——利润增加——还没有看到。
问题在于:Anthropic 的收入不是最终回报,而是其客户的投入。买了 100 亿美金 Token 的人,赚了多少钱?
代雨森认为,降本靠裁员——但裁员只能裁一次。硅谷大公司随时可以裁掉 15% 的冗余人员,但进一步裁就没那么简单了。就像自动驾驶解决了 80% 的高速公路驾驶场景,但还不能直接去掉人——因为还有 corner case。同样,程序员 80-90% 的工作是编程,但还有 10-20% 是沟通、协调、人与人之间的信任——这是 Agent 暂时无法替代的。
增效靠新产品——但这是个慢过程。代雨森打了一个比方:"一个组织里面能够背的锅是有限的。只要你的 AI 还不能帮你端到端地去完成一个工作的话,它可以多写十倍、一百倍的报告,但是人还是要对那个报告的结果以及它驱动的行为负责。"
他用水槽的比喻来形容当前的局面:上面有无数多想吃螃蟹的人涌进来用 AI coding,下面有很多人觉得螃蟹不好吃就离开了。但现在进来的人远多于离开的人,所以 ARR 涨得很快。漏水不堵住,增长是不可持续的。而 Hyperscaler 已经在举债建设数据中心——对回报问题解答的时间要求,反而在变短。
Harness:从"套壳"到"编排工程"
本期标题中的关键词"Harness"是代雨森讨论的核心概念。他解释说,如果以前的 AI 产品像自己开车,那么现在就像 F1 赛事——车手(模型)开得很好,但需要一群人在旁边保养、换胎、控制赛道。Harness 这个词来自马具,意思是如何让一个非常强的东西在你规定的范围内运行。
代雨森总结 Harness 的几个层次:最内层是模型本身;外面是 Context——实时信息、组织专有数据;再外面是 Agent Loop 机制——OpenClaw 的心跳机制每 30 分钟让模型检查有没有未完成的任务;最外面是 Sandbox/Runtime——给 AI 配一台持久运行的电脑。
"去年大家都在说这是套壳不重要,现在大家说啊,原来叫 harness 变得很重要。"代雨森认为,对事物的判断总是在不断变化的。
他提出了一个有力的类比:模型就像 CPU,Harness 就像操作系统。就像 Windows 出现之前,开发者要自己处理跟 CPU 的通讯;Windows 出现后,只需处理 API。三年前,AI 应用开发者要自己写 agent loop、memory、guardrail——现在 Harness 帮你处理这些,你只管做 skill。
用户对 Harness 的忠诚度高于对模型的忠诚度。他说很多朋友都有"不断抢救小龙虾"的经历——Harness 虽然强大但容易死掉,但人们会努力去救活它,因为在意的是在 Harness 里存进去的记忆。用户会在 Harness 里换模型——比如用 Kimi 0825 替代 Claude,因为"90 分的表现,20 分的价格"——但不会换 Harness。
更重要的是数据飞轮:好的 Harness 收集高质量用户交互数据,反过来训练更好的模型。Cursor 的 Composer 就是典型的例子——从一个"壳"出发,通过积累 feedback 数据配合 post-training,做出了自己的好模型。正如代雨森所说:"没有 Cursor 这个壳,就没有 Composer 这个模型。"
Agent 进入人类世界的三步走
代雨森把 AI 比作一个来到人类世界的外星人,并提出了三步走的框架:
第一步,让人类拥有更多、更好的 Agent。Claude Code、Codex、OpenClaw、Manus——都在做这件事。降低安装门槛,让更多人能低成本拥有 Agent。这是当前的主战场。
第二步,让 Agent 适应人类的数字世界。人类数字世界是为人类设计的——GUI、验证码、信用卡——AI 原来是要被阻止的对象。现在要反过来:给 Agent 发卡(Stripe/Coinbase 在做),给 Agent 办认证(Cloudflare 推出了 Agent 注册服务),用 Computer Use 和 Sandbox 让 Agent 操作人类已有的软件。就像外国人来到中国——需要 SIM 卡、微信、支付宝。
第三步,建设 Agent 专属的原生数字世界。当 Agent 无处不在时,应该有完全符合其特点的原生基础设施。Agent-native 的支付——高频、小额、多对多——跟人类的低频、点对点、大额完全不同。Agent 之间通信不需要 Excel——直接 API 传数据就够了。
代雨森还提到了一个有趣的可能性——Agent 之间的网络效应。当每个人的 Agent 都积累了独特的 context(你的访谈经验、他的投资判断、某某的 BP 分析模式),同一个任务给不同人的 Agent 做会得到不同的结果。这就会出现"我的 Agent 雇佣你的 Agent"的价值交换——1000 块是 Token 费,9000 块是专有知识溢价。这或许是 AI 领域尚未被充分开发的网络效应。
移动互联网的金科玉律正在失效
代雨森指出,移动互联网的商业模式建立在 "attention is all you need" 之上——DAU × 时长 × 变现效率 = 收入。但 Agent 时代,用户自己看着屏幕的时间已经不是最关键的指标了。更重要的是:一个 Agent 能持续完成有价值任务的时长。
如果以 DAU 为北极星指标,会出现荒谬的场景:你不得不让用户频繁上线来维持 DAU。但最好的体验恰恰相反——用户睡觉前把任务布置下去,醒来后 Agent 已经做好了。用户访问变少了,但价值变高了。
护城河也在变化。封闭的超级 App 可能反而成为软肋——用户的 Agent 访问不了微信里的信息,但能访问飞书里的信息,用户就有动力把工作群迁移到飞书。原来的护城河变成了束缚。
获客方式也变了。从 ChatGPT 到 Sora 到 Manus 到 Claude Code,领先的 AI 应用都不是靠投放和补贴砸出来的,而是靠产品给用户带来的"魔法体验"引发的自传播。
下一个字节不像字节
代雨森观察到一个现象:很多创业者和投资人都在寻找"下一个字节跳动"——一个 AI 时代的大 DAU 高变现公司。于是出现了各种"AI 信息流"产品——打开是信息流,刷 AI 生成的内容,字节系的创始人在用字节最擅长的推荐算法和买量体系。
但他的判断很直接:"在字节的游戏规则里打败字节是非常难的。把上一个时代的成功范式搬到 AI 时代,你其实反而就是在跟上个时代的冠军去竞争。"
而真正可能改变格局的产品,长得完全不像字节。OpenClaw 没有自己的 App——它活在微信、Telegram、Discord 里,去用户熟悉的地方,而不是把用户圈进来。生产力场景——从手打 Excel 到 AI 帮你做——直接带来 10x-100x 的提升,这是"简单题"。
代雨森引用了一个历史规律:每次技术革命的最大机会,不是新技术解决老问题(互联网做门户网站、移动互联网做移动浏览器),而是当技术渗透率达到一定程度后出现的全新机会(互联网诞生了社交网络和搜索引擎,移动互联网诞生了短视频和拼多多)。AI 目前还主要在"新技术解决老问题"的阶段,但已经可以隐约看到第二阶段的机会。
蒸汽机到电动机:组织变革的启示
代雨森讲了一个关于工业革命的故事:蒸汽机工厂围绕一根主轴建造——狭长形厂房,皮带把主轴的动力传到每台机器。电动机发明后,由于用电线而不是主轴传动,厂房可以建得更大、更扁平。更大的厂房才催生了流水线——福特的生产效率大幅提升。
故事的寓意是:从蒸汽机到电动机,并不会自动带来生产力提升。需要厂房的物理结构变化(更大更扁平),以及生产组织方式的变化(从一个人做很多事到一个工位做一件事)。技术到最后的结果,是一个逐渐渗透的过程——需要的组织变化是难的部分,因为组织变化是人的变化,人的变化可能要十年才会变。
这在 AI 时代同样适用。传统软件开发是瀑布式的职能分工——架构、后端、前端、测试、UI、运营。AI-native 的组织会变成几个全栈的人负责一个功能模块,从底层设计到上线运营都包了。但这不是简单"每个人装个 Cursor 就完事了"——需要组织形态的深层变化。创业公司从第一天就让 AI 参与所有经营(Cursor 用 Cursor 写,Slock 用 Slock 运转),大公司却面临着部门墙和遗留系统的阻力。
2026 年创业:Horizontal > Vertical
硅谷的主流叙事是"要做垂直 SaaS"——宠物医院预约系统这类。但代雨森认为在技术发展早期,这可能是错的。"在技术发展早期变化太快了,如果你做得太垂直的话,你是容易把自己给困进去的。当你做 horizontal 的时候,你的能力是可以去发散的。"
Manus 刚开始做的时候,并不知道 PPT 和网站会成为主要场景。他们做了通用的 agent 平台,然后自然衍生出多个应用方向。Perplexity、GenSpark、OpenClaw——这一波跑出来的 AI 应用,大多是 horizontal 的。
给创业者的两个建议:第一,做真正大幅度的创新——变化快、机会多的时候,最怕为了稳妥去跟风。缺钱可以融资,创新失败可以再来,但跟着别人跑、做不创新的事,时间就浪费了。第二,敢于做 horizontal——当技术变化很快时,horizontal 能让你承载不同场景,最早发现新的市场需求。
思考需要刻意练习
代雨森引述了 Andrej Karpathy 的一句话:"你可以外包思考,但是不能外包理解。"
他观察到,越来越多的人把思考外包给 AI——遇到问题直接问 ChatGPT,得到答案就满足了。但大脑的权重没有更新,并没有真正理解这件事。就像一直坐轮椅,腿部肌肉会萎缩——长期用 AI 代替思考,思考能力也会退化。
为此他提出了一个概念:"思想的健身房"。为了保持体魄,我们刻意去健身房锻炼;为了保持思考能力,我们也需要刻意去思考。他准备这期播客的过程,就是一次刻意练习——逼迫自己把模糊的观点讲清楚,找到论据的来源。
他也提到了一位朋友的例子——每个月烧一万美金 Token,不是浪费,而是在刻意练习用 AI 创新。这位朋友扫描每天到期的域名、注册、然后给每个域名做一个东西——像 omakase 一样,今天鱼市有什么鱼就做什么菜。代雨森自己也在和家人朋友一起用 AI 做一个健康数据对比的应用,虽然"不直接产生价值",但在过程中理解了用 Agent 协作的真正难点。
关于人类最后的堡垒,代雨森的思考经历了迭代。两年前他认为人类剩下 agency 和 taste。但后来意识到 AI 见过的数据远超人类,taste 可能也不是护城河。目前看来,最关键的是 agency——知道要做什么、想改变什么、能问出好问题。正如他所说:"AI 毁灭旧价值的速度是远高于创造新价值的速度的。"但创造新价值——新药物、新发现、新需求——恰恰需要人类去想象、去定义。