Tokenmaxxing · 把电机塞进蒸汽机 · 接力赛变篮球赛 · 孤独 · 人的连接
Freda Duan 是 Ultimate Capital 的合伙人——这家硅谷科技基金横跨一二级市场,在一级市场投了 OpenAI、Anthropic、字节跳动,在二级市场持有英伟达、存储芯片、Snowflake、Robinhood。这是她第二次做客小君的商业访谈录。如果说第一集是给美国明星公司"算了算账",那这一集走得更深也更宽——从 Token 经济学的底层逻辑,到 Anthropic 为什么这次可能真的甩开对手,到 AI 时代组织架构为什么必须从"接力赛"变成"篮球赛",再到投资人的真实焦虑和人与人之间还剩下什么。以下六个维度,每一个都值得细读。
Freda 认为,AI 时代出现了几个新的计量单位——dollar per FLOP、dollar per Watt、dollar per Token——而现在最常用的是 dollar per Token。她把它类比为工业时代的 dollar per kilowatt hour(千瓦时成本),比较的是能耗产出比。
但 Token 也是最容易误导人的单位。因为"token 和 token 不是一回事"。核心变量是 Token per Task:同一个任务,不同模型消耗的 Token 可以差几十倍甚至上百倍。
她拆了三个原因:第一,输出长度——好模型一两百行精炼代码就完成,弱模型需要写几千行;第二,隐藏的 reasoning tokens——不同模型在回答前做中间推理的量差异极大;第三,agentic workflow 会像放大器一样进一步放大这个差距。
Freda 有一个很强的判断:行业会逐渐理性起来,按 Token 收费的模式一定会变。Token 本身不可比——"好像你在工业时代的时候你不会去真的炫耀说我一个灯我耗电耗特别多,反而你会去购买可能贵一点的 LED"。
她举了 Sierra 的例子——这是一家做 AI 客服的公司,完全按效果收费:AI 解决了问题、没转人工 → 收钱;转了人工 → 不收钱。不同复杂度、不同解决度对应不同单价。作为客户,跟 Sierra 是 interest-aligned 的——都想解决问题,都想少烧 Token。
哪些场景会先转向效果付费?Freda 的判断是:客服解决率、销售转化、催收贷款、保险理赔——这些可以量化结果的场景会先变。而写作等创意类工作,效果难量化,可能长期还是按 Token 收费。
过去两年,硅谷的默认假设是"模型领先地位每隔几个月就会换一次手"——Gemini → OpenAI → Anthropic → 下一个?但 Freda 说,这一两个月,她第一次开始质疑这个假设。
核心原因是 coding agent 的成熟触发了一个关键的正向循环。半年前,coding 模型对工程师全要素生产率的提升只有 5%;去年底到了 15%-20%;现在远超 20%。模型大厂一个月就能出一个新版本。
这解释了 Meta 为什么愿意花几十亿美元用别家模型——没有这个东西,迭代速度真的会比别人慢一大档。各家的反应也在验证:OpenAI 把 coding 推到极高位置做了重大重组,Google 的 Sergey 亲自管 coding,xAI 公开收购 Cursor。
这是 Dario 提出的经典概念,Freda 把它翻译成了投资人的语言:如果你去年训练模型的成本是 1,今年模型能带来约 3-4 的收入,毛利 50% 就是不到 2——但今年训练成本至少是 3,加上销售和人力,利润就是负的。只要训练成本每年几倍增长,生意就会像"负向滚雪球"一样越滚越负。
Dario 原来的判断是:要跳出这个循环,只能靠训练 scaling 变慢。但最近几个月证明了 另一条路:如果收入增长斜率比训练成本更陡峭——不是 3 倍,而是远高于 3 倍——公司就会突然盈利。Anthropic 年初需求突然爆发,算力被迫向推理倾斜,"突然一下就暴利了"。
Freda 认为,市场——包括她自己——都系统性地低估了模型公司的收入天花板。
之前大家觉得每个 Gigawatt 对应约 100 亿美元收入就不错了。但这几个月证明:推理和训练成本端每个 GW 对应 100 亿没问题,但收入端可以飙得非常高——100 亿?500 亿?现在看来都有可能。
这带来的推论是:Anthropic 和 OpenAI 今年底加起来看 2000 亿美元的收入体量,也不是特别奇怪。投资人正在"锻炼自己脑子去习惯更大的数字和 upside surprises"。
Freda 诚实复盘了投资人当初对 coding 市场的严重低估。一两年前,大家用价格乘以量:美国有四五百万 developer——一个很小的群体。价格方面,有人说 20 刀/月,有人说 200 刀/月——因为整个软件订阅也就一两万块。算出来大约是一个 100 亿美元的市场。
现实是:今天 Anthropic 一家的收入就远超 100 亿。 真正的 TAM 不是"有多少 developer",而是"任何可以被计算机操作的事情"。Dario 的投资 PPT 第一页写的就是全球白领的 TAM——三四十万亿美元。随着世界越来越数字化,这个范围在持续扩张。
Freda 讲了一个让她震撼的对比。传统软件公司——ServiceNow、Adobe 三四万人,Salesforce 七八万人——销售和营销占收入 40%-50%。每个员工大约对应 50 万美元收入。
Anthropic 也是一家 To B 公司——80% 是企业用户。但员工只有 3000 人,没有一个正经的销售团队。每个员工对应 上千万美元收入——差了整整一个数量级。Cowork 这么成功的产品,就两个人做出来。
这让 Freda 开始反思:"是不是说用户真的对智能的需求是无限的,是不是我们之前有点过于去强调销售的重要性?" 以及——AI 来了之后,为什么像 Meta 这样的高效公司还需要八万人?
Freda 认为 AI 现在的阶段,就像当年电力革命初期——电灯泡发明了,但社会生产力用了 40 年才真正提升。中间甚至有 20-30 年生产力反而降了一点。原因是:工厂只是把蒸汽机拆掉、把电机塞进同一个位置,工厂还是垂直设计的。直到流水线出现、围绕电力重新设计工厂,生产力才上去。
计算机革命也有类似的"生产力悖论":80 年代电脑就已在办公室广泛使用,但宏观生产力没有任何提升,直到 90 年代中后期,沃尔玛、亚马逊围绕计算机和网络重新设计了业务(ERP、供应链、数据库),生产力才一下子蹿上去。
Freda 从第一性原理追问:公司为什么长成今天这样?层级不只是权力结构——它更深层的功能是信息传递机制。 CEO 的信号 → 各层 managers 综合、提炼 → 一层层传递下去。基层信息 → managers 翻译、拆解 → 层层上报。所有会议、同步、对齐——本质上都是"信息搬运机制",因为人和人之间传输成本高。
在科技公司尤其明显。一个产品从 PM 写 PRD → designer 解读 → developer 开发(数周/数月)→ QA(数周)→ go-to-market → 端到端可能 6 个月过去了。"里面很多其实都是翻译成本——一个人把另外一个人到底想做什么,翻译成大家能理解的东西。"
AI 进来之后,每个环节都会变成新的 bottleneck——像打地鼠一样。改完 developer 发现 QA 不行了,改完 QA 发现 PM 又成了瓶颈。"我觉得实际上是整个流程都需要重新设计。"
Freda 的判断:"其实都有一点点是时间问题了。"但死亡顺序有规律可循。最先死的是 UI 价值型——核心价值就是精美 UI 的 point solutions,如电子签、项目管理、BI 工具,受冲击最大最彻底。其次是数据结构规整型——像 Monday 这种项目管理工具,每行是固定任务对象,每列固定,最容易被 AI 取代。最难替代的反而是 Excel——每个格子语义完全不一样(名字、数字、公式混在一起),反而很难被 AI 直接替代。
但让 Freda 意外的是,连她自己也发现 data warehouse 不一定安全。过去需要写精准 SQL 调取数据,现在用模型 + Cloud Skills + 直接 call Bloomberg API——"几秒钟的 Token 消耗就能完成分析,setup 成本几乎是零。"
AI 时代软件的真正新机会在哪?Freda 认为:去处理以前企业决策过程中 "没有被记下来的部分"——为什么给这个客户打 25% 的折扣而不是 30%?谁说服了谁?CFO 有什么顾虑?这些 unstructured data 以前无法记录,AI 可以直接处理原始信息。
Freda 在实践中发现,Agent 和人的需求完全不同。现有的基础设施是为人类设计的。
Slack vs Discord:Slack 基于 HTTP(请求-响应),对人够用,对 Agent 非常难用。Discord 基于 WebSocket(持久连接、实时在线),Agent 用得"非常顺手"。"如果说哪个模型公司把 Discord 收购了,也不奇怪。"
Email:Gmail API 对发送频率有限制——对人够用,对 Agent 完全不够,容易被 detect 和 block。于是出现了 AgentMail。
Phone、Identity、Payment:Agent 也需要手机号、身份认证、支付能力——这些基础设施都在被重新做一遍,AgentPhone 等创业公司涌现。Freda 认为,之后所有基础设施——browser、identity、payment、compliance——都会被重新做一遍。
"硅谷这几个月肯定就是 New Labs——真的是能有 100 家 New Labs。"从 AI Lab 出来的研究员自己开的新 Lab。原因很简单:OpenAI 和 Anthropic 涨到了接近一万亿美元的估值,投资人会想"拿着它还能赚多少"——而任何一家 New Lab 能博到几倍收益,就非常值得投。
从 VC 的角度,这是一个简单的数学问题。每家 New Lab 融资金额都比较大,VC 不能全投,也不能只投一家(选不出来)。典型策略是投 4-5 家,每家 5000 万,总投资约 2 亿——只要有一家有几倍收益就够了。大基金玩得起,小基金不一定。
另外两个同样火的方向:任何跟推理或能让模型降价的创业公司;给 Agent 做基础设施的创业公司。
Freda 最担心的事:到 2027 年,几家大云厂商的自由现金流将全部转负——整个行业超过一万亿美元的资本开支,而且只是表内数字。每家都签了长协,capex 预测只会上修不会下修。
云厂商也不是没有回报——Google 今年约 2000 亿 capex,云收入约 1000 亿,约两年回本。Amazon 也类似。但云的生意本身在变差:竞争变多(xAI 等 new clouds 涌现),价值链被分走(云之前卖上层高 margin 软件,现在那块价值被模型公司拿走)。几家云厂商加起来已有 2 万亿美元收入储备,超过一大半是 OpenAI 和 Anthropic 的长期算力订单。
芯片格局也在变化:Google TPU 从不对外卖到开始把硬件直接卖给客户——"这可能是它过去十年战略里面最重要的变化"。Amazon Trainium 财报报出来 200 多个 billion 的收入——已经是一个独立芯片公司的规模。
从几十亿的数字,切换到一个人的深夜。Freda 说她做科技投资,"你肯定每出一个新的东西,都应该自己上手去用一下,才能对投资做判断。"但事实就是东西太多太快。
每天打开 Twitter 都是"you have to look at this"、"this is changing my life"——"你就有一种就是又有新东西了,然后我又落后了,我又没跟上这种感觉。" 焦虑的本质,是对未来不确定性的恐惧。而媒体和个人也在无意中放大这种焦虑——"你这周烧了多少 Token?""你有几个 OpenClaw?"——新名词叠加上裁员的恐惧,确实是一个很糟的状态。
但 Freda 也说,不希望把这个说得太重——"确实每天感受到的也不只是焦虑,还有一种莫名的激动。就突然好像什么事情都可以做了。因为变化的过程中你机会越多,投资也是最有希望的时候。"
Freda 讲了一个让她自己都感到震撼的变化:以前她非常喜欢约人聊,30 分钟之内从领域顶尖的人那里拿到非常高浓度的知识,"那种感觉是非常爽的"。但现在——
不是优越感,是真切的感受:"以信息交换为目的的对话,这个意义是在快速地被掏空的。" 这让 Freda 重新思考"见面"的意义。她最近在 Palo Alto 跟一个朋友随便坐下来聊——没有准备聊什么大事,聊着聊着话题跑到了做事情的勇气、人生的遗憾、什么让她觉得有 spark。
她已经在心里划了一条清晰的线:信息、知识、分析——交给 AI。 观察别人、聊聊心路历程、聊一些真诚的甚至之前不会聊的东西——留给人。 "不然的话也确实是浪费两个人的时间,那可能两个人都去跟 AI 聊一聊会效果更好。"
小君做了点睛之笔:这和工作室的名字"语言及世界"遥相呼应。语言在历史上一直被用来传递信息——这部分工作 AI 会做掉。但语言还会被用来真正建立人与人之间的联系——这个是会越来越宝贵的。
Freda 让 AI 回顾了几百年的技术变革史——从英国动力织布机摧毁手工织布,到美国农业人口从 40% 降到 1%,到电话接线员大几十万人全部自动化,到铁锈带和中国加入 WTO。
这次到底一样还是不一样?Freda 认为关键看速度和广度。历史上的转型往往花了几十年甚至上百年,AI 的扩散速度会快很多。广度上,这次白领受影响——但之前农业的规模其实差不多。真正下判断非常难。
她援引 Druckenmiller 的态度:如果你抱定"AI 肯定导致裁员和通缩"的想法,你是 arrogant 而且不是 open-minded 的。"strong opinions loosely held"——未来本来就是不能完全被掌控的。 在投资上能做的是:知道市场主流是什么,同时也看到别人还没看到的路径,提前做好心理准备。当剧情不管按哪条路展开,在心理和组合上都能快速调整。
Freda 最后说了一段让她前面所有的宏大分析都"不作数"的话——也许这才是这期节目最诚实的部分:
当下的时代窗口其实很好:大厂不再是绝对安全;融资容易;coding 让做事变快;新需求多,格局未定。"大家都叫这个是什么第四次工业革命一个大时代——所以去做点新的东西本身也不丢人。"
这期对谈里最值得记住的几句——每条都能在 transcript 里找到出处: