张月光创业两年首次访谈:妙鸭不是AI Native产品、流程到上下文设计、One Way Door和乙女游戏
为什么这期值得听
创造现象级产品的当事人亲口说:妙鸭其实是互联网思维×AI能力的产物,不是AI原生。
十年产品经理总结出互联网产品设计与AI Native产品设计的核心范式差异。
"90分等于0分"——要真正迈过那条用户不需要二次编辑的线。
端到端替代人工 vs 帮你做到做不到的事。他选了后者。
为什么AI游戏只能做乙女向?IP跷跷板效应揭示大厂卷不了的赛道。
二十年内容行业铁律:为什么Sora永远不可能是新抖音。
鸭川之夜:一杯啤酒,决定十年
2023年10月1日,日本京都。夜里的鸭川边,张月光一个人从凌晨两点坐到五点,拿了一罐啤酒。这一年他35岁,刚刚创造了妙鸭相机这个现象级产品——上线三个月,日收入突破百万,大几百万付费用户,社交媒体疯传。但就在产品最火的时候,他做了一个大多数人难以理解的决定:辞职。
那一夜他回看了自己过去十几年的职业生涯——支付宝转账、字节红包、相册工具、图像工具、社交产品、短视频、长视频内容、AI写真。做了很多类型的产品,但回头看,没有长坡厚雪。身边的人换了一拨又一拨,做的事也换了一项又一项。
当时他给自己立了一个flag:"我想35岁到45岁,跟同一群人做同一件事情。"在大厂,这件事不受你控制——你当然可以和老板沟通规划,但"迎接变化、拥抱变化是一个大厂人的基本素质"。想要实现这个目标,只能自己组织,自己要做什么事、跟什么人在一起。
张月光描述了一种"原则的力量"——当你定了一个基本原则,很多事情就都不需要讨论了。"你再给我升个P10,再给我涨薪,再给我什么奖金——这都不在讨论范围内。因为大概率上,它无法满足那个'十年同一群人同一件事'的要求了。"在阿里时,30岁他就已经是P9,按大厂打怪升级的标准,速度相当快。但他说,"我并不是很擅长这个游戏,也并不是很喜欢。"
妙鸭的真相:不是AI Native产品
这是整个访谈中最令人意外的论断。创造了2023年最知名AI消费产品的人,事隔两年后说:"它不是一个AI Native产品。它是一个在用互联网思维把当时的AI技术发挥得很好的产品。"
在张月光的定义里,妙鸭的本质是一个写真生意,而不是图像产品。"我压根跟美图就不在一桌,我是跟海马体一桌的。它是一个新消费品牌。"这个定位解释了妙鸭上线后的许多操作——给用户写一封手写信、每一句文案亲自review、产品里没有任何地方出现"AI"这个词、第一时间找品牌做联名(携程旅拍、同道大叔星座)。
技术上,妙鸭的成功也来自一个巧妙的工程决策。"我们发现你很难同时让模型做到真、像、美三件事情,在当时技术上几乎不可行。"于是他们用了三个模型串行工作——一个负责"真"(训练大量普通人照片,包括光线不好、有些模糊的日常照片),一个负责"像"(人脸识别和ID保持),一个负责"美"(用户选择的模板)。张月光称这个方案为"三个小矮人拼在一起"。
如果继续做下去,张月光的计划是:第一,把九块九变成九十九——加入人工服务,提供定制化模板和风格。"一旦用户知道有人在为我服务,九十九就变得很正常了。而九十九比起海马体的六百九十九,还是便宜了很多。"第二,杀到线下去开快闪店——利用写真品牌的慢周转和高人力成本的弱点,直接在线下截流。"写真是一个低频次的生意,核心竞争手段一定是品牌心智——用户一想到写真会想到谁,最后只会留下一个。"
从流程设计到上下文设计:AI Native的核心范式迁移
这个观察来自张月光两年的痛苦摸索。"互联网产品设计和AI native产品设计,真的是有一个很重要的范式变化。"
在互联网时代,产品设计是面向流程的。你定义用户的使用路径——打开App、看到什么、点什么、进入到哪个页面——然后按照需求→设计→开发的线性流程推进。这是一种确定性体验设计。
但在AI时代,张月光认为产品设计变成了面向context(上下文)的。核心逻辑是先不定义交互流程,而是先去打磨最小生成单元的效果。"等这个效果调得非常明白了,你就知道用户在进入这个环节之前必须把什么context给你——不然我达不到这个效果。然后你再去设计流程,你要按照什么步骤把这些context给我。"
他描述了一种"两段式组织":第一阶段,团队搞清楚模型用来干什么,需要用户提供什么context;第二阶段,产品经理设计流程去获取这些context,设计师配合实现这个流程,再进入正式开发。这完全颠倒了传统产品开发的顺序——"效果优先,交互后置"。
这个认知来自一次具体的失败。在做Doky(AI PPT产品)时,团队一开始面向过程开发——先把交互做出来,用户怎么用、怎么跟Agent协作,全部开发完了。结果效果特别差。"大家开了个会,研究了半天,最后换了模式——先不管产品交互长什么样,就先去打磨最小生成单元。"设计团队定义什么是美的,技术团队解决布局和溢出问题,产品团队注入知识。等效果调明白了,再反推交互。
作者概括:这本质上是把产品的"质量瓶颈"从交互流程转移到了AI能力输出本身。互联网产品是"流程定义质量";AI Native产品是"AI能力定义流程"。
第一次创业的觉醒与困惑
张月光的第一次创业是2018年离开字节后。一开始想做短视频电商——基于一个宏大的判断:信息媒介正在从文字到图片再到短视频迭代,这不是简单的内容迁移,而是整个互联网基础设施的变化。但切入点不好,"想再造一个卖货的抖音"。今天回头看,"更正确的做法是去做内容,因为短视频卖货这件事是在短视频平台自身的延长线上"。
后来转型做了一款名为"原因"的产品——Live2D换装社交应用。团队最高做到近10万DAU,有用户真实付费。那是他第一次"真正感受到用户"。"在大厂做产品,你更多看到的是数据。字节做红包项目,一天后台新增500万用户,所有人很兴奋——但它只是个数字。"但在原因这个产品里,"你会看到这些人活生生地在你的QQ群里,每天在非常热情地讨论你的产品。你知道他们每个人多大、在说些什么、为什么喜欢你,甚至知道他们捏的形象长什么样。"
最触动他的记忆是决定关停产品的那天:"所有用户就自发发起守夜活动。夜里12点停服,所有人就在群里非常活跃,一起守夜,一起熬到12点等关服。真的关了服之后,所有人又跑到应用商店里去写小作文,来纪念这个产品。"
但这次创业最终以困惑收场。"到最后挺困惑的,不知道自己为什么要创业。"他反思,自己出发时内心深处的真正理由是"我要证明自己很牛,我要出名,我要让别人都看到我是个特别牛的人"。这个目标被现实否定了,但他当时没有找到另一个动机来替代它。
创业动机的两种好理由
张月光对创业动机有一个异常冷静的"期望收益分析"。
他认为真正的好理由只有两个。第一种:"你就想当老板,不想给别人打工。那你创业的第一天就成功了,期望收益是百分之百。哪怕这公司最后很不怎么地,听上去很low,但这是一个很好的创业理由。"
第二种:"你特别想要让一件事发生。你甚至就算没让它发生,让别人让它发生了,你也觉得很好。你参与到了一个宏伟的命题里去。最后就两个可能——你做成了当然很好;你没做成,但别人做成了,你也不算输。"
反过来,想发财和想证明自己,从期望收益的角度都是差选择。"想发财肯定不如在大厂。想证明自己,你做到大厂高管也挺能证明自己的,很多人都会认识你,非常respect你。创业证明自己的概率×收益,期望很差。"
作者概括:这是产品经理的"减法思维"——去掉所有表面漂亮的理由,找到真正能支撑长期投入的底层动机。不是道德判断,而是概率计算。
外部游戏 vs 内部游戏
张月光对"大厂人的两种活法"有一个生动的二分法。外部游戏是你打赢市场——拿下某个战役,增长、营收、市场份额,结果明确是你打的。内部游戏则是你打赢身边人——361评估里永远成为那个"3",只要跑赢同事就能晋级。
"45678910这样的游戏,会让绝大部分人变成向内作战的人。这是大厂待了很多年之后很难克服的地心引力。你只要有这套体系,人很难免地想去用内部游戏去赢。"
但他指出,外部游戏需要周期。"你刚开始工作那几年,移动互联网是黄金周期——大家经常比喻叫'在电梯上做俯卧撑',因为电梯在往上走。但从19年之后,互联网很久没有出现过真正意义上能改变很多事情的产品。"AI的出现,重新打开了外部游戏的可能性。
张月光自己即使在阿里管理近300人的团队时,也"几乎每年坚持着要做一款新产品。很多最后也不行,因为各种原因不行。但我底层的快乐就在于创造产品。如果不让我创造产品,只玩内部游戏,我会很无聊。"
AI陪伴赛道:三个通病与游戏化解法
张月光对AI陪伴赛道有一套完整的分析框架。首先,他确认了两个事实:AI陪伴的DAU(国内+海外)能达到千万级——除了通用Chatbot以外没有几个赛道能做到;这些公司都收到了钱,有些甚至已经打平或微赚。结论是:"这是一个带有商业价值的真实的用户需求。"
那么为什么没有彻底爆发?他总结了三个行业通病。第一,用户门槛过高。"跟一个对话框聊天,通过文字加简单AI图片就要获得快乐——这对用户的要求非常高,需要极大想象力和表达能力。"成年人随着年龄增长越来越具象,不再像小孩子拿一堆麻将牌就能当坦克打。这导致了用户低龄化和圈层化。第二,商业模式差。只能收token费,而token很难卖出高溢价,毛利率差。第三,角色无法成长。AI角色永远不变,"聊十天就会发现这个问题——长期留存在单个角色上是不可能的"。
而做成游戏,恰好天然解决这三个问题:PGC内容替代UGC创作,降低了使用门槛(被动消费也能获得快乐);游戏自带成熟的付费体系;PGC角色背后有团队持续更新内容。"做游戏这个事,在我们公司成立的第一天就开始做了——因为19年我看到《早安少年》那个产品时就在想,这东西要是能自由对话就好了。现在AI真的实现了。"
星棉:AI乙女游戏的逻辑
张月光的游戏产品叫"星棉"——一款面向女性用户的AI乙女游戏。首次内测2000个名额一天秒爆满,小红书官方号当天破万粉,七天留存数据"非常惊人",用户时长"非常吓人"。最打动他的是关服场景:"所有的人都守在手机前面,跟男主聊天告别,声泪俱下。后端聊天数据咣咣咣往上涨。所有人又去小红书发帖,发各种聊天截图,非常感慨,非常喜欢。"
这重现了他做"原因"时最深刻的记忆——用户守夜等关服。而他选这个方向,有清晰的竞争判断。内容型游戏天然长周期(最少做一年半),大厂的管理机制天然不利——"你总不能弄得很模糊,你这里模糊了其他团队怎么办?清晰这件事对大厂很重要。"而清晰就意味着快反馈。游戏是慢反馈,天然在大厂的不舒适区。
更重要的是IP定位的差异。张月光提出了一个"跷跷板效应":"任何一个IP都有四个要素——价值观内核、视觉包装、作品表达、用户交互。而视觉包装/作品表达与用户交互之间,天然此消彼长。越贵的IP,一定要更低频次、更高质量的内容表达,但降低用户交互频次。"说人话就是:"大明星不能老出来,不然人设就崩了。爱马仕永远不会上电商直播。"
今天的乙女游戏(比如恋与深空)全是造大明星的逻辑——单向输出昂贵内容。而AI带来的机会是创造"以互动性为优先的IP"——让用户看得见、摸得着,每天都能对话。这是两种不同的物种,所以恋与深空不可能直接加一个AI聊天功能——那等于给王一博做一个AI让所有人随便聊,会毁了人设。它必须另外开一个产品。
新媒介×新交互=新平台
这是张月光认为"二十年没有人打破过的规律":新的内容平台机会只来自于新的信息媒介与新的交互形式的配对。
Twitter发明了140字短文字+Feed流。Instagram是大图+单列流。小红书是图文笔记+双列流。抖音是短视频+上下滑。长视频和短视频"压根不是一个东西",小红书的图文和微博的图文"也不是一个东西"——媒介之间的差异非常微妙,每一种媒介形式都有它最适合承载的内容和最适合的交互。
用这个框架看AI时代:ChatGPT是一种新媒介——流式生成的、实时输出的内容,人类以前从没见过。配对的交互是对话。所以ChatGPT一定是个平台。"它本身跟信息已经有了双边网络效应——今天绝大多数人用ChatGPT的一个重要use case就是搜索,它连接了你和它背后搜到的信息。这只是没有人对人的双边网络,但它已经是网络了。"
Sora则相反——它没有定义新媒介,也没有新交互。"这就是为什么Sora永远不可能是新抖音。"
张月光还提出了一个令人不安的ChatGPT商业模式猜想:不是广告,而是长程决策控制。"抖音剥夺了你的信息自主权——你完全不能决策自己要看什么信息,它推给你。AI有机会剥夺你的自主决策权——你什么事都会问大模型,这个习惯会越来越深,最终你会放弃掉自主决策这件事。它不是在你做决策那一刻才给你推广告,而是预判你未来的重要商业决策,用长周期操控你的决策。"
探索与试错:那些没走通的路
在形成"Agent帮人突破能力边界"这个最终方向之前,张月光的团队花了一年多时间摸索了多个方向。
播客实验:核心猜想是"为什么音频这么长能不能变短"——用大模型的语音交互能力做一个"用嘴刷的抖音"。团队很快做了产品,用了三四个月,但最终没有找到原生于此交互的短音频内容。后来他意识到一个更根本的问题:音频是伴随性媒介。人听音频时,视觉信号占据了80%以上的注意力——你在干别的事,信息带宽本来就很有限。如果把音频搞得更短、节奏更快、信息密度更大,人反而接受不了。
信息推送实验:核心猜想是用AI把内容打散成原子信息再重组推送。但发现两个致命问题:第一,真正有价值的信息已经有人工在整理了——AI做的内容跟科技媒体、早间播客的重合度极高;没人碰的信息又太边缘。第二,"信息分发的商业模式建立在消耗注意力上——我占据你越多时间,就越有商业价值。做一个save time的信息分发产品,直接背离了商业模式。"
这些试错中,张月光保持了极其克制的心态。"不知道的时候就是不知道。那这种情况之下,我们做这个东西就是做实验。发现猜想有漏洞,就换个猜想再试试。我们前面的几个产品都是类似这样的状态。"他同时也说,如果公司的钱亏在这些事上,他"绝对不认"——所以资源投入都控制在最低水平。
Agent的两种价值取向
在张月光看来,当前Agent领域存在两种截然不同的价值取向。
第一种是端到端替代——让AI替你做完一件事,节省你的时间,甚至替代人工。这是硅谷的主流叙事,也是Manus的核心定位。"大家一想到Agent,所有文章都是一句话:几分钟搞定一个什么东西。包括并行一百个任务、wide research——它都走向一个让AI端到端替你完成的方向。"token消耗量越大越成功,因为说明AI在替你干越多的活。
张月光选择的是第二种——帮你做到你本来做不到的事情。人机协作、持续交互。"我可能喜欢的是结果速度特别快,持续在一起协作。你给我一个反馈,我马上再给你一个反馈——这是一个更能走向让用户感觉自己具备了本来不具备的能力的范式。"他特别在意延迟:"能给AI输入了一个命令,执行这个事能不能尽快把结果给我,因为我还得再处理一轮,我要跟它不停地处理。"
他认为如果自己是大模型公司,也会选第一条路——端到端替代,因为"想象力大太多了,它可以突破人的限制,它的定价也会突破工具的限制"。但反过来作为应用公司,他可以做第二条路——"人本主义"的事情。"甚至也许这就是个阶段性的生意。如果真的人不再参与社会生产了,那讨论创业讨论商业都没意义了。你只能假定它不发生。"
单向门产品哲学:90分等于0分
这是张月光最核心的产品信条。"九十分等于零分。你必须到一百分。什么叫九十分?人一眼就看出来这是AI,没有办法真的在实际流程当中达到使用的水平。即使你达到了90分,还是零分——成本再低,价值仍然非常受限。"
妙鸭的成功证明了这一点。"我不是the first,但我是第一个迈过那条线的人。一旦越过那条线——大家没人看出来这是AI做的图,跟海马体拍出来的一样,甚至很多人觉得比海马体更好看——你成本的巨大优势就显现出来了。"
他对今天的AI PPT市场有个判断:还没有人迈过那条线。无论是套模板凑内容的方案,还是前端代码生成PPT的方案,还是Banana那种用图生成PPT的方案——每种方案都有各自的致命缺陷。"我总不能拿一个一眼就是AI做的东西出去给人家看的。老板让我汇报,我拿这个立马把我开除了。"
而他自己用Doky做的PPT,"真的一点没再做二次编辑,拿出去讲,别人完全没意识到这是AI做的。"他去百度世界大会分享,用的PPT是Doky做的,套了百度的大会模板,讲完之后没人发现是AI生成的。这就是他的目标状态——单向门。
作者概括:"单向门"(one-way door)这个比喻非常精准——进去就不需要再出来改。用户完成一个任务,不需要再打开其他工具做二次加工。这不仅仅是技术问题,更是产品哲学的根基。
后发者的竞争策略
张月光对AI行业的发展阶段有一个清晰的判断。他用技术采用生命周期理论来看——极客期→尝鲜期→实用期→落后者的卷入期。"AI到2026年,一定是进入第三个周期了。大家开始回答的关键问题是:你到底有什么用,你到底能不能解决问题。"
这也解释了为什么"The first XXX"这种营销方式越来越不好用。"词儿越来越大,现在基本都得OS级了,OS以下的词大家都懒得听了。但OS也没有用。大家不会因为'喜闻乐见'这件事传播了。"他引用了一个喜欢的理论框架——传播三个阶段:与我有关→对我有用→喜闻乐见。AI已经过了"喜闻乐见"的阶段。
作为PPT赛道的后来者("别说the first了,快成the last了"),他的策略很简单:在一个已经PMF的赛道上,不去回答What和Why(不需要),专注回答How(怎么比别人做得好)。"如果你真的非常清楚地告诉大家为什么你比别人好,它的传播效率未必比'我什么都能干'差。"
这其实也是他对"餐桌选择"战略的贯彻。Agent是一张"人强钱多"的桌子——赛道拥挤,大玩家都在。星棉是一张相对舒适的桌子——知道大厂卷不了。两桌同时打,不把鸡蛋放一个篮子里,同时尊重每张桌子的游戏规则。
Manus被Meta收购的启示
访谈进行时,Manus刚刚以约20亿美元的价格卖给了Meta。张月光对这个收购的逻辑分析非常冷静。
"站在Meta的角度,这是一个好的交易。它买到了一个范式的代表。今天你在这个范式里找不到更好的标的。这个范式的威力还没有被发挥到最大——你先买今天最头部的,等着范式进一步扩展。20亿美金也不贵,一亿美金20倍PS,今天大模型的估值都在打很大很大的折扣。"
对他自己的创业而言,这件事发出了两个信号。第一,Agent这条路更对了——"我已经非常相信它是对的了,但看到Meta去买它,进一步确认了这一点。"第二,也是更重要的:今天硅谷讲的所有Agent故事,都是端到端替代的故事——不是他想做的Agent的故事。"这是件好事。好像大家都没有在卷我想做的Agent。"
他承认:这不代表端到端替代不会发生。"如果真发生了,其实还蛮剧烈的。马斯克说的那种——以后钱都没有意义了,没有人会工作了,只有能源才有意义。这已经跳出商业范畴了,进入社会变革的范畴了。"但在那之前,他选择走自己的路。
人才哲学:Will vs Skill
张月光的团队由两拨人组成:一半是大厂出身,一半是独立开发者和有调性的创业公司来的人。这种混合不是偶然,而是有意设计。
"在AI时代,专业技能的降级化是一个大家都在讨论的话题。你原来是个很资深的某某,有大量技能部分是别人不具备的。但今天这个部分的重要性在逐渐下降。而你的多元化品味、博学程度——你的广度——正在决定团队的核心竞争力。"
他总结了一句话:"人应该负责will(意志、意图),AI负责skill(技能)。will这个里面的广度、多元性、品味,会变成一个人、一个团队的核心竞争力。"
大厂的人带来规范性、执行力、使命必达。"真正拿过结果的人都有这方面的素养。"独立开发者带来灵活思维、多面手的能力——"天然不会特别专精在一类技术上,又要做开发又要做设计又要做产品,品味非常综合。"有调性的创业公司来的人,品味特别好——"不管是审美品味、产品品味,甚至营销品味。"
他也刻意避免"全是前同事"的团队构成。"全部都是认识的人,容易产生思想趋同性。后面新加入的优秀人才也会增加融入和归属感的困难——你们都互相认识,我来了能不能融入?"
语言就是智能的终点
访谈末尾,主持人提到了工作室的名字——"语言即世界工作室"。张月光对此有强烈的共鸣。
"我的第一反应是,你还挺抓住了'语言就是智能的本质'这个事的。"
他回应了LeCun关于"语言无法达到智能终点"的观点:"我觉得语言就是智能的终点。人们在说今天的语言大模型就是在predict next token——你怎么知道你现在说的话不是predict next token呢?你大脑可能就是这么运转的。你自以为自己很有逻辑,但实际上你不是先在脑海里形成了一套什么逻辑才把这个话说出来的。你是很自然地就把这个token predict出来的。你甚至已经说完了,你在读你这段说的话的时候,你可以说,哦我当时是这个逻辑。"
关于Agent的架构,他也有明确判断:至少在今天,LLM才是Agent的内核。"只有LLM真正能够实现所谓的智力——基于用户的意图,正确地去理解、拆解、使用工具。多模态模型不能替代LLM做这个内核。脑子还得是大语言模型。"