全球大模型第一股的上市访谈:和智谱CEO张鹏聊"敢问路在何方"

🎙️ 张小俊商业访谈录 👤 嘉宾:张鹏(智谱CEO) 📅 2026年1月 ⏱️ 2小时27分钟

2026年1月8日,智谱正式登陆港交所,成为全球第一家上市的大模型公司。就在这个历史性时刻的前几天,智谱CEO张鹏在一次出差途中摔断了跟腱,拄着拐杖来到了访谈现场。"Break a leg"——这句西方俚语,字面意思是"摔断一条腿",实际含义是"祝你好运"。几天之后,这个祝福应验了。

这场三小时的长谈,张鹏回顾了从清华实验室到港交所的六年半完整历程——一个关于技术信仰、商业选择、和在中国做AI的独特叙事。

全球大模型第一股
比OpenAI更早完成IPO,为整个行业树立了里程碑
六年半创业全历程
从清华实验室到百家客户,完整复盘中国大模型创业史
技术路线抉择
GPT-3分水岭、GLM架构设计、Scaling Law的演变与不迷信
商业化真经
To B vs To C的决断、开源策略的得失、中国市场的特殊逻辑
DeepSeek冲击与反思
2025年春节全员研讨,技术路线和商业策略的重新校准
AGI信仰者的独白
上市只是补给站——"当然实现AGI的公司,这个不用想了"

破门:清华第一家走通科技成果转化的公司

张鹏的履历简单到可以用四个字概括:清华、清华、还是清华。

1998年进入清华大学计算机系,知识工程实验室。之后再也没有离开过——"到现在为止也在给清华打工,因为是我们的股东。"在实验室里,张鹏负责的是一个特殊的岗位:工程转化。教授们带着博士生做研究、发paper,张鹏带着工程师团队把这些prototype变成可交付的系统和产品。实验室有一个传统理念叫"P2P"——从Paper到Product,研究成果一定要转换成实际能用的东西。

2015-16年间,清华实验室内部开始了一场重要的讨论。上一代人工智能(以旷视为代表的AI 1.0)在计算机视觉、人脸识别等领域取得了巨大成功,但大家也清楚地看到了天花板——"人脸识别超过人又怎么样呢?超过人之后,没有意义了。"下一代人工智能应该是什么?张鹏团队在那个时候提出了一个概念:认知智能。它不是AGI,而是通往AGI的下一个明确台阶——从"感知"(能看见、能听见)到"认知"(能理解、能推理)。

张钹院士用一个经典的二维象限图来解释:AI 1.0解决了"知道我知道"范围内的单点问题;但真正的认知能力,需要解决"知道我不知道"——知道自己能力的边界在哪里;更大的挑战是"不知道自己不知道"——GPT-3时代"一本正经地胡说八道"就是典型表现。

但创业谈何容易。在2017年,清华的在职人员开办公司还是敏感地带。直到2018年1月,国家多部委联合发文允许科研院所在职人员做科技成果转化,这扇窗户才被打开。然而张鹏说:

"只开了一扇窗户,它并不是开了一个很敞开、很大的一个门,说你随便走吧。所以我们是首先吃螃蟹的人。"

从2018年1月政策出台到2019年6月公司注册——整整一年半。这一年半里,团队和学校反复沟通:科技成果怎么评估货币价值?学校拿多少、团队拿多少?流程怎么走?学校自己也"麻爪"——"我只有这个文件,底下的操作细节是什么,我也不知道。"但双方都有强烈的意愿推动这件事。最终,智谱成为清华计算机系第一家走通科技成果转化路径的企业。

在注册公司之前,张鹏团队已经在实验室里做了充分的准备。他们的核心产品AMiner——一个基于机器学习的科技情报平台——已经服务了Google、埃克森美孚、IBM等国际客户。Google的典型需求是预测"未来三到五年,在某个领域里哪些技术会成为热点"——这需要一个能理解文献、综合知识、推演新结论的认知能力。实验室年横向科研经费最高达到近2000万,但在那个维度里,"钱进不了个人兜"。

GPT-3:2020年的战略分水岭,和GLM的诞生

2020年5月,GPT-3发布——张鹏称之为"真正的分水岭"。恰逢智谱公司一周年,张鹏专门请张钹院士来公司和团队座谈,特意把GPT-3作为话题。

"张院士给出的评价非常高——机器学习里程碑式的进步,一种新的范式。但他当时还是担心一个问题:他其实还是不知道自己不知道。"

智谱团队从2020年中开始深入研究自回归预训练(GPT路线)与传统BERT路线(双向注意力)的区别。当时的业界并没有像现在这样高度统一认为GPT路线就是对的,大家都在探索。经过近一年的研究,2021年,GLM算法相对成熟。

GLM的精妙之处在于:BERT是"填空机器人"(双向注意力,抠掉中间预测),GPT是"蹦词器"(单向注意力,预测下一个),而GLM把双向填空的问题通过调整词序统一转换为单向预测——"既能做填空题,也能做续写,综合了两种能力。"额外收益是训练稳定性和量化精度:由于采用了部分双向注意力,参数矩阵分布更集中,量化时精度损失更小。

2021年12月底,智谱面临一个重大决策:要不要像GPT-3一样训练千亿参数模型?当时GPT-3的训练成本分析约为2000万美元,智谱自己的估算需要千万级人民币以上。对于一个几十人的初创公司,这是一笔巨额投入。最终科学家团队坚持要做,而且必须自己做——GLM算法的积累给了大家信心,"训练出来的模型性能不会差,钱不会打水漂。"

9个月后(2022年8月),GLM-130B训练完成并开源发布。斯坦福李飞飞团队的年度报告里,这是唯一一个参与评估且排名靠前的中国模型,"与GPT-3互有胜负"。但更令人惊叹的是成本——智谱的算力成本仅400万人民币,加上人工等总计约1000万人民币,约为GPT-3的十四分之一。

从至暗时刻到"一朝天下晓"

GLM-130B做出来了,但接下来的融资却是一段至暗时刻。

"投资人听不懂。很多人完全听不懂,这是什么东西?你们怎么挣钱?怎么把这个东西商业化了?"

张鹏印象特别深刻,有一个投资人线上聊完说:"这东西,你们能变成钱吗?你看这个大环境这么差,经济这么差,要不你们把估值降一半,怎么样?"那轮融资推进得非常艰难。

但命运在2022年11月30日发生了戏剧性的转折——ChatGPT上线了。在美国,它瞬间引爆;在中国,热潮在春节前后全面到来。张鹏用一句改编的诗形容这种反差:

"十年干什么什么无人知,一朝什么什么天下晓。"

之前质疑"你们这东西到底是啥"的投资人,突然就懂了——"你看ChatGPT你懂吗?我们做的就是往这儿去的。"之后投资人蜂拥而至,问的都是"你们什么时候能把ChatGPT的东西做出来?"

2023年春节,智谱的研究团队和工程团队没有休息,赶出了ChatGLM并小范围上线。同时开源了一个60亿参数的ChatGLM-6B——一张家用GPU就能跑。这是智谱在开源社区第一款爆火的项目,下载量极大,影响力极大。

百模大战:狂热、焦虑、和伪命题

2023年无疑是疯狂的。张鹏去参加WAIC(世界人工智能大会),有人数过展馆里的展台——所有展台上都有"大模型"三个字,拼起来巨长一条。王慧文发英雄帖,王小川入局做百川,张鹏的清华师兄、实验室学弟纷纷跳入这个赛道。

张鹏当时有两种感受。一种是兴奋——巨大的浪潮来了,不用再教育任何人,市场瞬间就理解了你在做什么。另一种是隐隐的担忧:

"每逢大浪过来,再往后看一点就是可能就是一片狼藉之后留不下谁。我怕的是整个这个市场从一个极端走向另外一个极端,然后塌掉之后再很难回来。如果这个市场都没有了,你做得再好也没用。"

2023年最热的争论是"通用模型vs垂直模型"——凡参加行业会议,必被问这个问题。但到了今天回头看,张鹏的判断是:垂直模型在当时就是一个伪命题,"被人加了一些佐料。"他不排斥垂直化——只是在后面补了一句:"垂直模型可以做,但一定要基于一个足够好的L0(基座模型)。"

Scaling Law:不迷信"暴力美学"

2023年,当全行业都在谈论"暴力美学"——堆参数、堆算力、堆数据的时候,智谱内部有着与众不同的冷静。

"scaling law 本身它提出来的时候是一个非常不严谨的一个说法。它就是说,随着这个参数量的增长,智能水平呈现指数级的爆发式增长——它只是个现象的描述,并没有一个很科学的依据。"

张鹏认为,对于科学家来说,发现一个现象之后最吸引人的是探究这个现象背后的原因到底是什么。"掌握了这个原因的本质,我就能利用好这个事情,而不是从简单的表象上说堆参数——总有一天你会堆到说,好像不起作用了。"

智谱将AGI的实现路径划分为L1到L5五个阶梯:L1预训练(死记硬背世界知识),L2对齐推理(SFT+会用知识),L3自学习(强化学习、经验试错),L4自我认知(知道自己的知与不知),L5意识(接近人类水平)。张鹏判断当前处于L2向L3的过渡阶段——每一阶段的Scaling维度不同,不能简单套用。

这种克制也体现在参数量的选择上。当市面上很多友商和研究团队"直接奔着万亿去"的时候,智谱一直使用dense(稠密)千亿模型,直到2024年GLM-4才扩展到两千亿。张鹏的哲学是:

"这件事情其实并不取决于模型的参数量,本质上还是看最后的效果。就像做菜一样,各种佐料佐一点放进去,怎么能让它味道更好?这里面很多的讲究。"

他提到的"好的数据"概念很有意思。以前大家以为"对的数据"就是好数据,后来发现错了——真正有价值的是"中间出错然后又纠正的数据",因为它包含了试错过程。2024年图灵奖得主Sutton的理论"Experience Error"(从经验中学习),正是这个逻辑——正确的和错误的经验,都是智能提升的必经路径。

DeepSeek的冲击与"柳暗花明"

2025年春节一回来,智谱内部就密集研讨DeepSeek——从研究、工程、市场三个层面全面复盘。

在智谱发GLM-4 Plus(200多B)的时候,团队感觉"做不上去了"——很多地方走到瓶颈,成本也很高。DeepSeek的出现打开了新思路:强化学习还有巨大的提升空间,工程优化可以做到更底层、更极致。DeepSeek尝试跳过SFT直接在base上做RL,智谱也做了尝试,结论是暂时还不能完全扔掉mid-training,但RL必须大幅加强。

智谱随后推出了自研的强化学习框架Slim——能将不同RL任务在一个框架下有机整合。这直接促成了GLM-4.5→4.6→4.7的一步一个台阶的进步。张鹏用了一句中国老话来形容这个过程:

"柳暗花明嘛——别轻易放弃。"

在商业层面,DeepSeek彻底开源的策略给了智谱一个意想不到的冲击——很多客户脑子里把"开源"和"免费"画上了等号。"人家都开源了,凭什么还收我钱?"但张鹏的策略是"用时间来证明":开源提供的是参数文件和技术细节,商业服务提供的是产品、工具和专业服务。过了一段时间,大量尝试自行部署的客户掉头回来——原厂不提供服务,自己部署了也整合不了业务系统。张鹏对这个博弈看得很透:"当大家想通这个商业本身的核心锚点是什么的时候,他自然而然会回来找我。"

To C vs To B:一条更中国的路

对于为什么智谱没有像OpenAI那样全力押注C端,张鹏有非常清醒的算计。

智谱清言(To C产品)的用户曲线很有意思——使用高峰是8:00-12:00和13:00-17:00,与上班和学习时间完全重叠。晚上基本没人用,唯一的小高峰在8-9点,分析后发现是家长在辅导孩子作业。用户始终把它当作一个效率工具,"不是娱乐产品,不是创造情绪价值的东西。"虽然付费会员挣了点钱,但"算完ROI之后是很不合算的一件事情。"

更深层的原因在于中国市场结构。ChatGPT在美国可以收$20/月的订阅费,"大把的人给他交"——但在中国,这两个都不可能。SaaS在中国一直起不来,张鹏问过很多人原因,有一个答案让他印象深刻:

"我用同样的钱,你买订阅一个月花十万块钱。我可以用十万块钱买十个人一个月,帮我把这活干了——完了这全是我的。"

AI时代的逻辑会改变吗?张鹏认为有两个悖论:一方面,AI Coding让程序员越来越便宜,定制化越来越普及——不需要标准SaaS了;另一方面,AI推理成本居高不下,也有刚性底线。"会比原来改变一些,但不会那么剧烈突变。"

所以智谱坚定地选择了To B:"to B虽然不性感,故事听起来没那么sexy,账没有那么容易好算——但它相对更stable、更确定。"智谱60%的客户是企业(前十大互联网企业中有9个),政府仅占20%。张鹏强调,"低价抢单这种事在to B市场是不受欢迎的——甚至连甲方都不欢迎。他也担心你交付不了,我给你那点钱根本不够。"

张鹏对中国AI的特殊路径有更宏观的思考:

"天底下的路其实不是只有一条。很多时候不要用历史的既有的经验或者规则来框一些新的东西——很多时候你错失的机会都是因为这个。"

他认为OpenAI是"高风险、高投入、高回报"的三高逻辑,而智谱追求的是高科技领域里的稳定性和可控性——"更符合中国市场的情况。"

水泥般的Boring:清华理工男的文化DNA

访谈中有一个评价被张鹏自己认为"还算中肯"——市场有人形容智谱"就像水泥一样,能干的漂亮,但是没有太多的情绪价值。"

张鹏的回应非常坦然:"就像大家评价清华的理工男一样,就是boring。都很聪明啊,也很能干,让他干什么事情他能干的很漂亮——就是没有太多的情绪价值。"

他承认Kimi(月之暗面,同是清华实验室出来的杨植麟创办)"很会抓住普通人的眼球,知道怎么去推广,怎么去理解普通人的需求。"但智谱的基因是工程师文化——在开发者、程序员群体中的口碑很好。张鹏也在反思:"应该更C一点,更酷一点,更抓眼球一点——一直在努力。"

从工程师到CEO的转变,张鹏坦承"你任何时候都是没有准备好的。"最折磨他的是认知对齐——商业模式新、客户看法千奇百怪,"你怎么样让你的认知和对方的认知能够对齐?这个挺suffering的。你要花很多精力去跟大家沟通,一遍又一遍地重复很多的话。"很多客户都是他亲自到一线去讲。

他分享了张钹院士在他创业之初说的三个管理坎:50人(只要挣到钱就行——建立团队信心),200人(出现分工,管理成本爆发,协调不好容易分崩离析),500人以上(层级出现,信息传导变长,"有一批人我叫不出来名字了,不知道他在干嘛了")。张鹏亲历了每一个坎——从2023年的200人到2024年的400人、再到2025年的800多人,每年翻一倍,"每年搬一次家。"

上市是一个新的坎——合规要求更高,需要"花更多精力在机制体制运转、定规章制度方面,而不是什么事情都在我的视线范围之内。"

在线学习与AGI的终极形态

张鹏对未来Scaling范式的判断是清晰的。当下是强化学习的Scaling,下一步则是在线学习(Online Learning)

他描绘了一个闭环图景:基座模型驱动推理 → 推理结果与真实世界交互 → 交互产出的反馈信号转换成强化学习信号 → 实时更新模型 → 继续推理。"训练和推理之间没有明显界限,整个闭环自动运转。"这不再是"分批处理"的训练→部署→推理,而是一个持续自进化的智能体。

对于AGI的终极形态,张鹏认同深度思考者的判断:大语言模型、视觉模型、世界模型需要原生统一到一个框架里,而非用系统化的方法拼接。"造出来一个脑子,各种能力都有——语言、图像理解、物理世界判断——再给它装上手脚去与世界交互。交互的结果反馈回来做RL,实时修改模型。闭环起来。"

唐杰的微博提到Agent的泛化能力还不够好——GLM可以做50步甚至200步的长程任务,但再长呢?上下文窗口有限,怎么解决记忆问题?人是怎么做到的?张鹏认为这里还有大量基础性研究要做。

他的时间判断审慎而理性:2027年可能具备上述能力雏形,之后还需要几年调整效率和安全——"理性判断大概5到8年。"但他也加了一句:"你说不好是算法层面会首先突破,还是从工程实践角度能先实现。"

这不是Bubble:为什么中国必须继续投资

访谈中小俊抛出了一个尖锐问题:有市场观点认为2026年AI bubble会破,大模型公司都在"大逃杀",赶在窗口期上市。张鹏的逻辑反驳层层相扣:

第一,如果它真是bubble,上市能救谁?救不了公司,救不了AI——只能救投资人的钱包。"所以这个事跟上市没什么必然关系。"

第二,怎么定义bubble?互联网泡沫之后留下了什么?"网络基础设施、技术革新、大量产品——都是那个时代留下的。"所以真正的泡沫不是指"投入了没产出",而是指"投入过热、收益不匹配"。

第三,也是最关键的一个判断——中国的AI投资根本不够。中国AI投资大概只有美国的几十分之一,而且"很多的投入都撒胡椒面撒下去了,并不是像美国那样集中在几家头上。"

"你要说有bubble我相信,在资本市场角度来看美国那个事情可能是有bubble的。但在中国这事不存在,它是远远不够的。"

最后回到根本问题:离AGI还很远。不投资它会自然发生吗?不会。"那不就完了吗?"张鹏的逻辑一锤定音。

上市不是终点:先行者的自我期许

对于IPO,张鹏最有趣的比喻来自马拉松:"在起步的时候你要加速抢到第一集团,中间大家都坚持不住的时候你去补给站拿补给,保持体力,平衡消耗和摄入。"上市就是这个补给站——"不是终点,后面还有很多事情,很多路要去走。"

他说智谱从成立第一天就给自己建了一个增长模型:每年增长100%-150%,六七年左右IPO。这是按计划走到的,不是仓促为之。对整个行业而言,上市的意义在于——

"证明了一件事情——它不是镜中花、水中月。它是真的能走到产业级的这样一个事情。"

小俊问了一个二选一的问题:"作为一家实现了AGI的公司,和做一家利润很高的公司,你选哪个?"

"当然实现AGI的公司。这个不用想了。"

补了一句:"我相信如果我们能够实现AGI,我们不会挂掉。我们也会是一个很伟大的公司。仅仅从商业化上来说也会是一个很伟大的公司。这两者并不是对立的。"

反过来,什么会让张鹏不满意?"只赚钱,没有技术的产出,或者说对这个行业的贡献。"他不愿意自己的公司变成一家"做项目制外包的to G公司"——这可能是一个外界对智谱的误解。实际上,前十大互联网企业中有九个是智谱的客户,企业客户占60%。

整场访谈的最后一句话,是张鹏被问到"一百年后,如果智谱会出现在人工智能的历史书上,你希望它是被怎么撰写的?"

"智谱是AGI历史上的一个先行者,就开路的人。"

先行者就是创新者。而这个先行者从第一天起——无论是"让机器像人类一样思考"的Slogan,还是卷起裤管去客户现场做商业化,还是日复一日地坚持降成本——一直在路上。

核心金句

"只开了一扇窗户,它并不是开了一个很敞开、很大的一个门,说你随便走吧。所以我们是首先吃螃蟹的人。" — 张鹏谈科技成果转化政策的实操难度,和智谱作为清华第一家走通转化的历程
"scaling law 本身它提出来的时候是一个非常不严谨的一个说法。它只是个现象的描述,并没有一个很科学的依据。" — 张鹏谈对"暴力美学"的审慎态度
"每逢大浪过来,再往后看一点就是可能就是一片狼藉之后留不下谁。" — 张鹏谈2023年百模大战的深层忧虑
"天底下的路其实不是只有一条。很多时候不要用历史的既有的经验或者规则来框一些新的东西。" — 张鹏谈智谱选择不同于OpenAI的中国路径
"你要说有bubble我相信——美国可能是有bubble的。但在中国这事不存在,它是远远不够的。" — 张鹏论AI泡沫与中国投资的巨大缺口
"当然实现AGI的公司。这个不用想了。" — 张鹏被问"AGI公司还是高利润公司"二选一时的果断