E226|聊聊DeepMind创始人哈萨比斯:一个科学家与失控的AI竞赛

嘉宾:周健工 | 硅谷101 | 2026年2月
《哈萨比斯:谷歌AI之脑》中文译者 · 未尽研究创始人
为什么这期值得关注

德米斯·哈萨比斯(Demis Hassabis),DeepMind创始人,掌管着整个谷歌AI的研发,站在这场全球AI军备竞赛的最前线。他四岁开始下国际象棋,十三岁成为大师,创建了击败围棋世界冠军的AlphaGo,破解了困扰生物学家半个世纪的蛋白质折叠难题,因此获得了诺贝尔化学奖。

但这个人最打动人的,倒不是这些成就,而是驱动他的东西。哈萨比斯造AI,不是为了做产品,不是为了赚钱——用他自己的话说,是"为了理解宇宙"。他说:对我来说,科学是一种精神追求。

英国作家塞巴斯蒂安·马拉比(Sebastian Mallaby)出版了一本哈萨比斯的新书,中文名《哈萨比斯:谷歌AI之脑》。硅谷101邀请到这本书的中文译者周健工老师——他也是国内第一批当面采访哈萨比斯的中国媒体人——一起聊聊这个人的一生。

神童起源
四岁下棋、十三岁大师,两个顿悟时刻将他从棋盘引向计算机科学
AGI运动发起者
在ChatGPT出现十年前,哈萨比斯已经发起了通用人工智能运动
两条AI路线之争
强化学习 vs 深度学习,Sutton vs Hinton,DeepMind的执念与觉醒
谷歌收购博弈
Peter Thiel的赌注、扎克伯格的邀约、Larry Page的一句话,如何改写AI格局
ChatGPT冲击
"他们把坦克开到了我们家草坪上"——DeepMind如何从落后中反击
奥本海默之问
一个想用AI理解宇宙的科学家,能否控制自己亲手创造的力量?
神童的起点:棋盘上的少年

哈萨比斯的童年是典型的移民家庭故事。母亲是新加坡华人,父亲是塞浦路斯希腊人,两个人在伦敦勤勤恳恳、勤俭持家。孩子一展现出天赋,他们就倾其所有去发展——父亲几乎放弃了自己的事,开着家里那辆破车,带着小小的哈萨比斯在伦敦、英国乃至欧洲到处去比赛国际象棋。

四岁看大人下棋,五岁自己开始对弈,九岁入选英国11岁以下国际象棋队,十三岁成为大师,全球同龄排名第二。他个子本来就很矮小,年幼时更小——坐在凳子上连棋盘都看不清楚,经常屁股底下垫两个厚厚的书,才能看着棋盘和对手。一下就是八小时、九小时、十小时,有时下着下着就睡着了。

在父母眼中,国际象棋大师已经是极高的成就,孩子"已经非常成功"了。但哈萨比斯自己,即将迎来两个改变一生的顿悟时刻。

第一个顿悟:十一岁的弃局

那是在列支敦士登,哈萨比斯与一位丹麦的国际象棋冠军对弈。一口气下了十个小时,按他的水平,这局棋很可能是和棋。但当对方在思考下一步时,哈萨比斯看着对方,又环顾大厅里所有的棋手,突然想到一个问题:

"难道我就在下棋中度过这一辈子吗?"

然后他又想到了第二个问题:这个屋子里所有的人,都是世界上可能最聪明的人——他们难道把自己的智力全部用在下棋这一件小事上吗?

在这一刻,下棋对他的意义突然没有那么重大了。胜负也变得不重要了。于是他投子认输,放弃了一局本能求和的对局。对方大为震惊——你明明可以求和,为什么要放弃?他什么也没说,因为他自己的想法跟在座的所有人都不一样。

从那以后,他对下棋不再那样执念。他仍然在下棋,但心里知道,有更大的东西在等着他。

第二个顿悟:一本薄薄的小册子

11岁那年,父亲带他去伦敦一个号称世界上最大的书店。他偶然看到一本薄薄的小册子——英国国际象棋大师David Levy写的关于如何编程国际象棋程序的书。这本书讲了计算机怎么下棋、怎么战胜对手、背后的原理是什么。

哈萨比斯一口气读完了整本书。这本书立刻把他从国际象棋的世界,连接到了计算机的世界。

书中提到了一个关键人物:克劳德·香农(Claude Shannon),信息论的发明者。香农在1950年——当时现代意义上的计算机还没有出现——就写过一篇关于如何编程象棋的文章。香农提出了一个在当时极具预见性的观点:如果我们能编程下象棋,那么这个编程也可能完成其他非常多的智力和认知任务——它可能具有通用性,可能是一个通用计算机。

利维的这本书,加上香农的理论和信息论的观点,对幼小的哈萨比斯产生了极大的启蒙——可以说是为他打开了另一个更加广阔的世界。这次启蒙,在他心里埋下了二十年后创建DeepMind的种子。

游戏公司岁月:野心撞上算力之墙

16岁被剑桥录取,因为年龄太小,学校要求他推迟一年入学。在这一年里,他加入了当时欧洲顶级的游戏公司牛蛙(Bullfrog)。在游戏中,他开始设计"智能体"的雏形——给角色吃很咸的食物,之后它就会产生口渴的感觉;你给它喂水,它又会产生其他反应。一个人物被设定在一个能产生反馈的环境中,这是哈萨比斯对智能体最早的朦胧概念。

剑桥毕业后,他与后来强化学习领域的旗帜人物David Silver共同创办了万灵药工作室(Elixir Studios)。他们设计了一款野心极大的游戏《共和国》——以苏联崩溃为背景,想在一个城市里同时模拟上千个独立思维的角色,引擎号称能渲染无限多边形。但那是2003年,电脑的显卡、CPU和内存都远远跟不上野心。演示的关键时刻掉链子,Silver临阵脱逃,游戏被砍掉大量功能才勉强上线,评价平平。

这虽然是一次失败的创业,但给了哈萨比斯一个极其深刻的教训:再好的算法和想法,如果没有足够的算力支撑,只能停在纸面上。这个教训,后来贯穿了他整个DeepMind的决策逻辑。

同时,哈萨比斯在这段经历中确立了自己的核心信条——他非常推崇费曼的一句话:

"如果你不能把一个东西造出来,你就不能真正理解它。" — 理查德·费曼

这造就了他后来知行合一的风格:想到一个通用计算机器、一个智能体,就一定要在一个真实的环境里把它造出来。他不是空谈的科学家,是一个实践的科学家。

创立DeepMind:三个特别的联合创始人

2010年,DeepMind在伦敦成立。三位联合创始人的背景截然不同:

德米斯·哈萨比斯——神经科学博士,国际象棋大师,游戏设计师。股份是Shane Legg的九倍、苏莱曼的十四倍。公司使命是"先解决AI,再用AI解决一切"。

Shane Legg——新西兰人,在伦敦大学学院的神经计算研究所与哈萨比斯结识。他发挥了一个极其重要的作用:把哈萨比斯引向了硅谷的奇点大会。正是在奇点大会上,哈萨比斯认识了Peter Thiel和Elon Musk——这两个人后来深刻影响了DeepMind的命运。

穆斯塔法·苏莱曼(Mustafa Suleyman)——这个人才是整个故事中最戏剧性的人物。他是牛津神学辍学生,来自穆斯林移民家庭,从小生活艰辛。他最初靠开冰淇淋铺谋生,经常去哈萨比斯家玩,慢慢建立了信任。他有强烈的"社会正义"信念,同时精通做生意。后来他离开DeepMind,创立Inflection AI,最终成为——微软AI部门的掌门人。

:David Silver本该是最理想的联合创始人,但因为万灵药工作室的失败,他选择离开。后来,Silver主动跑到加拿大冰天雪地的Alberta大学,追随"强化学习之父"Richard Sutton读研究生。

融资困境:谁会投资一台"上帝机器"?

2010年的伦敦,几个年轻人说"我们要造AGI"——几乎没有人听得懂。大多数人觉得他们是骗子。金融街上的人说:"你们还不如加入我们公司去做量化交易呢,干嘛搞那玩意儿?"

但就是有少数非凡的人愿意投。第一个天使投资人听完哈萨比斯讲AGI后,认定这是"一架上帝需要的机器"——出于宗教信仰投了几十万英镑。哈萨比斯在MIT做博士后时的指导教授说:"哈萨比斯将来一定能获得诺贝尔奖,而且是费曼和克里克那个级别的。"投了10万美元——"我就这么多了"。

最关键的是Peter Thiel的Founders Fund。Thiel本人并不看好哈萨比斯——他认为哈萨比斯是"在科学上能做顶级发现,但在商业模式上完全不成立的那种人"。但他的合伙人Nosek力排众议:"这个人就是跟马斯克一样的创业者。"他们绕过投委会表决,用特殊通道投了DeepMind。Founders Fund总共投了三轮,在DeepMind的股份一度超过了三个创始人股份之和。

到了B轮,哈萨比斯最缺钱的时候,Founders Fund拒绝领投——因为2013年AlexNet的突破引爆了AI热潮,硅谷AI人才身价暴涨,Thiel认为共识已经形成,这意味着泡沫。最后是周凯旋(李嘉诚家族基金的管理人)领投约1000万美元,救了DeepMind。

谷歌收购:一架私人飞机上的秘密

谷歌收购DeepMind的故事,始于Elon Musk的一次炫耀。在一次SpaceX发射后,Musk与Larry Page坐同一架私人飞机回加州。飞机上,他们聊起了神经网络——Page的父亲在前苏联时代也是一位计算机科学家,研究过神经网络,所以Page对这个话题有天然敏感度。Musk炫耀说:"我已经开始投资一家公司了,叫DeepMind。"

"Larry Page听完,默默掏出安卓手机,记下了DeepMind这家公司的名字。"

没过多久,哈萨比斯收到了一封邮件,第一句话是:"我是谷歌,负责对外投资的。"一条线就这样串起来了。

在谈判过程中,扎克伯格也插了一脚。他邀请哈萨比斯去家里深谈。哈萨比斯很聪明地问:你觉得哪些技术赛道好?小扎列了一大堆——AI、虚拟现实、增强现实、3D打印……哈萨比斯大失所望。他要找的,是一个真正把AGI视为未来唯一方向的人,而不是一个把AGI当作众多方向的投资者。他觉得扎克伯格对未来技术没有自己的判断,于是告辞,立刻拿起电话打给Larry Page:"我们继续谈吧。"

Larry Page在一次散步中对哈萨比斯说了一句话,彻底打动了他:

"你为什么不来谷歌呢?你的目标不是追求AGI吗?那我已经在这里为你准备了一切。" — 拉里·佩奇

最终成交价约6.5亿美元。定价参考了此前谷歌收购Geoffrey Hinton团队的先例——Hinton师生三人卖了4500万美元,人均1500万。DeepMind有30到40名世界顶级AI研究人员,同样按人均1500万美元计算。哈萨比斯个人的估值约1.4亿美元。今天回头看,这可能是谷歌历史上最划算的一笔收购。

两条AI路线:一场三十年的学派之争

要理解DeepMind的发展轨迹,必须先理解AI领域一场绵延三十年的学派之争。

强化学习(Reinforcement Learning)是DeepMind刻在DNA里的东西。这一派的灵魂人物是Richard Sutton(Alberta大学),核心逻辑是试错+反馈+奖励机制。游戏是强化学习的完美环境——规则清晰、边界明确、奖励可量化。AlphaGo、AlphaZero都是这条路线上的杰作。David Silver就是被Sutton的理论所吸引,主动跑到Alberta追随他读研的。

深度学习(Deep Learning)的另一位巨人Geoffrey Hinton坐镇多伦多大学。这一派的核心逻辑是从海量数据中归纳模式。2012年,Hinton和他的学生Alex Krizhevsky用AlexNet在图像识别上超越了人类,引爆了整个AI热潮。

两个学派之间壁垒森严。书中写了一个令人印象深刻的细节:有人在Sutton那边读完硕士,想去多伦多大学读Hinton的博士。Hinton下面的人说:"哦,你是从Sutton那边来的,那你那套强化学习要放弃的,跟我们这边行不通。"

哈萨比斯和David Silver有一个执念——他们认为通向AGI的唯一路径就是强化学习。这个执念一方面成就了AlphaGo和AlphaFold,另一方面也让DeepMind在后来错过了大语言模型的浪潮。当然,到AlphaFold2的时代,强化学习和深度学习已经深度交融——这证明两个学派的融合才是真正的未来。

AlphaGo与AlphaFold:从游戏到科学

2016年首尔,AlphaGo击败围棋世界冠军李世石。哈萨比斯当初向Larry Page承诺"两年内战胜围棋世界冠军",他真的做到了。但这也让他意识到,游戏世界的胜利只是开始。

在首尔的比赛间隙,哈萨比斯对David Silver说了一句悄悄话,被旁边的记者录了下来:"我们把围棋攻克了,下一个目标是不是蛋白质?"

蛋白质折叠是生物学界困扰了半个世纪的难题。蛋白质的结构由20种常见氨基酸按不同序列组合而成,理论上几乎有无穷无尽的可能性。传统方法用X射线晶体学,需要博士们花大量时间才能解析出一个结构——人类历史上总共只积累了几万个。

DeepMind在AlphaFold上经历了三次技术转向:先尝试循环神经网络(认为是序列问题),效果一般;改用卷积神经网络(认为是图像识别问题),有所好转;最终在John Jumper加入后决定转向深度学习和Transformer架构。2020年AlphaFold2在CASP竞赛中得到92.4分,颠覆了整个结构生物学领域。2024年,哈萨比斯和Jumper因此获得诺贝尔化学奖。

这是哈萨比斯"用AI解决一切"使命的第一个重量级科学验证——AI不只是游戏工具,它可以直接推动基础科学的突破。

在谷歌的挣扎:独立之梦与"马里奥计划"

被谷歌收购后,DeepMind面临的不是钱的问题,而是独立性的问题。苏莱曼在中间扮演了关键角色。他推动了AI安全与伦理委员会的设立(3-3-3结构:3个外部人士、3个谷歌代表、3个DeepMind代表),但谷歌法务和内部势力让这个计划无疾而终。

Alphabet成立后,谷歌想把一些长期需要投入但不挣钱的业务分离出去。DeepMind一度非常乐观——谷歌承诺未来十年提供150亿美元的研究经费。苏莱曼也为自己争取到了负责DeepMind应用部门的职位。但随后,支持他的谷歌高管被苹果挖走,应用部门的人也并入了谷歌本部。

苏莱曼怂恿哈萨比斯启动"马里奥计划"——秘密脱离谷歌,效仿OpenAI建立非营利架构。他们找了LinkedIn创始人Reid Hoffman(初步答应10亿美元),又找了蔡崇信(未果)。但最终,劈柴(Sundar Pichai)果断拒绝了苏莱曼的副总裁任命,并坚决维持DeepMind在谷歌架构内。哈萨比斯最关心的始终是——有足够的资源做研究——在这一点上,谷歌最终满足了他。

书中没有明确说哈萨比斯逼迫苏莱曼离开。但在NHS医疗数据隐私风波(苏莱曼主导使用160万份患者资料训练模型)和内部举报之后,苏莱曼逐渐被边缘化,最终离开了DeepMind。

苏莱曼:从联合创始人到微软AI掌门人

苏莱曼的轨迹是DeepMind故事中最具戏剧性的一条线。他离开DeepMind后,在谷歌挂了一个虚职副总裁,待了两年。然后他创立了Inflection AI,这家公司后来被微软收购。如今,苏莱曼是微软AI部门的掌门人。

于是AI竞赛的舞台上出现了这样一个奇妙的对位:哈萨比斯掌管谷歌AI,苏莱曼掌管微软AI——昔日合伙人,今日对手。

苏莱曼从小就有强烈的社会正义信念。他在DeepMind期间对AI安全和社会影响的关注是真诚的。但同时,他也是最积极推动DeepMind商业化的那个人。在谷歌收购谈判中,他巧妙地把马斯克和扎克伯格当作牌来跟谷歌博弈。他的复杂性和矛盾性,某种程度上也折射出了哈萨比斯的复杂性。

而且,理解苏莱曼的轨迹,能帮我们看清今天AI行业格局的源头。几乎所有重大事件,都可以追溯到DeepMind的创立:谷歌收购DeepMind → Musk为抗衡而联合创立OpenAI → OpenAI的非营利架构反过来又激励哈萨比斯寻求独立 → 苏莱曼离开DeepMind最终成为微软AI掌门人。今天谷歌、微软、OpenAI三巨头的格局,每一方都有前DeepMind的人在关键位置。

ChatGPT冲击:当"坦克开进自家草坪"

2022年底ChatGPT横空出世时,哈萨比斯的愤怒反应是:

"他们把坦克开到了我们家草坪上。" — 哈萨比斯

为什么DeepMind错过了大语言模型?答案在于哈萨比斯本人的研究优先级排序。他亲自讲过,DeepMind的研究组合排位是这样的:第一是强化学习(通向AGI的重中之重),第二是神经科学(向人脑学习),第三才是从数据中归纳(而大语言模型只排在第三位里面的一个分支)。这可真是排在"第三里面的一个分支"——可见他有多不重视。

更深层的问题在于他对语言的藐视。哈萨比斯坚信AGI必须是"接地的"(grounded),认为语言不接地、不能反映真实世界。但Ilya Sutskever(OpenAI首席科学家,也是一位从DeepMind跳槽过去的人)反驳了这个观点:语言中间接反映了人类大量接地的经验和逻辑。那些看似抽象的文字,背后是人类几千年积累的对物理世界和社会互动的描述。

还有一个关键盲点:哈萨比斯一直认为DeepMind是一家以科学研究为主的机构,但他突然发现,不仅仅科研、还有工程,不仅仅是模型、还有产品,不仅仅是研发、还有商业——这些对推进AGI同样起着巨大的作用。如果你不让更多的人用它,谈什么"General"都是没有意义的。

当时谷歌内部其实有两个团队在同时开发大模型——DeepMind的Sparrow和Google Brain的LaMDA(后来转为Bard)。但他们计划花几个月完成安全审查和对齐工作后再慢慢发布。结果OpenAI选择了"先发布再说"。

谷歌的反击:从落后到追赶

2023年4月,GPT-4发布,Bard发布被视为失败。谷歌进入内部危机状态。连谢尔盖·布林都回来上班了——"蹲在那儿跟大家一起看代码、看数据、看模型"。

最关键的组织变革是:DeepMind和Google Brain合并为Google DeepMind,CEO是哈萨比斯,不是Jeff Dean。这证明了劈柴当初阻止DeepMind独立的深谋远虑——一直把它当作战略棋子,总有一天要用上。现在这一天真的来了。

工作方式也发生了四大调整:第一,集中算力——DeepMind一家占的算力比Gmail几十亿用户都多,所有资源集中攻克大模型。第二,削减"蓝天研究"(blue sky research),增加工程化导向。第三,前沿成果不再第一时间发表——放弃谷歌"总是公开分享"的传统。第四,回归突击队模式——谁在哪个模块取得突破,立刻内部公开、立刻采纳,完全透明的、高强度的精英协作。

结果证明这些调整是有效的。Gemini系列(Flash、Thinking、原生多模态、长上下文)陆续推出,谷歌在AI测评榜上重回顶尖。即使在推理模型上OpenAI领先了两三个月,谷歌凭借强化学习的深厚底蕴也迅速赶了上来。

哈萨比斯其人:矛盾体中的科学家

周健工在2017年第一次采访哈萨比斯时,第一印象是:这个人非常矮小,头发有些秃顶,"非常像一个中国普普通通的研究所里搞科研的人"。

但他一开口,就完全不一样。他的语速很快,思想极其流畅清晰,甚至十分sharp。你问他任何问题,他都能给出一个非常清晰的逻辑。在不同知识之间的切换,他运用自如。你感觉到,任何智力上的挑战对这个人可能毫无障碍。周健工用了一个词:智慧——"他不是那种被训练出公关腔调的讲话。他能针对你问的问题,贡献出最fresh的想法。这东西不是放了无数遍的PPT,他不停给你播放。这是一种智慧。"

哈萨比斯身上有一种浓厚的欧洲科学气质——英国科学革命和欧洲人文精神的传承。Dario Amodei(Anthropic CEO)在达沃斯的一个panel上,将AI创业者分为三类:科学家、工程师背景的entrepreneur、做社交网络转行过来的。Amodei把自己和哈萨比斯归为第一类:"做科学的人天生有向善的情怀,最大的愿望不是有多大权力或多少财富。"

但哈萨比斯也展现出了强烈的矛盾性。他在任何智力游戏中都是一定要赢的——桌面足球、扑克牌、双陆棋、象棋,不玩则已,一玩就要赢。他说自己"不愿意控制别人",但周健工提出了一个尖锐的问题:你口口声声说不要控制别人,但一定要赢过别人——这算不算另一种控制?

马拉比的书写法也折射出这个问题。周健工认为,马拉比对哈萨比斯的写法"有一点点过于好了"。马拉比是英国人,哈萨比斯是"英国国宝"——他在写自己国家的国宝时,自然有倾向性。但周健工也认为,在30多个小时的私下对话中,哈萨比斯展现出来的真诚,多数是真的。

奥本海默之问:科学家能否控制自己创造的力量?

很巧的是,DeepMind办公室的旁边,就是当年物理学家希拉德(Leo Szilard)萌发核连锁反应堆想法的那个路口。哈萨比斯说自己每天经过那里的时候都会想:现在正在做的事情,重要性跟原子弹不相上下。

书的扉页引用了冯·诺伊曼在研制原子弹时写的一句话:

"我们知道这个威力太大,但是我们作为科学家,如果不履行我们发现的天职,这是违背科学伦理的。但是一旦把这些产品的威力释放出来,我们可能成为世界上最被憎恨的人。" — 约翰·冯·诺伊曼

这个矛盾在AI领域表现得尤为尖锐。Geoffrey Hinton在多个公开场合说"我们完了",认为AI可能毁灭人类。另一位图灵奖得主Bengio也发出了AI末日警告。而哈萨比斯——至少在这本书写作时——仍然认为AI是人类有史以来最有益的技术,会带人类进入后稀缺时代:开采小行星、解决核聚变、从海水中提取燃料。

但耐人寻味的是,在制作这期节目的过程中,哈萨比斯也开始在AI峰会上公开警告风险:"AI系统正在变得越来越自主,一旦偏离了预设轨道,后果可能会非常严重。当前国际合作可能根本不够用。"

马拉比驱动这本书叙事的最底层力量,正是这个问题:AGI是威力无比强大的技术,也可能是人类终极技术。发明这些技术的那一小撮人,他们带着什么样的动机?他们的动机可能直接影响到这个技术对人类的未来究竟意味着什么。而哈萨比斯,是其中最关键的一个人物。

书的结尾留下了一个开放问题:哈萨比斯一直想做正确的事情——但他能做到吗?

核心金句
"难道我就在下棋中度过这一辈子吗?" — 11岁的哈萨比斯,在列支敦士登的棋局中顿悟
"如果你不能把一个东西造出来,你就不能真正理解它。" — 费曼,哈萨比斯最推崇的信条
"你为什么不来谷歌呢?你的目标不是追求AGI吗?那我已经在这里为你准备了一切。" — 拉里·佩奇,一句话打动哈萨比斯接受谷歌收购
"他们把坦克开到了我们家草坪上。" — 哈萨比斯对ChatGPT发布的反应
"对我来说,科学是一种精神追求。" — 哈萨比斯,解释他造AI的终极动机
"哈萨比斯一直想做正确的事情,但是能不能做到,这是一个问号。" — 书的结尾留下的未解之问