这周,《Lex Fridman Podcast》放出了Google/ Alphabet的CEO桑达尔·皮查伊(Sundar Pichai)的深度访谈。Lex Fridman Podcast的节目时长都很夸张,一如既往,这场对话也超过了两个小时。
首先,此次访谈的背景值得一讲:一年前,舆论充斥着对Google在AI竞赛中落后的批评,甚至有声音要求皮查伊下台。而一年后,随着Gemini系列模型的发布和一系列产品的AI化,Google似乎重新夺回了领先地位。它刚发布的gemini-2.5-pro-preview-06-05,支持自适应思考,在LMArena 上的 Elo 分数跃升了 24 分,排行榜上以 1470 分保持领先,在 WebDevArena 上的 Elo 分数则跃升了 35 分,以 1443 分保持领先。
在节目中,皮查伊与莱克斯·弗里德曼(Lex Fridman)聊了从个人成长经历到AI作为人类历史终极发明的一系列议题。其中有的段落,还颇有些《鲁豫有约》的风格,比如皮查伊回顾了在印度缺水缺电的童年如何塑造了他对科技的信念。当然,更核心的内容是皮查伊在合并DeepMind与Google Brain等关键决策中的领导力挑战,并坦诚地讨论了AGI(通用人工智能)的时间表、P(Doom)(AI末日概率)等前沿甚至带有些许哲学意味的话题。
全文很长,先用三组问答,归纳一下核心信息:
问:在AI颠覆一切的时代,许多领导者因短期舆论压力而摇摆。桑达尔·皮查伊在Google面临“落后”批评时,其决策的核心原则是什么?
答: 皮查伊的核心原则是“信号降噪”。他将外界的批评、股价波动和媒体热议视为“噪音”,而将第一性原理、核心技术数据和不可逆转的长期趋势视为“信号”。在对话中,他透露正是在外界对Waymo自动驾驶项目最悲观时,他基于内部技术遥遥领先的“信号”,决定“加倍投入” 。这一思维框架让他能够顶住巨大压力,专注于长期价值,最终带领Google在AI竞赛中重回领先地位。
问:Google同时在推进稳健的搜索业务和激进的AI模式,这看似矛盾。皮查伊是如何管理这种内部“左右互搏”的?
答: Google采用的是一种“主干-分支”(Mainline-Branch)创新模式。核心搜索业务是“稳定主干”,确保数十亿用户的体验和公司收入 。同时,设立“AI模式”作为“前沿分支”,专门用于测试最大胆、最前沿的技术 。两者并非互搏,而是共生:只有在前沿分支中被数据验证成功的特性,才会被“回迁”到稳定主干上,如现在的AI Overviews功能 。这套系统让Google既能保持稳定,又能安全地进行自我颠覆。
问:对于像AI这样可能带来生存风险的技术,皮查伊为何仍表现出一种谨慎的乐观?他认为人类最终的“安全网”是什么?
答: 皮查伊的乐观并非源于低估风险,而是源于对人性的集体理性抱有信心 。他提出了一个深刻的观点:当一个威胁(如P(Doom))真的大到足以毁灭全人类时,它也会成为一个前所未有的、能统一全人类去解决它的强大动力,这形成了一种“风险自我调节机制” 。他认为,人类文明的历程证明,我们总能在关键时刻挺身而出,集体应对挑战 。因此,人类的集体求生欲和智慧,是面对终极技术风险时最根本的“安全网”。
接下来,就请看全文了。
一、从缺水到热水澡:科技如何点亮皮查伊的童年
桑达尔·皮查伊的个人经历,是理解他为何对技术抱有如此坚定信念的钥匙。在访谈中,他描绘了一幅成长画卷,背景是上世纪80年代的印度金奈(Chennai)——一个充满活力但物质相对匮乏的环境。
他成长于一个简朴的两居室公寓,家里甚至没有自来水。皮查伊回忆道,当时正值一场大干旱,每家每户要排队等水车 ,每次只能分到大约八桶水 。他和兄弟、有时还有母亲,都需要亲自去排队把水运回家 。直到很多年后,当家里终于装上自来水和热水器,能够随时打开水龙头洗上一个热水澡时,那种感觉对他而言是颠覆性的。“你永远无法体会第一次拥有热水的震撼,”他感叹道,“那种打开水龙头就有热水流出的便利,我们现在习以为常,但对我而言,那是一次人生的巨大飞跃。”
另一个深刻的记忆关乎通讯。皮查伊家等待了五年才装上一部电话 ,而且是一台老式的转盘电话 。尽管如此,这部电话极大地改变了他们的生活 。邻居们会来他家给远方的亲人打电话 。在此之前,生活中的许多事都充满着不确定性和漫长的等待。
他举例说,为了拿到一份血检报告,他需要花两个小时去医院 ,结果可能被告知“还没好,明天再来” 。有了电话后,这个往返四小时的折磨,变成了一个五分钟就能解决的事情 。这些被皮查伊称为“离散的”技术进步,一次又一次地在他脑中点亮了灯泡。“作为一个孩子,我亲身体会到科技改变人们生活的巨大力量 ,以及它所带来的机遇。” 这种体验,从等待五年的电话,到后来家里拥有的第一台VCR(录像机) ,都让他深刻感受到,获取新技术就如同人生的阶梯,每一步都能带来生活的质变。
正是这种源于匮乏的童年经历,让皮查伊对知识和信息的获取有着近乎本能的渴望。在没有电脑的时代,报纸和书籍是他了解世界的窗口 。他的祖父是一位邮局职员,写得一手漂亮的英文 ,正是祖父引导他进入了阅读的世界,从安·兰德的哲学著作到通俗的犯罪小说,无所不包 。这种对“获取知识”的深切渴望,也解释了为什么他最终会加入Google,因为Google“组织全球信息,使人人皆可访问并从中受益”的使命与他的个人经历产生了强烈的共鸣 。
二、从克制到果决:一位“非典型”CEO的领导力秘诀
正是这种对科技力量的第一手感知,自然而然地引出了他对于如何引领这样一家巨型企业、以及给年轻人的职业建议的思考。出人意料的是,这位身处残酷商业竞争中心的CEO,其领导哲学核心竟是异乎寻常的谦逊与克制。
当被问及会给那些视他为榜样的年轻人什么建议时,皮查伊分享了两点核心原则。首先,他强调要跟随内心而非头脑做选择 。
他解释说:“当你在做一件事时,用心去感受你是否真的享受它。如果你热爱你所做的事,事情会变得容易得多,你也会展现出最好的自己。” 他承认这说起来容易做起来难,但这是他最想告诉年轻人的事 。其次,他建议要与比你优秀的人共事 。
皮查伊描述了那种和高手过招的感受:“当你和某人交谈,你会惊叹‘哇’,你会想要有更多这样的感觉。把自己置于一个能被同事的能力所‘拉伸’的环境中,这才是成长的关键。” 这意味着要勇于将自己置于不舒服的境地,并保持开放的心态,因为你常常会惊讶于自己的潜力 。
莱克斯·弗里德曼随后提出了一个尖锐的观察:在科技界这个“残酷的世界”里,能登上顶峰的领导者通常都有些“混蛋”(asshole)特质,但皮查伊给人的印象却是谦逊、善良和善于倾听 。他追问皮查伊的“秘诀”是什么。
皮查伊坦言,他同样会感到愤怒和沮丧,拥有和常人一样的情绪 。但他随着时间发现,要激发团队最大的潜力,发怒往往不是实现目标的有效方式 。
他将领导力类比为足球教练的“人员管理”(man management) 。他说:“你要找到那些以使命为导向、追求卓越的人。你激励他们,就能取得巨大的成就。” 他认为,很多时候,团队成员如果犯了错,他们内心的自责远超于你的批评 。
在这种情况下,激励和信任远比发怒有效。“在关键时刻,坚定地说出正确的话,其影响力会随着时间回响。有时,沉默甚至能传递更强有力的信息,所谓‘少即是多’。”当然,他也承认在必要时会采取果断行动,让团队明确知道某些行为是不可接受的 。但总体而言,他更倾向于一种克制而坚定的领导风格。这种风格,与他后来在访谈中提到的,在AI竞赛最激烈时做出的合并DeepMind和Google Brain等果决行为,形成了有趣的对比,展示了他作为领导者复杂而多面的一面。
三、超越火与电:AI是人类历史上最深远的技术革命
如果将AI置于人类历史的宏大叙事中,皮查伊坚信其影响力将超越火与电。这一论断的基石,在于AI一项独一无二的特性——递归自我改进,这使其不仅是工具,更是创造力的加速器。
在访谈中,莱克斯·弗里德曼提出了一个宏大的问题:如果将人类历史上所有的技术创新,从12,000年前的农业革命到工业革命的机械化,再到电力,按照它们作为“生产力倍增器”的效应进行排名,AI未来能否位居榜首?
皮查伊毫不犹豫地重申了他早在2017或2018年就提出的观点:“AI是人类将要实施的最深远的技术,它将比火或电更加深远。” 他承认,身处当下,人们很容易有“新近度偏见”(recency bias),就像在体育界总倾向于称眼前的明星为史上最佳一样 。但他认为,从第一性原理出发,AI的颠覆性是前所未有的 。
他解释了其背后的逻辑。电力、互联网等过去的革命性技术,其影响是广泛的,它们改变了一切 。但AI有着根本的不同:它是首个能够递归自我改进的技术 。
皮查伊强调:“AI将极大加速创造本身。” 它不仅仅是一个工具,它本身就具备学习、进化和创造新事物的能力,而且其能力上限目前尚不清晰 。为了让听众更直观地理解,他提到了亲眼目睹AlphaGo从零开始,在一天之内通过自我对弈成为世界顶尖围棋手的经历(我们之前发过一篇博客,正好是关于这次往事的)。“当你看到那一幕发生时,它真的会深深地触动你。”
他还提到,即使是观察像Veo这样的视频生成模型,从训练30%到60%再到完成,看到它如何从无到有地“拼凑”出连贯的世界理解,那种感觉“既鼓舞人心,又让身为人类的我们感到一丝不安”。
皮查伊认为,正是这种自我完善并能独立实现目标的能力,使AI进入了一个“完全不同的联盟” 。他坚信,当历史写就,AI所带来的影响将远远超过我们之前所见过的任何技术 。特别是当AI在“AI研究”这个领域本身达到超人水平时,技术的迭代速度将进入一个全新的范式 。一个能够比人类更快、更好地创造出下一代自身的智能系统,其潜力是难以估量的 。
四、“AI创新包”:当一项发明重塑整个文明
皮查伊宣称AI比火与电更深远,这促使弗里德曼引入了“新石器时代创新包”(Neolithic Package)的概念来探讨这一观点——即一项核心发明如何像多米诺骨牌一样,引发一系列连锁社会变革,从而彻底重塑文明形态。
弗里德曼解释说,回顾历史上的重大变革,无论是农业革命还是工业革命,它们的影响都远不止于一项单一技术。大约12,000年前的第一次农业革命,并不仅仅是游牧民族停下来开始种植粮食 。它带来了一个“创新包”,催生了包括陶器(用于储存食物和液体)、社会等级、早期政府雏形、贸易和大规模人类协作在内的一系列深刻变革 。这些连锁反应(second and third order effects)共同构成了那场革命的真正威力,而当时的人们几乎不可能预测到这一切 。基于此,弗里德曼向皮查伊提问:那么,在我们这个时代,我们可能在“AI创新包”中看到哪些早期的连锁效应?
皮查伊认为,尽管大部分效应尚无法预知,但有一个趋势已清晰可见:AI将极大降低将想法变为现实的门槛 。他特别提到了AI在编程领域的进步。“你可以想象,将你脑中的想法直接转化为存在的东西,将会变得极其容易。” 这意味着AI将赋能几乎全人类,让他们能够更深度地表达自己 。过去,人们或许只能用语言表达,但未来,他们可以“构建”出实际的产品、内容和服务 。
他将目前的AI创作比作“氛围编程”(vibe coding)的早期阶段 。用户需要精心设计一系列提示词才能得到满意的结果,但这仅仅是开始 。皮查伊有一个核心信念:“你现在看到的,是这项技术有史以来最糟糕的样子。” 换言之,它的进步速度是惊人的,未来的可能性远超现在。
弗里德曼对此深表赞同,他将这一变革总结为“获取创造力的指数级增长” 。无论是创造一个程序、一段内容,还是一个游戏,其实现的难度都将无限降低 。皮查伊进一步升华了这个观点,认为这不仅仅是效率提升,而是解锁了全球80亿人的认知能力 。他类比道,互联网催生了博客,让成千上万的人得以发声 ;而AI,则可能让数千万甚至上亿人,以更深刻的方式向世界输出他们的创造力 。
五、创造力的民主化浪潮:AI是艺术家的画笔还是终结者?
探讨AI如何赋予大众前所未有的创造能力,从编码到艺术创作。然而,这种创造力的民主化也引发了现有内容创作者和机构的焦虑,他们开始直面一个问题:当人人都能成为创作者时,专业性的价值边界在哪里?
弗里德曼敏锐地指出了这种变革带来的紧张关系。他以自己所在的播客行业和传统新闻媒体为例,比如CNN、福克斯新闻等,它们对YouTube等平台的崛起感到紧张,因为这些平台让成千上万的独立创作者能够制作出同等甚至更高质量的内容 。而AI的出现,将这种“去中心化”的趋势推向了极致。弗里德曼半开玩笑地设想:“如果一个AI模型能做出比我好5到10倍的播客,我就会停掉我自己的节目去听那个AI的。” 这背后是一种适者生存的进化压力,它让许多传统领域的从业者感到不安 。
皮查伊对此提出了一个更具辩证性的看法。他认为,即使AI能生成海量高质量内容,人类体验的稀缺性价值可能会上升 。他用国际象棋举例:“你我不会去看两个顶级AI棋手(如Stockfish和AlphaGo)对弈,那会很无聊。但我们会饶有兴致地观看马格努斯·卡尔森(Magnus Carlsen)和古克什(Gukesh)的比赛。” 同样,他想象未来或许有机器人能比梅西更完美地盘带,但他怀疑那能否唤起我们内心同样的情感 。他预测,未来内容消费可能会分层。对于纯粹的信息获取,AI可能会更高效、更具吸引力 。例如,你想了解一段历史,可以直接问Gemini 。但如果你想看的是“人类在挣扎中理解信息”的过程——那种夹杂着情感、意识和复杂性的思考,你可能还是会选择人类创作者的播客 。
尽管如此,皮查伊坚信,AI作为工具,其赋能作用是巨大的,其扩张性的方面被低估了 。就像作家今天使用Google Docs而不会觉得它是什么了不起的工具一样,未来的创作者也将自然而然地使用AI工具 。Google正在与达伦·阿伦诺夫斯基(Darren Aronofsky)这样的顶尖电影人合作,探索如何利用Veo等视频生成模型进行艺术创作 。
皮查伊将这些AI工具比作“画笔”或“电力”这样的基础设施,Google的角色是提供工具,而艺术家则利用它们来自由表达,甚至推动思想的边界 。这种赋能也带来了新的挑战。艺术家,尤其是像阿伦诺夫斯基或Doerr兄弟这样风格前卫的创作者,其作品常常游走在社会规范的边缘,探索性和暴力等敏感主题 。
弗里德曼因此提出了一个关键问题:作为平台方,Google如何在支持艺术自由表达和维持社会责任之间找到平衡?
六、Gemini的进化与边界:在开放与审慎间游走
也就是说,当AI生成的内容无处不在,Google作为平台方,必须在赋能创造与承担责任之间找到精妙的平衡点。这直接关系到其核心产品Gemini的进化路径——如何在满足用户对历史、暴力等复杂话题的好奇心与设定安全护栏之间,划定那条微妙的界线。
弗里德曼观察到,早期版本的Gemini在处理敏感或复杂话题时显得“过于谨慎”,而Gemini 1.5 Pro则变得更加开放和客观 。他以自己研究成吉思汗、阿兹特克文明以及世界大战等充满暴力的历史为例,发现新版Gemini能够以富有深度和细微差别的方式来探讨这些困难话题,而不再像过去那样“提醒你是否确定要了解这些” 。
他好奇地问,Google是如何把握这个“度”,既允许Gemini输出“疯狂”但有价值的内容,又避免“过于疯狂”?皮查伊解释说,这背后有一个关键的技术洞察:随着模型本身变得越来越强大和复杂,它们处理这些细微问题的能力也内在地增强了 。他坦言,一年前的模型能力还不够,更容易犯“愚蠢的错误”,因此需要更多的外部规则来约束 。但随着模型智能水平的提升,它们自身就能更好地进行推理和判断 。
因此,Google的指导原则是,尽可能地让用户接触到原始模型的强大能力 ,而不是用一套由人类硬编码的规则去过度干预 。他强调,构建这些模型的正确方式,是从第一性原理出发,像对待数学或物理学一样,让模型从底层建立起对世界的细致入微的理解,而不是“一小部分人把自己的想法强加于其上” 。
他表示,Google将继续朝着这个方向努力,未来可能会提供更多定制化选项,比如让用户自定义系统提示(custom prompts),从而更自由地进行实验 。这背后反映出一种理念的转变:从试图用外部规则“修补”模型的缺陷,到相信并依赖模型自身日益增长的智能来处理复杂性。
弗里德曼分享了一个有趣的例子来印证这一点。他让Gemini分析自己的播客笔记,并生成一个全新的问题。Gemini提出的问题是:“你(皮查伊)曾说Gemini每月处理480万亿个token。在这信息的汪洋大海中,隐藏着哪句足以改变人生的五个词的句子?” 这个问题让弗里德曼意识到,这480万亿个token背后,是全球无数用户在探索世界、满足好奇心的“啊哈时刻” 。皮查伊证实了这个数据的准确性,并补充说,这个数字在过去12个月里增长了50倍,从9.7万亿激增至480万亿 。这充分说明了人类好奇心的无限性。
七、AGI的黎明与P(Doom)的阴影:我们离终点还有多远?
随着模型能力的飞速提升,AGI(通用人工智能)的实现似乎不再遥远,这也将关于AI末日概率(P(Doom))的讨论从科幻推向了现实。皮查伊对这一终极风险的看法,展现了一种独特的、基于人性集体智慧的乐观。
1. AGI时间表:我们正处于“锯齿状”智能时代
弗里德曼将话题引向了AI领域的终极目标:AGI(通用人工智能)和ASI(人工超级智能)。AGI通常被定义为在人类主要的智力活动领域达到专家水平的AI,而ASI则是AGI通过自我改进后达到的、远超人类的智能形态 。
他直接问皮查伊:我们会在2030年迎来AGI吗?皮查伊首先引入了一个更接地气的概念——“AJI”(Artificial Jagged Intelligence,人工锯齿状智能),这个词可能由安德烈·卡帕西(Andrej Karpathy)首创,用来形容当前AI能力发展极不均衡的状态 。一方面,模型在某些方面展现出惊人的能力,另一方面,它们又会在一些看似简单的问题上(比如数一个单词里有多少个字母)犯错 。
皮查伊认为,我们正处在AJI阶段 。对于AGI是否会在2030年实现,皮查伊持谨慎态度。他认为,人们总是在不断提高对AGI的定义标准 。尽管他在Waymo自动驾驶汽车穿行于旧金山繁忙街道时,或在使用Project Astra与世界互动时,都看到了“AGI的惊鸿一瞥” ,但他感觉我们离真正的AGI还有距离 。
他预测,AGI的实现可能会略晚于2030年(这个预测和DeepMind创始人哈萨比斯的观点一致)。然而,他紧接着强调,这个具体的时间点和定义本身并不重要。“我确信的是,到2030年,我们将取得如此巨大的进步,以至于我们必须去应对其带来的巨大后果——无论是积极的还是消极的。”
2. P(Doom)末日概率:人性是终极安全阀
谈到ASI可能带来的生存风险,即社区内热议的“P(Doom)”(末日概率,也就是AI让人类毁灭的概率),弗里德曼坦言自己的估算是10% ,并询问皮查伊的看法。
皮查伊承认,这是一个在Google内部也会不时被讨论的严肃话题 。他没有给出一个具体的数字,而是提供了一个独特的、基于社会动力学的乐观视角。他类比道,在一个大型组织中,如果你能统一所有人的动机和激励,几乎可以实现任何目标 。虽然统一全人类的目标极为困难,但如果AI的末日风险(P(Doom))真的变得非常高且具体,它反而会成为一个强大的统一力量。“如果P(Doom)真的很高,全人类都会联合起来确保它不会发生。” 他认为,这种威胁的真实性会激发人类前所未有的集体智慧和行动力去解决问题 。因此,他认为这里存在一个“自我调节”的机制。“我对P(Doom)的情景感到乐观,但这并不意味着我认为潜在的风险不高。我只是对人类能够挺身而出、迎接挑战抱有很大信心。”
弗里德曼对此观点进行了补充,他提出了一个常被忽略的变量:没有AI的末日概率是多少? 气候变化、核战争、流行病等风险同样威胁着人类文明。AI或许不仅是风险,更是帮助我们解决这些复杂问题的关键工具 。皮查伊对此表示赞同,他认为在应对一些最棘手的全球性挑战时,拥有一个AI“伙伴”将大有裨益 。
面对AGI可能带来的巨大机遇与风险,领导者的决策变得至关重要。一年前,当外界舆论普遍认为Google已在AI竞赛中掉队时,皮查伊正是在内部推动着一系列影响深远的变革,其中最艰难的莫过于合并DeepMind和Google Brain这两大顶尖研究团队。
八、风暴中的舵手:合并DeepMind与Brain的艰难抉择
面对AGI可能带来的巨大机遇与风险,领导者的决策变得至关重要。一年前,当外界舆论普遍认为Google已在AI竞赛中掉队时,皮查伊正是在内部推动着一系列影响深远的变革,其中最艰难的莫过于合并DeepMind和Google Brain这两大顶尖研究团队。
弗里德曼将话题带回到了现实的领导力挑战中,他回忆起一年前,当时铺天盖地的文章都在宣称“Google已经迷失”、“皮查伊是领导Google渡过难关的错误人选” 。他询问皮查伊,在那段被外界普遍看衰的时期,他是如何度过的,以及做出了哪些关键决策。
皮查伊坦言,作为CEO,他最重要的赌注就是推动公司全面转向“AI优先” ,并为负责任地开发AGI做好准备。尽管外界充满噪音,但他对公司内部正在构建的东西有清晰的认识 。他善于将信号与噪音分离,就像潜水一样:“水面可能波涛汹涌,但只要下潜一英尺,就是宇宙中最平静的地方。” 他清楚地知道,Google拥有像TPU(张量处理单元)这样的长期技术投资 ,并且正在训练强大的Gemini模型,只是这一切需要时间才能显现成果 。
在这期间,皮查伊做出了一个极其重要且艰难的决定:将Google内部两大顶尖AI研究团队——Google Brain和DeepMind合并 。弗里德曼将此举比作“把斯坦福和MIT合并成一个院系”,其难度可想而知,尤其是在涉及到顶尖科学家的自尊心(ego)和截然不同的组织文化时 。
皮查伊描述了两个团队的差异:Google Brain更像是一个自下而上、项目多元化的研究机构,诞生了许多重要的研究突破 ;而DeepMind则有着一个非常明确、自上而下的构建AGI的愿景,并坚定地朝此方向前进 。推动这次合并并非易事。皮查伊坦承,那段时间有过一些“不眠之夜” 。幸运的是,当时Google Brain的领导者杰夫·迪恩(Jeff Dean)表达了希望回归更纯粹的科研岗位的意愿 ,而DeepMind的联合创始人戴密斯·哈萨比斯(Demis Hassabis)则是领导合并后新团队的自然人选 。皮查伊称赞了哈萨比斯、迪恩以及科莱·卡夫乔格鲁(Koray Kavukcuoglu)等领导者,他们付出了巨大的努力,才将两个团队的优势成功结合 。
在那个充满压力的时刻,皮查伊承认自己可能比平时更加“强势”和“紧迫” 。但他认为,这是身处“战壕”中激烈工作的常态 。他强调,作为领导者,必须做出少数但“有重大影响的决定”(consequential decisions) 。在这些时刻,即使团队成员有激烈反对,他也必须做出清晰的决策,并要求大家“可以不同意,但必须执行”(disagree and commit),以确保整个组织能够继续前进 。
九、再造互联网首页:AI重塑Google搜索的机遇与博弈
在内部重组团队、统一AI研发力量的同时,Google也必须回答一个关乎其核心业务未来的问题:如何将强大的AI能力融入拥有数十亿用户的搜索产品中?这引发了一场关于“十个蓝色链接”经典范式是否会被彻底颠覆的内部博弈。
弗里德曼指出,Google搜索的简约界面和“十个蓝色链接”已成为互联网的标志性符号 ,几乎是互联网的“首页”。对这样一个传奇产品进行大刀阔斧的改变,无疑是一项高风险的决策 。他好奇,在推出AI Overviews(AI概览)和AI Mode(AI模式)的过程中,内部经历了怎样的讨论和博弈 。皮查伊解释说,Google搜索一直在进化,尤其是在移动互联网时代,用户需要更直接的答案 。而现在,AI的强大能力让这种进化得以加速 。
他阐述了当前搜索产品演进的核心设计理念:AI作为上下文层:AI Overviews并非要取代网页链接,而是作为其上的一个“上下文和总结层” 。它会整合多个网页的信息,提供一个综合性的概览,但其最终目的仍然是引导用户访问原始网页 ,帮助他们做出更高质量的点击决策 。
AI Mode作为前沿试验田:AI Mode是一个独立的标签页,它将搭载Google最前沿的模型和功能,例如“查询扇出”(query fan-out)——即一个用户查询会触发后台进行多次、多维度的搜索,然后将结果综合呈现 。这个模式允许用户进行更具对话性的、多轮的探索 。AI Mode将提供最尖端的体验 ,而其中被验证行之有效的功能,会逐渐迁移到主搜索页面 。扇出系数(Fan-out),是电子技术中表明逻辑门带负载能力的一个量度,其定义为一个逻辑门电路能驱动与之同类逻辑门的个数。
一个常被忽视的重大意义在于语言。Google搜索负责人伊丽莎白·里德(Elizabeth Reid)曾提到,通过AI模式,一个不懂英语的用户在搜索时,AI可以整合全球英文网页的信息并以用户的母语呈现摘要 。这极大地扩展了非英语世界用户可触及的信息范围,打破了语言壁垒,对于解锁全球认知能力具有深远影响 。当然,这种变革也带来了商业模式的挑战。弗里德曼直接提问,AI模式何时以及如何引入广告 。皮查伊表示,早期会专注于打磨用户体验 。
但他强调,广告本身也是一种商业信息 ,Google会以同样的质量标准来对待它。未来,AI甚至可能帮助找到呈现广告的最佳方式,使其更有用、更不打扰 。同时,Google也会像在YouTube上那样,探索订阅与广告混合的模式,为用户提供更多选择 。
十、登月计划的耐心:Chrome与Waymo的启示
无论是重塑搜索,还是从零开始打造Chrome浏览器,Google的历史充满了挑战传统、押注“疯狂想法”并最终取得成功的案例。其中最具代表性的“登月项目”之一——Waymo自动驾驶,更是以其超乎寻常的耐心和毅力,展示了在喧嚣中坚持长期主义的价值。
1. Chrome的诞生:一个被认为疯狂的想法
弗里德曼称赞Google Chrome是他心目中历史排名前三甚至第一的软件 ,并回顾了皮查伊作为早期推动者的关键角色。在当时,从零开始构建一个浏览器被认为是一个疯狂且极其困难的想法 ,甚至时任CEO埃里克·施密特(Eric Schmidt)也深知其难度 。
皮查伊回忆道,2004至2005年,随着Ajax技术的兴起,Flickr、Gmail、Google地图等动态应用的出现,网页正从静态文本向富应用演变 。然而,当时的浏览器并未为此做好准备,JavaScript执行效率极低,且缺乏现代操作系统的稳定性和安全性 。
Chrome团队的愿景是将操作系统的核心理念引入浏览器 。他们开创性地设计了安全的沙盒架构,让每个标签页都成为一个独立的进程 ,这在当时是独一无二的。团队还在丹麦找到了一支顶尖团队,打造了V8 JavaScript引擎,其性能是当时其他引擎的25倍 。项目名称“Chrome”的由来,正是因为团队希望削减浏览器本身繁杂的“外壳”(Chrome),将内容本身推到最前台 。
皮查伊认为,Chrome的成功验证了拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)一直倡导的“登月思维”(moonshots)的价值 。从事雄心勃勃的项目能吸引最优秀的人才 ;由于难度高,竞争者少,可以开辟出独特的赛道 ;而且,即使最终只实现了目标的60%或80%,其成果也往往是巨大的成功 。我们在文章最后,对这一创新做一个思维框架总结。
2. Waymo的坚持:在低谷时加倍投入
Waymo自动驾驶项目是“登月思维”的另一个典范。弗里德曼表示,十多年前第一次看到Google自动驾驶汽车,是他对机器人技术产生更深热爱的一个“啊哈时刻” 。
皮查伊坦言,Waymo经历了漫长的“最后20%”的攻坚阶段,这部分工作占据了80%的时间 。但Google始终清楚,他们在技术上拥有领先优势 。一个反直觉的事实是:“正是在外界最质疑Waymo的时候,我决定向其投入更多资金。” 因为他深信,Waymo是在构建一个通用的AI机器人,这与公司的核心技术方向完全一致 。
对于来自特斯拉等公司的竞争,皮查伊表现得相当开放。他提到Google是SpaceX最早和最大的支持者之一 ,并认为自动驾驶和交通领域的市场空间极其广阔,足以容纳多个成功的参与者 。他预测,在所有未来的情景中,特斯拉和Waymo都能发展得很好 。
Waymo作为轮式机器人的成功,仅仅是AI赋能物理世界的一个开端。当AI从云端走向边缘,从软件渗透到硬件,它将如何重塑我们最贴身的计算平台——Android(Android)操作系统,并开启一个由眼镜、手机和各类设备无缝协作的增强现实(XR)新时代?
十一、从手机到眼镜:Android系统与XR的AI化未来
弗里德曼指出,Waymo本质上是一个四轮机器人 ,它在物理世界中的成功探索,很自然地引出了关于通用机器人技术的话题。皮查伊确认,GoogleDeepMind团队正专注于“Gemini机器人”项目 ,致力于构建通用的、能在现实世界中安全运行的AI模型,并已开始与一些公司合作探索应用 。他认为,硬件的进步已经很快,而AI的突破正在解决长期以来困扰机器人领域的软件瓶颈 。
这种将强大AI模型与物理世界交互的趋势,将深刻地影响移动操作系统的未来。皮查伊认为,计算领域的重大创新往往伴随着人机交互范式的变革 ,从图形用户界面(GUI)到移动设备的多点触控(multi-touch),再到语音交互 。他相信,AR(增强现实)是下一个重要的交互范式。过去,AR的发展受限于两大挑战:一是硬件系统集成的极高难度;二是缺乏自然流畅的交互方式。而AI的出现,恰好解决了第二个难题。Project Astra这样的多模态AI助手,对于Android XR世界的成功至关重要 。它能理解你所见所闻,实现无缝的对话式交互。
皮查伊进一步畅想了Android操作系统的未来。他认为,我们目前仍生活在“应用和快捷方式”的范式中 。未来,操作系统本身需要变得更具“智能体”(agentic)特性。这意味着,操作系统能够主动理解你的意图,学习你的重复性行为模式,并为你量身定制服务,而不是被动地等待你打开一个个应用去完成任务 。
在访谈后的演示环节,弗里德曼亲身体验了Google的XR眼镜原型。他对其极简、高效的设计赞不绝口。例如,在地图导航时,抬头看前方会显示简洁的转向箭头,而低头看则会展开更详细的地图,整个过程无缝且直观 。这种体验的实现,背后需要操作系统层面的深度整合和AI能力的无处不在 。皮查伊透露,这款XR设备预计今年晚些时候交到开发者手中,明年推向消费市场 。
当AI最终在所有领域超越人类,从驾驶汽车到设计操作系统,甚至理解我们自身,我们将向这个新诞生的“智能”提出怎样的问题?这不仅是对技术的探索,更是对人类存在意义的深刻反思。
十二、与AGI对话:探索宇宙奥秘还是叩问内心?
在访谈的结尾,弗里德曼抛出了一个富有想象力的问题:“如果你拥有了一个确定的AGI,一个可以回答任何问题的智能体,你会问它什么?”
皮查伊的回答出人意料地转向了内在。他认为,AGI或许会主动告诉我们一些我们应该知道的事情 。但如果由他来提问,他最感兴趣的是让AGI帮助我们更好地理解自己 。他相信,一个足够强大的AGI能够以一种深刻的、我们自己都未曾想到的方式来理解个体,揭示我们内心的运作模式。
当然,他也提到了更宏大的可能性,比如帮助我们理解宇宙的本质 ,扩展人类知识的边界。但他反复回到的,是AI在个人层面的洞察力。他认为,与AGI进行关于“什么能让我快乐”的对话,可能会揭示出一些“事后看来显而易见,但说出来时却令人豁然开朗”的深刻真理,就像伟大的艺术、书籍或与挚爱的谈话所能带来的启示一样 。
弗里德曼则给出了一个更具科幻色彩的答案。他的第一个问题会是关于外星文明:“宇宙中有多少个活着的和已经消亡的外星文明?” 他会追问它们在哪里,是否危险 ;如果不存在高等文明,原因是什么?是否存在一个“大过滤器”(Great Filter),阻止了智慧生命的普遍发展? 他渴望从AGI那里得到关于费米悖论(Fermi paradox)的解答 。
这场关于终极问题的讨论,恰好呼应了Google的核心使命。皮查伊提到,一项MIT的研究曾估算,Google搜索每年为每个用户创造的价值相当于数千美元 。但这种衡量是有限的,它无法量化AlphaFold这样的科学突破带来的长期价值 ,也无法衡量因知识获取而带来的生活质量的提升和好奇心的满足 。
当被问及是什么让我们人类变得特别时,皮查伊认为,在资源日益丰富的未来,同理心、善良等人性中独特的光辉将更加凸显 。他作为一个天生的乐观主义者,坚信人类文明的轨迹是不断向好的 。无论面对何种挑战,他都相信“我们总能集体奋起,推动边界向前” 。
十三、Takeaway:登月引擎,一个皮查伊的思维框架
通过皮查伊在访谈中关于Chrome和Waymo项目经验的剖析,我们似乎可以构建一个指导组织进行颠覆性创新的战略思维框架——“登月引擎”。
这个“登月引擎”框架由三大核心要素构成:1) 雄心驱动(Ambition-Driven)、2) 优势杠杆(Leveraged Advantage)、3) 耐心资本(Patient Capital)。这三者并非线性步骤,而是一个相互作用、动态强化的飞轮。
其层次关系是:“雄心驱动”设定了10倍改进的宏大目标,是引擎的起点和方向;“优势杠杆”利用现有能力和独特洞察,为实现目标提供初始动力和可行性;“耐心资本”则是在漫长的攻坚过程中,持续为引擎提供燃料,抵御短期压力。其核心逻辑是:真正的颠覆性创新并非凭空产生的豪赌,而是通过有策略地选择宏大目标,并以独特的组织优势和坚定的长期主义为支撑,从而系统性地将“疯狂的想法”转化为改变行业的现实。
1. 雄心驱动 (Ambition-Driven):指选择那些旨在实现数量级提升(通常是10倍)而非百分比提升的宏大项目。如皮查伊所说,拉里·佩奇和谢尔盖·布林倡导的“登月思维”,其价值在于“从事雄心勃勃的项目能吸引最优秀的人才”。这一要素要求组织敢于将目标设定在看似“疯狂”的领域。2. 优势杠杆 (Leveraged Advantage):指在选择“登月”方向时,必须基于组织已有的、难以复制的核心优势或独特洞察。以Chrome为例,Google的“优势杠杆”是对网络正从静态文本向动态应用演变这一趋势的深刻洞察,以及其在操作系统和软件工程领域的顶尖人才储备。它回答了“为什么是我们能做成这件事?”的问题,确保“登月”不是一次盲目的太空竞赛。3. 耐心资本 (Patient Capital):指组织在面对长期不确定性、外界质疑甚至短期挫折时,仍能持续投入资源和信任的战略定力。用皮查伊在访谈中的话来说,Waymo经历了漫长的“最后20%的攻坚阶段”,正是在“外界最质疑Waymo的时候,我决定向其投入更多资金”。这不仅是财务投入,更是领导层对项目长期价值的坚定信念。
而Chrome的诞生是“登月引擎”框架的体现。
1. 雄心驱动:在当时,从零构建一个浏览器被普遍认为是“一个疯狂且极其困难的想法”。其目标不是比IE或Firefox快10%,而是要从根本上重新定义浏览器——将其从一个简单的页面渲染器,变成一个稳定、安全、高效的“网页应用操作系统”。这是一个典型的10倍目标。2. 优势杠杆:
洞察杠杆:皮查伊团队敏锐地洞察到Ajax技术兴起后,网页向富应用演变的不可逆趋势,而当时的浏览器架构已成为瓶颈。
技术杠杆:Google拥有世界顶尖的软件工程师,他们创造性地引入了“沙盒架构”和“独立进程”,这是操作系统级的思维降维打击。同时,他们能找到并打造出性能提升25倍的V8引擎,这是其工程实力的直接体现。
3. 耐心资本:尽管时任CEO埃里克·施密特都深知其难度和风险,但项目依然获得了支持。从2004年的洞察到2008年发布,Google持续投入资源,允许团队在一个看似已有霸主的市场里,耐心打磨一个全新的产品,最终大获全胜。
当然,我也要说,这个框架更适用于大型组织或资金充裕的初创公司,正在开辟全新赛道、构建长期护城河的颠覆性创新项目,但不适用于追求快速盈利或渐进式优化的常规业务。
也就是说,它能帮助组织打破“创新者的窘境”,避免因过度关注现有业务而错失下一代技术浪潮,也能创造强大的雇主品牌,吸引并留住最顶尖的人才。此外,如皮查伊所言,由于难度高,竞争者少,即便只实现60%的目标,其成果也往往是巨大的成功。
但是,该框架对资源和组织文化的要求极高,容错成本巨大,绝大多数公司不具备实施条件。它高度依赖领导者(如皮查伊)的远见和决心,容易因领导层变动而中断。同时,漫长的投入周期可能与资本市场的短期回报预期产生剧烈冲突。
简单说,就是有钱有资源才行。