拥有一切的谷歌 输掉了ChatGPT首战
微软与Google围绕 ChatGPT 的这场龙争虎斗,以出人意料的方式揭开了第一季的结局。北京时间 2 月 8 日晚间,Google在巴黎举行 AI 发布会,向外界正式披露聊天机器人产品 Bard。作为 ChatGPT 最重要的挑战者,Google过去两周没少为这场发布造势,但万众瞩目的产品演示却出了重大纰漏——Bard 在回答“詹姆斯·韦伯空间望远镜的新发现”这个简单问题时,错误地把另一个望远镜取得的成就安给了前者。
Google的股价在盘后大跌 7.4%,市值一夜蒸发近千亿美元。形成鲜明对比的是:投资 OpenAI 数十亿美元的微软,半天前刚刚举行了一场小型媒体活动,发布集成最新版模型的搜索引擎 New Bing 和新版浏览器 Edge,微软在过去两天上涨近 4%,市值重回 2 万亿美元,并在Google翻车、全球 ChatGPT 概念回调之际,盘后继续微涨 0.5%。
将Google卷入这场生成式 AI 大战,微软毫不掩饰自己的想法。“我们的创新,将让Google come out and dance。我们想让人们知道,是我们让他们 dance。”微软总裁纳德拉直言。
微软的尝试取得了成果,除了市值上涨,AI 功能的加入也如他们预期般,看到了撕开Google搜索引擎长城的曙光。新版功能小范围开启试用后,Bing 已经跃居至 iOS 免费榜的第 12 位,根据 data.ai 的初步估计,Bing App 的新下载量增长了 10 倍。
但这场围绕 ChatGPT 的生成式 AI 战争才刚开始,聊天机器人能否动摇搜索引擎的市场格局还有待时间观察。此外,围绕大模型的竞争也不止于搜索引擎,今天人们正在使用的大部分软件和服务都有可能被生成式 AI 重塑,更多产品和服务都会被卷入其中。
甚至更进一步,随着类 ChatGPT 以及更广泛的 AI 能力需求的增加,对微软、Google、阿里、百度和国内外所有的云服务平台提供商而言,生成式 AI 相关能力将成为重要的基础设施,围绕后者的竞争,将成为未来数年改变云服务市场的 X 因素。
01
先后发布新产品,
Google跌了,微软涨了
上一次科技巨头之间刺刀见红,还要追溯到疫情前 TikTok 掀起的短视频大战。ChatGPT 爆火后,资本、创业者和科技巨头纷纷卷入,科技圈的热闹恍如隔世。
打响第一场白刃战的是Google和微软,主题是搜索引擎。2 月 2 日Google宣布,8 号将举行现场发布会,介绍有关搜索引擎的最新产品。一周内,先是微软短暂上线疑似“集成 GPT-4 的 Bing 搜索版本”激起人们的好奇,随后Google总裁 Pichai 于 2 月 6 日公布了用于搜索服务的聊天机器人 Bard,同一天,微软公布要在Google发布会的前一天 7 号举行发布会,介绍最新的搜索引擎 New Bing 和浏览器 Edge。
“这是搜索的新一页,新的范式已经出现,军备竞赛从今天开始。”发布会上,纳德拉充满信心地宣布。ChatGPT 走红后,业界很快意识到,大语言模型对于更新搜索产品的临界点到来了。在最新的产品发布中,Google和微软共同强调了这一点:以自然语言提问查询,AI 基于多方信息、返送重新创作后的针对性回答。用户还可以基于首轮回答,再进行追问。
两家都给出了购物场景下的查询案例。
比如Google:我想为家庭买一辆新车,应该考虑些什么?Bard 会建议你考虑预算、座位数、设计特点、安全性、动力类型几个维度。接下来,你可以追问,如果想买一个电动车型,有什么优势/不足?
还可以将对话的主题从选车,转移到旅行计划。你可以接着问 Bard:第一次长途自驾将会从旧金山到圣克鲁斯,沿途有什么停车点?
对比之下,微软展示的产品体验则更完善。
在微软的演示中,给出了挑选电视的例子。当你在搜索引擎中输入“最好的 65 英尺电视”,Bing 就会为你罗列出不同的产品。在展示形式上,Bing 的回答会在页面的右边栏框中,这样保证了用户可以同时看到传统搜索引擎给出的链接、以及生成式语言模型给出的综合回答。这也是微软所谓的“副驾驶”体验。
当想进行追问,则可以从“chat”选项切入,进入对话界面。基于已有的答案进行追问:哪一款最适合游戏?在给出的回答中,也可以继续追问,哪一款最便宜?
从产品的形态设计上而言,微软更为完备,考虑到了问答与传统搜索模式之间的自由切换。而Google目前仅仅展示了问答部分的产品形态。
更关键的部分在于,在 Demo 的展示中,微软显示了信息来源,以角注和“Learn More”的形式供用户核实与进一步了解。在Google的 Demo 演示中则没有这个部分。
此外,Google还展示了向 Bard 提问开放式问题。例如:观星时最好的星座是什么?搜索顶部的位置也会返回生成一段答案,同样没有显示信息来源。
这带来的隐患是,当答案里有信息错误时,更难以核查。Pichai 在Google博客中展示的第一个 Demo,就出现了这样的问题。回答“怎样向 9 岁的孩子解释詹姆斯·韦伯空间望远镜的新发现?”时,Bard 称韦伯望远镜拍摄到了首张地外行星的照片。这就是一个事实性错误,这一成就实际上来自 2004 年的智利甚大望远镜;此外,第一条中“2023 年,韦伯望远镜发现了大量昵称为『绿豌豆』的星系”的时间也出现了错误,应该是 2022 年 7 月。
这样的事实性错误,ChatGPT 经常犯,如今出现在了为 Bard 提供技术支持的 LAMDA。这种错误,成为搜索引擎的服务时,就会影响到使用者对产品的信任。因为没有信息来源,使用者也无法通过核对发现错误。产品 Demo 中出一次生成答案就出现两次错误,给用户带来了强烈的不良观感。
而没有显示引用来源,也招致了搜索引擎产的行业人士对目前产品形态的不满。“引用必须要有,希望这不是Google前进的方向,这样不对”,“在目前的实验形式中,我没有看到任何的归因或引用,没有链接,没有点击。这是对出版商的战争……”两位行业人士评论道。
真实产品与期待值的落差,致使Google盘后大跌。但这也是今天聊天式机器人产品需要面对的现实,甚至从某种意义上来说,在语言大模型积累多年的Google,即使将最新功能加入搜索产品,还有许多影响用户体验的问题需要解决。
02
Google的谨慎与无奈
从目前更新的产品形态上来看,Google落后微软。而从之前传出的 Picha 在内部发起“红色警报”(Red code)、搜索引擎两位创始人重回公司商讨 AI 战略等消息来看,Google的确是在 ChatGPT 大火之后,调整策略,紧急迎战。
ChatGPT 的爆火,让公众形成了印象,这是目前最先进的技术。但是在学术界则认为,ChatGPT 并没有在技术上领先很多。
乔治亚理工学院的计算机教授、机器学习专家 Mark Riedl 对媒体表示,ChatGPT 背后的技术并不一定比Google和 Meta 更好。但 OpenAI 公开语言模型,让公众使用这一行为,带来了极大优势。
深度学习三巨头之一、Meta 研究院院长 LeCun 对媒体表示:“(ChatGPT)这不是什么革命性的东西,尽管公众是这么认为的”,“这是很好的组合,这是很好的做法。”不仅如此,刚刚离职的 OpenAI 的前产品负责人 Fraser 表示赞同 LeCun 的观点,并说“这本不该引起争议”。
LeCun 在 Twitter 上解释,“我不是批评 Open AI 的工作和他们的主张。我试图纠正公众和媒体的看法,他们认为 ChatGPT 是一个令人难以置信的全新的、创新的、独特的技术突破,远远领先于其他所有人,事实并非如此。”
大公司差不多同时期开始研究语言大模型。第一个重要的技术突破是 2017 年Google的神经网络架构 Transformer,这也是从去年开始爆火的生成式 AI 模型所用到的底层技术。Transformer 能够让机器在处理语言信息时关注单词之间的联系,并预测接下来会是什么单词。这大大增强了模型对于语言的理解能力。
2017 年的 Transform 网络论文,成员大部分来自Google|来源:arXiv
随后,Google于 2018 年发布了预训练大模型 BERT;2021 年,OpenAI 发布了预训练模型 GPT-3,已经表现出了很强的写作、对话能力,但也表现出致命缺陷,就是“口无遮拦”,会生产极端种族主义、暴力等相关的内容;同年,Google发布了预训练模型 LamDA,也显示出了良好的对话能力。
ChatGPT 最初的项目名称为“Chat with GPT-3.5”,是在 GPT-3 与即将发布的 GPT-4 之间,OpenAI 因为担心对手公司提前发布聊天机器人 ChatBot,而临时确定的项目。工作人员接到的任务是,在两周之内快速发布一个聊天机器人。让所有人惊讶的是,它能在短时间吸引如此多的使用者,并加速了AI进入搜索产品的进程,随之引发了Google与微软间的较量。
ChatGPT 走红不久,Google内部便开始了担忧。“对于Google来说,这是一次错失良机吗,毕竟我们已经拥有 LamDA 一段时间了。”
12 月初的内部会议上,这个问题为员工们所关注。那时,Google AI 部门主管杰夫・迪恩 (Jeff Dean) 表示,Google拥有类似能力,但如果出现问题,代价将更高,因为人们必须相信从Google得到的答案。在技术公开和产品化上一直行为保守,对声誉风险的担忧是重要因素。
Google员工们表示,多年来,员工一直在提议将聊天功能加入搜索,这也是很明显的演变趋势。但是Google有充分的理由不着急迭代,不仅仅因为返送更有针对性的回答会减少广告空间。而是如果Google提供的聊天机器人给出一个不健康或者抄袭而来的答案,就会增加责任风险。而就外部环境而言,Google这几年一直面临反垄断审查或诉讼,再增加这样的道德风险肯定会带来更大压力。
如今,像墨菲定律起作用一样,Bard 所犯的错误,恰恰是Google原先所担心的问题,并在Google与微软第一次亮相比拼中,带来了负面效应。在技术封装进产品这一步上,Google因前期保守、仓促应战而落后。
摩根士丹利的分析师 Brian Nowak 表示,语言模型可能抢占市场份额,并扰乱Google作为互联网用户入口的地位。从 Bing App 下载量增长 10 倍来看,这个担忧绝对不是空穴来风。但基于Google的技术储备,他也表示,期待Google更多的产品表现。
03
搜索引擎战之下,
AI 成为战略重心
无论是微软还是Google,目前两家发布的新产品尚未完全放开使用。
微软的 New Bing 需要登记 WaitList,等待功能发放。截止发稿,我多次尝试从 Edge 官网进入 New Bing 的 Waitlist 页面,尚无法打开。
New Bing Waitlist 页面无法打开 |来源:凌梓郡
而Google的 Bard 目前仅开放给受信任的测试人员,在这之后,将是依托 LaMDA 轻量级模型版本发布。“在未来几周,我们会继续向更广泛的公众开放此服务。”Pichai 在博文写道。
因此,产品模型仅仅是做了演示,还没有大规模发放到用户手中体验。之前人们所关心的问题,比如胡编乱造、大规模使用的成本问题,目前还只停留在讨论阶段。
成本是必然需要面对的因素。据了解,Google未来会优先使用轻量级版本的 LamDA,就是出于计算成本的考虑。
此前,OpenAI CEO Altman 表示,ChatGPT 回复一次的成本为几美分。Brian Nowak 估计,ChatGPT 每次查询的成本约为Google每次传统搜索查询成本的 7 倍,如果依托微软的云服务 Azure 提供最低价,可以降低到传统搜索成本的 4 倍。考虑到搜索是一个日均百亿级使用次数的高频行为,长期运行,潜在的成本增加是一个天文数字。
微软官方披露,这次的 New Bing 背后驱动的是下一代语言模型,比 ChatGPT 更强大,也是专门为搜索制定的。在发布会后的问答环节,对于成本问题,微软的态度也很干脆,“我不打算回答这个。”对于模型胡编乱造的问题,回应则是“我们从一开始就在做这件事。我们正在衡量该模型在搜索结果中哪些地方没有站稳脚跟,但它并不完美。”
纳德拉说,“AI 将从根本上改变每一个软件服务类别,从最大的软件服务类别——搜索开始。”搜索引擎的变革刚刚开启,依旧有许多尾部问题需要花费时间解决。从产业角度而言,它或许意味着,以大模型为基础,AI 进入了全新的阶段。这或许是微软、Google、Meta 甚至苹果,以及国内的阿里、百度都在战略层面开始规划的原因。
目前,Google和微软都处于类似的时期,主要业务疲软。前不久,两家都交出了一份不太理想的 2023Q2 财报,接下来业务增长的预期也不高。Google广告收入出现上市以来第二次下滑,云业务虽然保持两位数增长,但同比增速正逐季回落。微软主要的 Office 和 Azure 业务增速都在放缓。整体业绩疲软,收入增速为 2%,持续下滑。纳德拉表示,微软在 2022 年末就面临着核心业务 Windows+Office 的业绩下滑。
与此同时,两家都在财报电话会上强调了AI作为战略的重要性。
Google表示,从下个季度开始,其研究机构 DeepMind 的财务状况将单独列出,体现在季报中。“AI 已经成为 Alphabet 的战略重心,我们也看到 AI 领域潜藏的巨大机遇。目前 DeepMind 的研发领域将成为 Alphabet 未来产品组合的核心。”前不久,Google便通过投资 Anthropic 3 亿美元,成为其云供应商。
微软主要强调了在过去的三年多时间里,微软致力于训练超算、打造推理基础设施,为未来 AI 进入应用程序做准备。也就是意味着,微软的云设施和服务,需要嵌入更强的 AI 能力,“对于 Azure 来说,AI 将是其核心组成部分”、“我们希望为大家提供的也远不止 Azure OpenAI 服务。如何将 OpenAI 与微软的 Azure Synapse 分析服务相结合等,都在我们的考虑范围之中。”
不难看出,无论是Google还是微软,都将会以大模型为基础设施,加快产业布局,其中的重要部分包括嵌入 AI 能力的云设施、基于大模型的 API。Forrester Research 公司 AI 分析师 Rowan Curran 表示,微软可以利用目前与 Open AI 的合作与热度,获得更重要的短期回报,这便是扩大 Azure 、OpenAI API 及更广泛 AI 和机器学习平台的需求。
长期来看,当搜索产品大规模上线,稳定提供服务,可靠性和成本将成为更重要的影响因素,这也将考验双方基础设施的能力。
大模型领域独角兽 Stability AI 的创始人 Emad 曾表示,ChatGPT 将打败Google的故事听起来有点愚蠢。因为Google拥有最好的 LLM(语言大模型)全套团队和定制芯片,没有竞争对手可以在创新、成本、或者市场上和其较量。这些基础设施包括 PalM(单项语言模型)、LAMDA、Chinchilla(少量参数语言模型)、MUM(多任务统一模型)、TPU 等。
很明显,Google首战的表现出乎了所有人的预料。面对有 OpenAI 的模型能力加持、来势汹汹的微软,全世界见证了一场巨人的跌倒。