1ccf
发布于 2026-01-07 / 2 阅读
0
0

谷歌如何重拾活力并领先于 OpenAI

发布时间:2026.01.06

源地址:https://www.wsj.com/tech/ai/google-ai-openai-gemini-chatgpt-b766e160

在 ChatGPT 主导早期聊天机器人市场后,谷歌凭借强大的人工智能模型实现反击,迎来多年来最大规模的搜索引擎革新。

八月清晨的凌晨时分,谷歌一位人工智能项目经理将其 DeepMind 实验室最新研发的成果上传至一个用于评估 AI 模型的平台。

谷歌在人工智能竞赛中落后,而其竞争对手 OpenAI 的 ChatGPT 聊天机器人已吸引了数亿用户。谷歌的研究人员希望,一项全新的功能——极速图像生成器,能够帮助这家搜索巨头在 ChatGPT 的短板领域取得优势。

Naina Raisinghani 在谷歌内部以熬夜工作闻名,她需要为新工具起个名字以完成上传。那时已经凌晨两点半,周围没人,于是她随手编了一个名字,结合了朋友们给她的两个昵称:“Nano Banana”。

短短几天内,Nano Banana 就登顶了 LM Arena 平台的性能排行榜,成为 X 上的热门话题,使用量远超谷歌的预期。到了九月,谷歌的 Gemini AI 应用已成为苹果应用商店下载量最高的应用。

两个月后,谷歌推出了迄今为止最强大的 Gemini 模型,性能远超竞争对手,成为最先进的 AI 聊天机器人。凭借这一优势,这家 Alphabet 旗下公司成功超越 OpenAI,跃居 AI 领域的领先地位。

5d32861ac8562876345bb18ea41d9590.jpg

谷歌深厚的科学研究基础、投入数十亿美元开发定制硬件的决心,以及近年来通过领导层变动加快实验步伐的举措,正逐渐显现成效。同时,谷歌也成功守住了其至关重要的搜索业务——至少在目前——免受日益流行的聊天机器人对互联网使用方式带来的冲击。

谷歌的人工智能业务已开始通过搜索广告、面向消费者和企业的付费版 Gemini 以及自主研发的新型计算芯片销售,带来可观收入。去年十一月发布的最新 Gemini 模型在多项指标上超越了 ChatGPT,推动 Alphabet 股价大幅上涨,并引发 OpenAI 内部的紧急应对。随后,OpenAI 推出了更强大的 ChatGPT 版本,缩小了与谷歌的差距,尽管该版本的用户数量仍远超 Gemini。

谷歌首席执行官桑达尔·皮查伊在新款 Gemini 模型发布当天,强调了公司在人工智能领域的重大投入。他在内部备忘录中对员工表示:“很高兴看到我们以谷歌的规模推出这一产品。”

2015 年,皮查伊升任谷歌最高领导时,人工智能还是计算机科学研究者关注的前沿技术,几乎无人问津。次年,他宣布这家以搜索引擎、地图和办公软件闻名的公司将全面投入人工智能领域。

在公司博客发布的一份备忘录中,皮查伊写道,过去十年是以智能手机为中心的时代。“但在未来十年,”他预测,“我们将转向一个以人工智能为核心的世界,一个计算无处不在的世界。”

谷歌早在 2011 年就由计算机科学家杰夫·迪恩共同创立了名为 Google Brain 的人工智能研究部门,奠定了基础。迪恩曾参与开发支撑当今大型语言模型的神经网络技术。几年后,谷歌收购了总部位于伦敦的人工智能研究实验室 DeepMind,该实验室由国际象棋神童德米斯·哈萨比斯共同创立,他后来因开发辅助生物分子研究的人工智能系统而获得诺贝尔奖。

当时这一举措并未引起太多关注,但谷歌也开始自主设计人工智能芯片,认为为了支持语音识别等应用,必须大幅提升计算能力。这些被称为张量处理单元(TPU)的芯片,设计时注重比计算机的中央处理器(CPU)或游戏显卡的图形处理器(GPU)更低的能耗。事实证明,这一创新不仅改变了谷歌自身的发展轨迹,也对整个行业产生了深远影响。

im-03756316

谷歌开始设计自己的人工智能芯片。图为该公司 2021 年推出的一款张量处理单元。摄影:MICHAEL NAGLE/BLOOMBERG NEWS

不过,早期谷歌在开发自家聊天机器人时采取了谨慎态度。部分高管和研究人员对这项技术的安全性表示担忧,认为它可能产生不准确、有偏见或其他问题信息。

前谷歌大脑团队成员 Julia Winn 表示,聊天机器人最初并未被视为公司更广泛人工智能战略的核心。在早期模型测试中,聊天机器人很容易被引导产生种族歧视或性别歧视的回答。

谷歌对这类风险的重视程度远超我曾工作的任何地方,这也是情有可原的。这样的谨慎态度让一些公司研究人员感到不满,甚至有人因此离开了公司。

2022 年 8 月,谷歌推出了一款具备多种对话能力的聊天机器人模型,并通过名为 AI Test Kitchen 的应用向少数用户开放测试,这个平台相当于一个试验场。谷歌将该模型命名为 LaMDA,用户可以体验其中的三个功能:“Imagine It”、“List It”以及“Talk About It(狗狗版)”,后者专门用于与用户围绕狗狗展开对话。

ChatGPT 挑战

三个月后,OpenAI 在经过多年努力开发出不仅能进行对话,还能创作故事、笑话和计算机代码等内容的聊天机器人后,向公众开放了 ChatGPT。

五天内,已有一百万人报名参与测试。与谷歌的 LaMDA 不同,用户在使用过程中几乎没有受到限制。

一些谷歌员工多年致力于这项技术,却被后来者超越,心中难免愤懑。还有人对公众如此迅速地接受 ChatGPT 感到震惊。

分析师和投资者开始担心谷歌是否错过了科技的下一次重大浪潮。他们关注公司推出自有人工智能产品的速度,以及聊天机器人兴起是否会削弱谷歌依赖搜索和广告业务的收入,而这两项业务在 2022 年共带来了 2540 亿美元的营收。

im-788169

当 OpenAI 推出 ChatGPT 时,数百万人在几天内注册体验。这款聊天机器人曾于 2023 年在东京的一场贸易展上亮相。RICHARD A. BROOKS/AFP/GETTY IMAGES

谷歌的两位资深 AI 科学家 Dean 和 Hassabis 以及 2022 年加入的机器人专家 James Manyika,致力于整合 DeepMind 和 Brain 两大部门的 AI 训练工作。2023 年 1 月,他们向 Alphabet 董事会展示了打造公司迄今最智能模型的计划。

与此同时,谷歌急需一款聊天机器人快速推向用户。次月,谷歌推出了基于 LaMDA 模型的 Bard,但发布过程出现了失误。

在一段推广 Bard 的视频中,谷歌展示了该聊天机器人对詹姆斯·韦伯太空望远镜相关问题的回答。该机器人错误地称该望远镜拍摄了“首张太阳系外行星照片”。这一失误导致 Alphabet 股价下跌了 8%。

就在那时,谷歌联合创始人谢尔盖·布林刚刚退休,正参加一个聚会,与 OpenAI 的研究员丹尼尔·塞尔萨姆交谈。据知情人士透露,塞尔萨姆问他,为什么不全职投入人工智能领域。作为一名计算机科学家,难道 ChatGPT 的问世没有激发他的兴趣吗?

ChatGPT 正逐渐成为家喻户晓的 AI 聊天机器人,而谷歌的产品仍在摸索阶段。布林认为 Selsam 的观点有道理,便重新投入了工作。

b545b2cc890aca7774609de791a59646.jpg

2023 年大部分时间里,谷歌高管致力于协调和整合其人工智能开发工作。前员工表示,Brain 部门更注重研究,而 DeepMind 则侧重于产品开发,两者文化差异明显,合并后因此产生了摩擦。

尽管如此,谷歌相比其强劲对手仍拥有一项压倒性优势。OpenAI 需要依靠投资者融资,而谷歌则能凭借数十亿美元的利润自主投入研发。但谷歌也必须找到方法,防止生成式人工智能损害其“摇钱树”——占据网络搜索市场 90%份额、支撑其广告业务的核心地位。

魔术计划

为了探索人工智能驱动的搜索应有的样貌,谷歌启动了一个名为“Project Magi”的多团队项目,由 2024 年晋升为搜索副总裁的 Liz Reid 领导。她在一次采访中表示,团队面临的挑战是如何改造搜索系统,使其能够在答案不局限于单一网页时,迅速提供清晰明确的回应。

“人们不仅仅是使用搜索,更是依赖搜索,”她说。“如果你搞砸了,妈妈会告诉你,朋友会告诉你,孩子也会告诉你。”

im-20274655

谷歌现任搜索副总裁 Liz Reid 领导了多个团队,共同探索人工智能驱动的搜索应具备的形态。CAMILLE COHEN/法新社/盖蒂图片社

谷歌在 2023 年底前发布了首款 Gemini 模型。前员工表示,OpenAI 最初主要用文本训练 ChatGPT,而谷歌则在文本、代码、音频、图像和视频等多种数据上训练 Gemini,这也是其开发周期较长的原因之一。

尽管第一版 Gemini 在许多方面仍落后于 ChatGPT,但谷歌技术上更具野心的策略,正如其早期在神经网络领域的研究一样,随着时间推移将带来丰厚回报。

布林在去年十二月斯坦福大学的一场活动中表示:“我确实认为我们仍然受益于那段悠久的历史。”

自布林回归以来,他的大部分工作都集中在揭示 Gemini 存在的问题并推动解决。2024 年,布林还促成了谷歌以 27 亿美元收购人工智能研究人员丹尼尔·德弗雷塔斯(Daniel De Freitas)和诺姆·沙泽尔(Noam Shazeer)创办的初创公司,两人随后参与领导了 Gemini 项目的研发。

im-26044881

谷歌联合创始人谢尔盖·布林(右)在五月的年度开发者大会上与公司 DeepMind 部门负责人德米斯·哈萨比斯交谈。JEFFREY DASTIN/路透社

在五月谷歌 I/O 大会的舞台访谈中,布林表示自己一直保持高度参与。“我通常会深入技术细节,”他说,“这是我非常享受的一种特权。”

“我想用这个”

2024 年 5 月,谷歌推出了“AI 概览”功能——由人工智能生成的简短摘要,通常显示在搜索结果的顶部。谷歌发现,用户开始进行更多复杂的搜索。

随后,谷歌对其搜索引擎进行了多年来最大规模的改造:开发了 AI 模式,这是一种以聊天机器人形式回答查询的搜索选项。Reid 表示,内部多次演示展示了这一功能的潜力,但也凸显了在保持搜索速度和质量的同时,将其重新设计成聊天机器人模式的难度。

经过多次反复尝试,Reid 表示,她和团队的其他成员终于开始意识到这个工具的价值,决定将其公开推广。Reid 回忆道:“我们发现自己不仅仅是在测试它,而是会主动去使用,心里想着,‘哦,我想用这个。’”

谷歌于去年五月推出了 AI 模式,并发布了更强大的 AI 模型 Gemini 2.5,但这款产品并未引起员工们预期的广泛关注。自年初以来,Alphabet 的股价持续下跌,整个夏季表现依然低迷。

im-13306882

人工智能对谷歌搜索霸主地位构成的威胁,反而带来了意想不到的积极影响。2024 年 8 月,一位联邦法官裁定谷歌在网络搜索和搜索广告领域存在非法垄断。判决指出,谷歌每年向苹果支付 200 亿美元,以确保其成为 iPhone 制造商 Safari 浏览器的默认搜索引擎的协议具有反竞争性质。

谷歌的律师辩称,随着人工智能聊天机器人作为一种新兴且受欢迎的搜索形式出现,公司的垄断地位实际上已经终结。今年早些时候,法官采纳了这一观点,裁定苹果交易可以在仅做少量修改的情况下继续进行,这帮助谷歌避免了更严厉的处罚措施。

该裁决与八月推出的 Nano Banana 一同推动了谷歌股价的上涨。

负责 Gemini 应用及 Google Labs(一个新 AI 应用试验平台)的 Josh Woodward 将 Nano Banana 的发布形容为“一场成功的灾难”。随着全球用户生成的图像数量迅速从数百万飙升至数十亿,谷歌面临计算资源严重不足的挑战。为应对需求,公司不得不紧急借用服务器时间以扩充计算能力。

截至十月,Gemini 的月活跃用户已超过 6.5 亿,较七月的 4.5 亿大幅增长。

a1365cae5fb82bb6e226260dcb35afeb.jpg

去年十一月,Gemini 3 的发布引发了计算能力的新一轮瓶颈。谷歌早在十多年前就预见到了这一问题,而其开发的人工智能专用芯片正成为其竞争优势。最新的 Ironwood 芯片大幅降低了运行 AI 模型的成本。

11 月底传出谷歌正与 Meta 商讨出售价值数十亿美元的芯片,用于其人工智能项目的消息,当天便导致全球领先芯片制造商英伟达股价下跌 7%。

今年 12 月,谷歌 CEO 皮查伊在给员工的内部备忘录中表达了胜利的喜悦。“我们将在 2025 年以极佳的状态收官,”他写道,“回想起一年前公司所处的境地,看到如今的进展令人难以置信。”

勘误与补充说明
截至十月,Gemini 的月活跃用户超过 6.5 亿。本文早前版本错误地称截至十月 Gemini 的月活跃用户超过 650 人。(1 月 7 日更正)


评论