谷歌如何重拾活力并领先于 OpenAI

发布时间：2026.01.06

源地址：https://www.wsj.com/tech/ai/google-ai-openai-gemini-chatgpt-b766e160

在 ChatGPT 主导早期聊天机器人市场后，谷歌凭借强大的人工智能模型实现反击，迎来多年来最大规模的搜索引擎革新。

八月清晨的凌晨时分，谷歌一位人工智能项目经理将其 DeepMind 实验室最新研发的成果上传至一个用于评估 AI 模型的平台。

谷歌在人工智能竞赛中落后，而其竞争对手 OpenAI 的 ChatGPT 聊天机器人已吸引了数亿用户。谷歌的研究人员希望，一项全新的功能——极速图像生成器，能够帮助这家搜索巨头在 ChatGPT 的短板领域取得优势。

Naina Raisinghani 在谷歌内部以熬夜工作闻名，她需要为新工具起个名字以完成上传。那时已经凌晨两点半，周围没人，于是她随手编了一个名字，结合了朋友们给她的两个昵称：“Nano Banana”。

短短几天内，Nano Banana 就登顶了 LM Arena 平台的性能排行榜，成为 X 上的热门话题，使用量远超谷歌的预期。到了九月，谷歌的 Gemini AI 应用已成为苹果应用商店下载量最高的应用。

两个月后，谷歌推出了迄今为止最强大的 Gemini 模型，性能远超竞争对手，成为最先进的 AI 聊天机器人。凭借这一优势，这家 Alphabet 旗下公司成功超越 OpenAI，跃居 AI 领域的领先地位。

谷歌深厚的科学研究基础、投入数十亿美元开发定制硬件的决心，以及近年来通过领导层变动加快实验步伐的举措，正逐渐显现成效。同时，谷歌也成功守住了其至关重要的搜索业务——至少在目前——免受日益流行的聊天机器人对互联网使用方式带来的冲击。

谷歌的人工智能业务已开始通过搜索广告、面向消费者和企业的付费版 Gemini 以及自主研发的新型计算芯片销售，带来可观收入。去年十一月发布的最新 Gemini 模型在多项指标上超越了 ChatGPT，推动 Alphabet 股价大幅上涨，并引发 OpenAI 内部的紧急应对。随后，OpenAI 推出了更强大的 ChatGPT 版本，缩小了与谷歌的差距，尽管该版本的用户数量仍远超 Gemini。

谷歌首席执行官桑达尔·皮查伊在新款 Gemini 模型发布当天，强调了公司在人工智能领域的重大投入。他在内部备忘录中对员工表示：“很高兴看到我们以谷歌的规模推出这一产品。”

2015 年，皮查伊升任谷歌最高领导时，人工智能还是计算机科学研究者关注的前沿技术，几乎无人问津。次年，他宣布这家以搜索引擎、地图和办公软件闻名的公司将全面投入人工智能领域。

在公司博客发布的一份备忘录中，皮查伊写道，过去十年是以智能手机为中心的时代。“但在未来十年，”他预测，“我们将转向一个以人工智能为核心的世界，一个计算无处不在的世界。”

谷歌早在 2011 年就由计算机科学家杰夫·迪恩共同创立了名为 Google Brain 的人工智能研究部门，奠定了基础。迪恩曾参与开发支撑当今大型语言模型的神经网络技术。几年后，谷歌收购了总部位于伦敦的人工智能研究实验室 DeepMind，该实验室由国际象棋神童德米斯·哈萨比斯共同创立，他后来因开发辅助生物分子研究的人工智能系统而获得诺贝尔奖。

当时这一举措并未引起太多关注，但谷歌也开始自主设计人工智能芯片，认为为了支持语音识别等应用，必须大幅提升计算能力。这些被称为张量处理单元（TPU）的芯片，设计时注重比计算机的中央处理器（CPU）或游戏显卡的图形处理器（GPU）更低的能耗。事实证明，这一创新不仅改变了谷歌自身的发展轨迹，也对整个行业产生了深远影响。

谷歌开始设计自己的人工智能芯片。图为该公司 2021 年推出的一款张量处理单元。摄影：MICHAEL NAGLE/BLOOMBERG NEWS

不过，早期谷歌在开发自家聊天机器人时采取了谨慎态度。部分高管和研究人员对这项技术的安全性表示担忧，认为它可能产生不准确、有偏见或其他问题信息。

前谷歌大脑团队成员 Julia Winn 表示，聊天机器人最初并未被视为公司更广泛人工智能战略的核心。在早期模型测试中，聊天机器人很容易被引导产生种族歧视或性别歧视的回答。

谷歌对这类风险的重视程度远超我曾工作的任何地方，这也是情有可原的。这样的谨慎态度让一些公司研究人员感到不满，甚至有人因此离开了公司。

2022 年 8 月，谷歌推出了一款具备多种对话能力的聊天机器人模型，并通过名为 AI Test Kitchen 的应用向少数用户开放测试，这个平台相当于一个试验场。谷歌将该模型命名为 LaMDA，用户可以体验其中的三个功能：“Imagine It”、“List It”以及“Talk About It（狗狗版）”，后者专门用于与用户围绕狗狗展开对话。

ChatGPT 挑战

三个月后，OpenAI 在经过多年努力开发出不仅能进行对话，还能创作故事、笑话和计算机代码等内容的聊天机器人后，向公众开放了 ChatGPT。

五天内，已有一百万人报名参与测试。与谷歌的 LaMDA 不同，用户在使用过程中几乎没有受到限制。

一些谷歌员工多年致力于这项技术，却被后来者超越，心中难免愤懑。还有人对公众如此迅速地接受 ChatGPT 感到震惊。

分析师和投资者开始担心谷歌是否错过了科技的下一次重大浪潮。他们关注公司推出自有人工智能产品的速度，以及聊天机器人兴起是否会削弱谷歌依赖搜索和广告业务的收入，而这两项业务在 2022 年共带来了 2540 亿美元的营收。

当 OpenAI 推出 ChatGPT 时，数百万人在几天内注册体验。这款聊天机器人曾于 2023 年在东京的一场贸易展上亮相。RICHARD A. BROOKS/AFP/GETTY IMAGES

谷歌的两位资深 AI 科学家 Dean 和 Hassabis 以及 2022 年加入的机器人专家 James Manyika，致力于整合 DeepMind 和 Brain 两大部门的 AI 训练工作。2023 年 1 月，他们向 Alphabet 董事会展示了打造公司迄今最智能模型的计划。

与此同时，谷歌急需一款聊天机器人快速推向用户。次月，谷歌推出了基于 LaMDA 模型的 Bard，但发布过程出现了失误。

在一段推广 Bard 的视频中，谷歌展示了该聊天机器人对詹姆斯·韦伯太空望远镜相关问题的回答。该机器人错误地称该望远镜拍摄了“首张太阳系外行星照片”。这一失误导致 Alphabet 股价下跌了 8%。

就在那时，谷歌联合创始人谢尔盖·布林刚刚退休，正参加一个聚会，与 OpenAI 的研究员丹尼尔·塞尔萨姆交谈。据知情人士透露，塞尔萨姆问他，为什么不全职投入人工智能领域。作为一名计算机科学家，难道 ChatGPT 的问世没有激发他的兴趣吗？

ChatGPT 正逐渐成为家喻户晓的 AI 聊天机器人，而谷歌的产品仍在摸索阶段。布林认为 Selsam 的观点有道理，便重新投入了工作。

2023 年大部分时间里，谷歌高管致力于协调和整合其人工智能开发工作。前员工表示，Brain 部门更注重研究，而 DeepMind 则侧重于产品开发，两者文化差异明显，合并后因此产生了摩擦。

尽管如此，谷歌相比其强劲对手仍拥有一项压倒性优势。OpenAI 需要依靠投资者融资，而谷歌则能凭借数十亿美元的利润自主投入研发。但谷歌也必须找到方法，防止生成式人工智能损害其“摇钱树”——占据网络搜索市场 90%份额、支撑其广告业务的核心地位。

魔术计划

为了探索人工智能驱动的搜索应有的样貌，谷歌启动了一个名为“Project Magi”的多团队项目，由 2024 年晋升为搜索副总裁的 Liz Reid 领导。她在一次采访中表示，团队面临的挑战是如何改造搜索系统，使其能够在答案不局限于单一网页时，迅速提供清晰明确的回应。

“人们不仅仅是使用搜索，更是依赖搜索，”她说。“如果你搞砸了，妈妈会告诉你，朋友会告诉你，孩子也会告诉你。”

谷歌现任搜索副总裁 Liz Reid 领导了多个团队，共同探索人工智能驱动的搜索应具备的形态。CAMILLE COHEN/法新社/盖蒂图片社

谷歌在 2023 年底前发布了首款 Gemini 模型。前员工表示，OpenAI 最初主要用文本训练 ChatGPT，而谷歌则在文本、代码、音频、图像和视频等多种数据上训练 Gemini，这也是其开发周期较长的原因之一。

尽管第一版 Gemini 在许多方面仍落后于 ChatGPT，但谷歌技术上更具野心的策略，正如其早期在神经网络领域的研究一样，随着时间推移将带来丰厚回报。

布林在去年十二月斯坦福大学的一场活动中表示：“我确实认为我们仍然受益于那段悠久的历史。”

自布林回归以来，他的大部分工作都集中在揭示 Gemini 存在的问题并推动解决。2024 年，布林还促成了谷歌以 27 亿美元收购人工智能研究人员丹尼尔·德弗雷塔斯（Daniel De Freitas）和诺姆·沙泽尔（Noam Shazeer）创办的初创公司，两人随后参与领导了 Gemini 项目的研发。

谷歌联合创始人谢尔盖·布林（右）在五月的年度开发者大会上与公司 DeepMind 部门负责人德米斯·哈萨比斯交谈。JEFFREY DASTIN/路透社

在五月谷歌 I/O 大会的舞台访谈中，布林表示自己一直保持高度参与。“我通常会深入技术细节，”他说，“这是我非常享受的一种特权。”

“我想用这个”

2024 年 5 月，谷歌推出了“AI 概览”功能——由人工智能生成的简短摘要，通常显示在搜索结果的顶部。谷歌发现，用户开始进行更多复杂的搜索。

随后，谷歌对其搜索引擎进行了多年来最大规模的改造：开发了 AI 模式，这是一种以聊天机器人形式回答查询的搜索选项。Reid 表示，内部多次演示展示了这一功能的潜力，但也凸显了在保持搜索速度和质量的同时，将其重新设计成聊天机器人模式的难度。

经过多次反复尝试，Reid 表示，她和团队的其他成员终于开始意识到这个工具的价值，决定将其公开推广。Reid 回忆道：“我们发现自己不仅仅是在测试它，而是会主动去使用，心里想着，‘哦，我想用这个。’”

谷歌于去年五月推出了 AI 模式，并发布了更强大的 AI 模型 Gemini 2.5，但这款产品并未引起员工们预期的广泛关注。自年初以来，Alphabet 的股价持续下跌，整个夏季表现依然低迷。

人工智能对谷歌搜索霸主地位构成的威胁，反而带来了意想不到的积极影响。2024 年 8 月，一位联邦法官裁定谷歌在网络搜索和搜索广告领域存在非法垄断。判决指出，谷歌每年向苹果支付 200 亿美元，以确保其成为 iPhone 制造商 Safari 浏览器的默认搜索引擎的协议具有反竞争性质。

谷歌的律师辩称，随着人工智能聊天机器人作为一种新兴且受欢迎的搜索形式出现，公司的垄断地位实际上已经终结。今年早些时候，法官采纳了这一观点，裁定苹果交易可以在仅做少量修改的情况下继续进行，这帮助谷歌避免了更严厉的处罚措施。

该裁决与八月推出的 Nano Banana 一同推动了谷歌股价的上涨。

负责 Gemini 应用及 Google Labs（一个新 AI 应用试验平台）的 Josh Woodward 将 Nano Banana 的发布形容为“一场成功的灾难”。随着全球用户生成的图像数量迅速从数百万飙升至数十亿，谷歌面临计算资源严重不足的挑战。为应对需求，公司不得不紧急借用服务器时间以扩充计算能力。

截至十月，Gemini 的月活跃用户已超过 6.5 亿，较七月的 4.5 亿大幅增长。

去年十一月，Gemini 3 的发布引发了计算能力的新一轮瓶颈。谷歌早在十多年前就预见到了这一问题，而其开发的人工智能专用芯片正成为其竞争优势。最新的 Ironwood 芯片大幅降低了运行 AI 模型的成本。

11 月底传出谷歌正与 Meta 商讨出售价值数十亿美元的芯片，用于其人工智能项目的消息，当天便导致全球领先芯片制造商英伟达股价下跌 7%。

今年 12 月，谷歌 CEO 皮查伊在给员工的内部备忘录中表达了胜利的喜悦。“我们将在 2025 年以极佳的状态收官，”他写道，“回想起一年前公司所处的境地，看到如今的进展令人难以置信。”

勘误与补充说明
截至十月，Gemini 的月活跃用户超过 6.5 亿。本文早前版本错误地称截至十月 Gemini 的月活跃用户超过 650 人。（1 月 7 日更正）

菜单

谷歌如何重拾活力并领先于 OpenAI

ChatGPT 挑战

魔术计划

“我想用这个”

评论

Axios每日简报 2026-01-08

世界最强计算机的零下冰冷巢穴

硅谷幕后推手 Index Ventures 展望未来接班计划

特朗普为何试图重新掌控西半球？他的“唐罗主义”是什么？

Axios每日简报 2026-01-07

谷歌如何重拾活力并领先于 OpenAI

美国核能复兴的成本

深入解析委内瑞拉的 BGP 异常

美国炼油商为委内瑞拉原油回归做准备

Axios每日简报 2026-01-06