谷歌一直被称为互联网的中心,现在,它想做AI智能体网络的中心。
在刚刚结束的I/O大会上,谷歌的野心已经难以包藏。
谷歌选择在已经有15亿用户的谷歌搜索的Overview上,而不是在仅有4亿用户的Gemini独立应用上,为用户提供完整的AI搜索体验。它把最先进的大模型和最新的功能,直接推到了互联网的入口处。
打开谷歌搜索,用户将可以选择基于Gemini 2.5的AI Mode,也可以选择默认AI概览,或者经典的链接列表。
AI Mode是谷歌的一个宣示,它的所有的应用,以后都可能有一个AI Mode,如Gmail就会有一个,会更懂用户,并且在用户授权的前提下以其口吻回复邮件。
谷歌会把AI网页智能体的功能,如调用不同的工具和访问不同网页完成任务,加入AI Mode中,这一被称为Project Mariner的功能,将从活动门票、餐厅预订和本地预约开始,之后直接打通各大电商和本地服务平台。
以后用户遇到需要解决的问题,甚至还可以从搜索界面求助,一个目前被称为Project Astra的功能,可以用搜索、声音、图像、视频指导用户解决问题,就像身边站着一个真正的助手。
更不用说它不仅提供链接,还能提供答案,并根据要求,用多种形式展示答案,如图像和图表。
谷歌正在加速构建智能体网络,其智能体调用协议A2A与MCP(模型上下文协议)之间互相兼容。
本届I/O大会,与前两届笨拙的“大象起舞”相比,谷歌正在从创新者的窘境中走出,“如果你不把自己的创新当窘境,它就不会是窘境。”谷歌CEO劈柴哥说。
AI搜索
在人们以为谷歌会深深地陷入创新者窘境时,其强大的基础设施支持它经过两年的调整,迅速赶超OpenAI,把竞争带入了它最擅长的领域,在全栈技术的每个层面做出杀手级的服务与产品。
想当年ChatGPT推出时,人们本能的反应是,它将颠覆搜索。而当Llama开源软件推出时,谷歌内部又惊呼,没有护城河。谷歌面临着典型的AI新业务与搜索传统业务之间的互博状态。AI的内容生成与对话功能成本远远高于搜索,而新的商业模式亦不明确。
谷歌做出的第一个战略调整,是合并DeepMind和Google Brain,把所有基础模型的研发都放到Google DeepMind旗下,由哈萨比斯负责,并且把所有的业务都建立在Gemini的基座之上。
谷歌最自信的是其基础设施,之后推出了两代TPU,持续提升计算效率。目前形成了层次分明的大模型组合:开源小模型Gemma系列,轻量Flash级模型主打性价比和速度,Pro和Ultra级主打前沿性能。
Gemini一开始的定位就是集生成、强化学习(推理)、多模态于一体的大模型。在此基础之上,它又建立起了哈萨比斯所说的“通用AI肋手”,其中包括面向物理世界完成任务的Gemini Robotics,并且延伸到所有的端侧,包括自动驾驶、手机、头显、眼镜。
年轻一代的习惯,已经从“搜索信息”优先变成“获取答案”优先,加上从苹果内部传出,其浏览器上使用谷歌搜索的频率开始下降,这迫使谷歌更下决心加快向AI搜索的转型,经过紧张的内测之后,谷歌于本届I/O大会推出AI Mode。
关键是“在搜索中获得完整的AI体验”。查询量持续增长,但问题是,AI搜索的经济成本是否与搜索的成本是一样的,即AI搜索的边际成本是否大于边际收入。
如何对比一次搜索问询和一次AI问询(query)的成本?知名科技博客All in主理人David Friedberg(曾与劈柴哥同一年进入谷歌)在这次I/O大会前采访劈柴哥时,问到了这个问题:
问:从单位经济效益看,处理一个AI驱动的搜索查询,成本肯定比传统搜索高。这对谷歌的收入模式会有什么影响?
劈柴:这是两年前大家很担心的问题。但我一直觉得,如果问题是服务成本,那凭借谷歌的基础设施,我们有信心比几乎任何对手都做得更好。事实上,在过去18个月里,处理特定查询的成本已经大幅下降。我认为,更大的瓶颈可能是延迟,而不是单位查询成本。搜索向来追求即时响应,如何在这个前沿思考,才是更重要的问题。单位查询成本不会是最终决定性因素,我相信我们能平稳过渡。
问:那AI查询的广告收入呢?
劈柴:现在大家都已经在用AI概览了,我们现在还处在一个基准阶段,和没有AI概览时相当的水平。从这个基础出发,我们还能继续改进。广告在搜索中效果好,是因为商业信息本身也是用户有特定意图时寻找的最相关信息。从第一性原理看,没理由AI在这方面做不好。所以我们有信心顺利完成转型,有些方面可能需要时间,但所有迹象都表明,假以时日,我们能做好。即使是现在,AI概览广告也已达到基准水平。
显然,谷歌的基础设施,即支持AI搜索的轻量前沿模型成本甚至可以胜过DeepSeek R1。但这并不意味着其AI问询成本已经低于搜索问询,AI搜索正在带来新的问询量,这已经让谷歌搜索的总问询量增长了10%,同时正在带来新的商业模式。
商业模式
首先是增加购物功能。
AI及智能体,可能从纯粹的广告进入电商领域,并增加许多AI体验式购物场景。这样,谷歌可以在保持传统搜索广告收入的基础之上,增加AI搜索带来的增量收入,这可能弥补AI搜索带来的成本增加。
其次,从工具到结果。
从互联网的商业模式可以清晰地看出演变的阶段和趋势,门户、搜索、社交、电子商务等通过免费的信息服务,形成网络效应,建立平台经济,从广告和零售获取收入,这是典型的“双边市场”。
进入SaaS阶段,软件互联网化,云计算持续交付的软件服务作为工具,可以按照订阅的模式,如每年付费,按人头或者单位集体付费。它提供的是工具,用于开发者、创意者、管理者、设计者、专业人士,可能产生有价值的结果。它的商业模式实际上是从企业各个部门的生产资料费用支出。
在此前基础之上,AI应用的商业模式是通过智能体直接交付结果。AI智能体具备了协助和独立完成代码、内容、计算、创意、设计等越来越多专业级别任务的能力,它能直接或者与人类合作交付结果,一篇文章、一项研究、一份报告、一段视频故事、一个软件,甚至一个决策建议。它的费用来自企业的人力支出,而且可能是各个部门的人力支出。
如果做到这一步,AI智能体将不再只关心流量,还要关心它能否为用户交付更有价值的结果。
谷歌为它的服务直接定出了每月250美元的价格,其中包括制作视频故事的Flow,这超出了OpenAI的200美元。如果以后按照人力定价,如一位博士级的研发智能体,当然可以定价到每月2000美元。
Gemini,基座模型与独立APP
Gemini赶上了OpenAI的大模型,而且之后的超越是大概率的。OpenAI接下来的重心是商业化,奥特曼已经找到了一位负责经营的CEO,似乎还有点想草草宣布实现了AGI的意思。但DeepMind对AGI的理解显然比OpenAI更深。哈萨比斯提出过,距离实现AGI还差两三个“transformer级的范式突破”。
DeepMind的研究实力远在OpenAI之上,它可以花更长的时间,投入更多的资源,在生成推理和多模态一体化的模型上扩展,还可以推出新范式,如最近负责强化学习的副总裁西尔弗与图灵奖获得者萨顿,联合提出的人工智能的“体验时代”。
除传统主流模型不断降低单位性能成本外,这次I/O大会上,谷歌还推出了算法新范式实验研究模型Gemini Diffusion,它可能带来新的技术路线,更快(官方数据1479tokens/sec)更低成本实现接近Gemini 2.0 Flash-Lite的性能;此外,Teach&Repeat(学习&重复)机制与Personal Context的引入,可能降低每次重新思考的成本,但也可能增加额外记忆的成本。
全栈技术、软件硬件、研究应用,这就是谷歌十年前提出的AI First的战略,它的创始人退居管理幕后,却跑到Gemini模型研发的一线,亲自写代码和反馈产品。它的颠覆性技术包括量子计算,新的千亿美元级的业务,还有值得期待的Waymo。
后面的戏可能就是以谷歌为主在唱了。
如果用ChatGPT与Gemini都当成两个独立的应用对比用户,前者6亿,后者4亿,似乎OpenAI领先。但对于谷歌来说,谷歌最大的AI应用是搜索中的Overview,全球有15亿用户,它还有至少10个10亿用户级别的应用,想想看,这些都加上AI Mode,会发生什么。
所以,Gemini的用户能否超过ChatGPT,并不重要。
颠覆网页智能体网络与价值分配
如果AI直接提供了结果,而且其多模态的内容表达方式比其源自的网页还酷,用户在多数情况下,为什么还要去打开网页?没有理由。
谷歌搜索主管利兹·里德(Liz Reid)认为:
“我认为搜索结果页面是一种构造。”二十多年来,我们使用谷歌的方式很大程度上是对网络本身结构的回应:网页输入,网页输出。如今,优秀的人工智能模型能够绕过这种结构,从众多来源查找和整合信息。谷歌现在面临的问题是:“信息是直接呈现给你,还是以一种你认为有用的方式呈现给你?”
谷歌的AI Mode一旦全面推开,搜索结果页面可能很快成为历史。谷歌如今拥有所需的所有信息,并且有很多新的技术和模式更好地使用这些信息。搜索市场很大,但“行动”市场、“结果”市场、“答案”市场更大。既然谷歌正在一天天地做到这点,是不是很快我们就不再需要传统意义上的“谷歌搜索”了呢?
如果说以往谷歌搜索还能为网页带来流量,并将其转变为广告或者订阅收入,那么在谷歌把网页上的内容吸走,直接生成给用户之后,可能时代抛弃网页,都不会打声招呼。
随着智能体生态的日益成形,这一趋势不止谷歌看到了,微软也看到了。
微软在几天前的Build开发者大会上推出的一项开源协议NLWeb(Natural Language Web),让任何网站都能轻松集成自然语言交互功能,打造类似ChatGPT的对话体验。
微软希望通过NLWeb推动“智能体网络”(Agentic Web)的发展,使网站能够轻松地为用户提供对话界面,并根据用户选择的模型和自身数据,让用户能够以各种语义方式直接与网页内容交互。
NLWeb的目标是让网站摆脱对第三方平台的依赖,直接掌控用户体验,推动去中心化的AI交互方式。
这里面又产生了一个问题,如果智能体网络代替了传统的网络架构,那些构建优秀内容的网站将失去它们的广告和订阅收入,网页将衰落,那么智能体将失去其智能和服务的本源,人类创造的优秀内容会不会萎缩。
如何解决这个问题?以知名科技博主Ben Thonmson为代表的观察者主张,可能会出现分布式账本技术、智能合约、加密货币等可编程的支付手段,可以解决网页内容创作者的价值分配问题。
这些网页基于类似web 3概念的网站,它们内嵌了智能合约的功能,当有智能体来调用时,自动向其支付费用,如用稳定币及其他可以接受的加密货币。
正如Ben所指出的:
若未来由单一主导性AI与少数受青睐的内容创作者达成商业协议,同时像秃鹫般搜刮网络上残存内容来构建其他服务,这样的世界将远不如由多元市场、竞价机制和激励相容所驱动的生态来得精彩。
面对即将到来的智能体网络时代,我们此刻却未能构建相应的支付体系。
参考:
https://blog.google/technology/ai/io-2025-keynote/#google-beam
https://blog.google/technology/google-deepmind/gemini-universal-ai-assistant/
https://www.youtube.com/watch?v=ReGC2GtWFp4
https://stratechery.com/2025/the-agentic-web-and-original-sin/
https://www.platformer.news/google-io-2025-ai-everything-everywhere/