谷歌发布全天候AI代理Spark:Gemini从对话助手进化为24x7私人管家

(AI 资源之家讯)北京时间 5 月 20 日凌晨 1 点,谷歌 I /O 2026 开发者大会在美国加州山景城开幕。本届大会的核心主题不再只是某一款模型或功能的更新,而是谷歌向 AI 智能体时代的系统性转型。其中最受关注的发布是 Gemini Spark——一款全天候运行的个人 AI 代理。

Gemini Spark:关了电脑它还在帮你干活

Gemini Spark 基于 Gemini 3.5 模型,运行于 Google Cloud 虚拟机之上。与传统的对话式 AI 助手不同,Spark 最革命性的特性是持续性:用户关闭电脑后,它仍能在后台持续工作,跨 Gmail、Google Drive、Sheets、Slides 等多个应用自动执行任务。在演示中,Spark 自动汇总了邻居对派对邀请的回复,追踪了用户需要携带的物品清单,发送了跟进邮件,甚至生成了活动宣传册。谷歌计划本周向受信任测试人员开放,下周面向美国 Google AI Ultra 订阅用户推出,起价为每月 100 美元,今年夏天将接入 Chrome 浏览器。

Gemini Omni:对话式视频生成

DeepMind CEO 德米斯·哈萨比斯发布了 Gemini Omni,这是一款基于世界模型技术的新型视频生成模型。Omni 支持多种输入格式生成视频,更重要的是支持对话式编辑——用户可以用自然语言修改视频中的角色、背景和场景。用户还可以上传自拍并转换为不同风格的视频内容。谷歌将 Omni 的目标定义为实现任意输入到任意输出的全模态转换,首款产品 Gemini Omni Flash 计划今年夏季推出。同时配套发布的 SynthID 扩展功能,可检测图片是否由 AI 生成。

Gemini 3.5 Flash:速度是前沿模型四倍

在模型层面,Gemini 3.5 Flash 正式亮相,生成输出 Token 速度约为其他前沿模型的 4 倍。这款模型专为 AI Agent、编码工具、复杂智能体任务和长工作流优化,是谷歌构建智能体生态的技术底座。谷歌还发布了 Antigravity 2.0 AI 编程平台,对标 Anthropic Claude Code 和 OpenAI Codex,以智能体优先为核心理念,演示中从零构建操作系统的 Token 成本不到 1000 美元。

Android XR 智能眼镜秋季上市

硬件方面,谷歌联合 Gentle Monster、Warby Parker 和三星推出 Android XR 智能眼镜,分为语音眼镜和显示眼镜两种形态。语音眼镜计划今年秋季上市,支持 iOS 和 Android 配对。演示中展示了无需掏手机,Gemini 自动导航至咖啡馆、打开 DoorDash、准备常点订单,用户仅需最终确认的流畅体验。

谷歌每月 Token 处理量已达 3.2 千万亿个,同比增长 7 倍,Gemini 月活跃用户突破 9 亿。AI 资源之家将持续跟踪谷歌 AI 智能体生态的发展动态,为读者带来深度解读。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-05-20发表,共计1143字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。