logo NodeSeekbeta

Google 宣布 Gemini 3.5 Flash 正式内建 Computer Use

Google 宣布 Gemini 3.5 Flash 正式内建 Computer Use

过去一年, Computer Use 类功能主要是以独立模型形式存在,开发者需要另外串接特定端点才能使用。Google 在去年 10 月推出的 Gemini 2.5 computer-use-preview 就是在这个模式下运作。

如今 Google 把这项能力 直接整合进主力模型 Gemini 3.5 Flash 中 ,代表 Computer Use 从“实验性功能”升级为“标准配备”,对于正在开发浏览器自动化、软件测试、跨应用工作流程的开发者来说是一个明确的信号: 电脑操作已经是 Gemini 生态系的核心能力 。这也让 Gemini 3.5 Flash 在与 Anthropic Claude 的 Computer Use 功能竞争中,从追赶者一举变成领先者。


内建工具架构:同一模型,多种能力

Gemini 3.5 Flash 原本就已经支持 函数调用(Function Calling) 以及内建工具如 Google 搜索与地图。Computer Use 的加入补上了最后一块拼图,让 AI Agent 不仅能够查询信息,还能实际操作浏览器与桌面界面。

这种 “All-in-One” 模型设计意味着开发者不再需要在多个模型之间切换,单一 API 调用就能同时启用推理、搜索、地图定位与电脑操作,大幅降低了 Agent 架构的复杂度。对比 Anthropic 的 Claude 仍将 Computer Use 作为独立功能提供,Google 的整合策略显然更为积极。

在技术架构上,Computer Use 在 Gemini 3.5 Flash 中被设计为一个 内建工具 ,而非外部插件。这表示模型可以在自身的推理过程中直接决定何时需要操作电脑、何时需要查询信息,不需要外部排程器来协调。这种设计对长时程任务特别有利,例如持续性的软件测试或跨应用程序的工作流程自动化,模型可以在数十分钟的操作过程中保持对前后步骤的连贯理解。此外,Gemini 3.5 Flash 作为目前 Google 最受欢迎的模型之一,拥有极低的延迟与高吞吐量,加上 Computer Use 后整体实用性大幅提升。
Google 宣布 Gemini 3.5 Flash...

你好啊,陌生人!

我的朋友,看起来你是新来的,如果想参与到讨论中,点击下面的按钮!

📈用户数目📈

目前论坛共有62436位seeker

🎉欢迎新用户🎉