考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer-Using Agent (CUA) 类似,DeepMind 的这个模型可让 AI 直接控制用户的浏览器 —— 在视觉理解和推理能力的基础上,该模型可以帮助用户在浏览器中执行点击、滚动和输入等操作。
在科技飞速发展的今天,人工智能(AI)正在不断改变我们的生活方式和工作习惯。最近,谷歌DeepMind正式推出了其最新的计算机使用模型——Gemini 2.5 Computer Use。这一模型的发布,无疑是AI领域的一次重大突破,让我们对未来人机交互的方式充满期待。 Gemini 2.5 Computer Use的背景与意义 就在不久前,谷歌刚刚发布了Chrome DevTools(MCP),紧 ...