AI 框选即问!谷歌 Chrome 149 携手 Gemi…

AI广播站5小时前更新 小悠
4 0 0

谷歌在其最新发布的 Chrome 149 浏览器中原生深度集成了 Gemini 3.5 Flash 模型,并推出了全新的“从屏幕选择”(Select from screen)交互功能。

这一新功能赋予了用户直接框选屏幕局部内容并与 AI 进行定向对话的能力。开发者和普通用户无需再在不同的模型或复杂的工具间进行切换,大大提升了浏览网页时的 AI 交互效率。

AI 框选即问!谷歌 Chrome 149 携手 Gemini 3.5 Flash 升级截屏交互

根据谷歌官方的更新公告,当用户在 Chrome 浏览器中使用 Gemini 时,可以利用光标精准勾勒出想要提问的特定区域。被框选的图片或文本片段会自动作为附件,实时组合进用户输入的提示词中。

这种操作逻辑非常类似于广为人知的 Google Lens(谷歌镜头),但其核心优势在于不会跳转到传统的网页搜索结果页。相反,它会将选中的局部内容直接送入对话式 AI 架构中,让智能体能够针对细节给出更具针对性的解答。

该功能的上线将为用户带来直观的体验升级,例如在购物网站上框选几双鞋子,便能让 AI 分析哪款更适合自己的运动风格。此外,用户还可以框选复杂的图表以获取更清晰的解释,或是选择网页的某个设计元素进行创意重塑。

与此同时,Gemini 3.5 Flash 模型还整合了原生计算机操作工具。这使得 AI 智能体在各类环境中,都能更流畅地执行访问网站、填写长表单、点击按钮和收集数据等跨平台的复杂任务。

谷歌DeepMind将原生计算机使用能力集成到Gemini 3.5 Flash模型,开发者现可用单一模型构建能跨浏览器、手机和桌面自主看屏操作的AI智能体,无需再在不同模型间切换传递上下文,简化了跨平台长任务执行。

谷歌将“计算机使用”工具直接集成到Gemini 3.5 Flash模型,取代旧测试框架,推动AI向可执行任务的“数字同事”演进。开发者可通过API构建智能代理,实现代理从概念到落地的跨越。

谷歌于6月25日发布Gemini 3.5 Flash模型,核心亮点是深度优化的计算机操作能力,可直接接管电脑界面、自主执行跨软件工作流。这标志着人工智能从问答机器转向行动派,突破文本生成与信息检索的局限,朝向直接代劳迈出关键一步。

Google 在 NotebookLM 测试“个人智能”与“AI笔记编辑”功能,推动其从单一文档阅读器向个人智能协作中心转型。此前已升级架构,底层模型换用 Gemini 3.5 Flash,并引入 Antigravity 技术与每本笔记专属云端代码运行环境。

谷歌于2026年6月10日宣布升级NotebookLM,接入Gemini 3.5 Flash模型并整合Antigravity编码工具。核心更新是为每个用户笔记本配置独立云端计算机,支持代码编写、实时执行及AI代理驱动的深度研究,以应对复杂学术与工程项目。

AI 框选即问!谷歌 Chrome 149 携手 Gemi…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...