AI 框选即问！谷歌 Chrome 149 携手 Gemi…

谷歌在其最新发布的 Chrome 149 浏览器中原生深度集成了 Gemini 3.5 Flash 模型，并推出了全新的“从屏幕选择”（Select from screen）交互功能。

这一新功能赋予了用户直接框选屏幕局部内容并与 AI 进行定向对话的能力。开发者和普通用户无需再在不同的模型或复杂的工具间进行切换，大大提升了浏览网页时的 AI 交互效率。

AI 框选即问！谷歌 Chrome 149 携手 Gemini 3.5 Flash 升级截屏交互

根据谷歌官方的更新公告，当用户在 Chrome 浏览器中使用 Gemini 时，可以利用光标精准勾勒出想要提问的特定区域。被框选的图片或文本片段会自动作为附件，实时组合进用户输入的提示词中。

这种操作逻辑非常类似于广为人知的 Google Lens（谷歌镜头），但其核心优势在于不会跳转到传统的网页搜索结果页。相反，它会将选中的局部内容直接送入对话式 AI 架构中，让智能体能够针对细节给出更具针对性的解答。

该功能的上线将为用户带来直观的体验升级，例如在购物网站上框选几双鞋子，便能让 AI 分析哪款更适合自己的运动风格。此外，用户还可以框选复杂的图表以获取更清晰的解释，或是选择网页的某个设计元素进行创意重塑。

与此同时，Gemini 3.5 Flash 模型还整合了原生计算机操作工具。这使得 AI 智能体在各类环境中，都能更流畅地执行访问网站、填写长表单、点击按钮和收集数据等跨平台的复杂任务。

谷歌DeepMind将原生计算机使用能力集成到Gemini 3.5 Flash模型，开发者现可用单一模型构建能跨浏览器、手机和桌面自主看屏操作的AI智能体，无需再在不同模型间切换传递上下文，简化了跨平台长任务执行。

谷歌将“计算机使用”工具直接集成到Gemini 3.5 Flash模型，取代旧测试框架，推动AI向可执行任务的“数字同事”演进。开发者可通过API构建智能代理，实现代理从概念到落地的跨越。

谷歌于6月25日发布Gemini 3.5 Flash模型，核心亮点是深度优化的计算机操作能力，可直接接管电脑界面、自主执行跨软件工作流。这标志着人工智能从问答机器转向行动派，突破文本生成与信息检索的局限，朝向直接代劳迈出关键一步。

Google 在 NotebookLM 测试“个人智能”与“AI笔记编辑”功能，推动其从单一文档阅读器向个人智能协作中心转型。此前已升级架构，底层模型换用 Gemini 3.5 Flash，并引入 Antigravity 技术与每本笔记专属云端代码运行环境。

谷歌于2026年6月10日宣布升级NotebookLM，接入Gemini 3.5 Flash模型并整合Antigravity编码工具。核心更新是为每个用户笔记本配置独立云端计算机，支持代码编写、实时执行及AI代理驱动的深度研究，以应对复杂学术与工程项目。

关注 “悠AI” 更多干货技巧行业动态

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...