谷歌周三正式发布适用于 Mac 平台的原生 Gemini 应用程序,标志着其在桌面级 AI 助手领域的竞争力进一步增强,全面对标 OpenAI 与 Anthropic 的同类产品。该应用目前已面向全球运行 macOS15及以上版本的 Gemini 用户开放下载。通过引入“Option + 空格键”全局快捷键,用户能够在不切换窗口或标签页的情况下随时呼叫 AI 支援,实现从网页端交互向系统级深度集成的跨越。
技术实现上,原生 Gemini 应用支持屏幕感知功能,允许用户直接将当前查看的窗口内容(包括本地文件与复杂图表)实时分享给模型进行深度解析。这种上下文感知能力使用户能够针对复杂数据快速提取核心要点,或在电子表格处理等具体办公场景中获取即时公式支持。此外,该应用集成了谷歌最新的多模态创作能力,支持通过 Nano Banana 模型生成高精度图像,并调用 Veo 模型进行视频创作,构建了从文本对话到多媒体生成的完整工作流。

此次原生应用的推出,不仅是谷歌补齐跨平台生态缺口的关键一步,更展现了其将大模型能力推向操作系统底层、构建个人 AI 助理的战略意图。随着 macOS 应用的上线,Gemini 进一步降低了 AI 进入专业生产力场景的门槛,这种系统级的无缝交互模式预计将加速生成式 AI 在办公自动化与创意设计领域的深度应用,持续重塑桌面端的人机交互逻辑。
腾讯开源混元3D世界模型2.0,支持文本、图片、视频等多模态输入,可自动生成、重建和模拟3D世界。模型支持Mesh、3DGS、点云等多种格式导出,能与游戏开发流程无缝对接,助力快速生成游戏地图与关卡原型,推动AI“造世界”技术发展。
Anthropic公司推出新模型Mythos,能有效发现安全漏洞,但可能引发混乱。为此启动Project Glasswing计划,邀请50多家行业合作伙伴测试模型,提前修复产品隐患,防范网络攻击。参与者包括亚马逊等企业。
Gizmo获2200万美元A轮融资,将用于扩大AI团队和拓展美国高校市场。该平台通过将笔记转为互动学习材料,已吸引全球超1300万用户。
Adobe推出Firefly AI Assistant,它能跨应用自主执行任务。用户只需用自然语言描述目标,它就能规划流程,在Photoshop、Premiere等Creative Cloud应用中完成操作并同步结果,重构创作工作流。
腾讯混元团队开源“混元3D世界模型2.0”,实现从视频生成到可交互、可编辑3D资产的升级。支持文、图、视频输入,能自动生成包含人、物、景的完整3D空间,并支持多种格式导出,无缝对接主流游戏引擎。

关注 “悠AI” 更多干货技巧行业动态