谷歌Gemini Mac版来了，三大AI全部登陆苹果桌面，…

谷歌于4月15日正式推出Mac原生版Gemini应用，至此OpenAI、Anthropic和谷歌三大AI服务已全部登陆Mac平台。这个时间节点本身就很说明问题——谁都不想在桌面端缺席。

这款应用100%采用Swift原生开发，针对苹果设备专门优化，而非简单套壳网页版。交互体验上下了不少功夫:按下Option+Space可以唤起迷你聊天窗口，Option+Shift+Space则打开完整界面，全程无需切换浏览器标签页，菜单栏图标和Dock也都能快速启动。对于频繁使用AI的用户来说，这种"随叫随到"的操作逻辑，确实比每次都去开浏览器顺手得多。

谷歌Gemini Mac版来了，三大AI全部登陆苹果桌面，抢占入口的战争打响

功能层面，屏幕感知是亮点之一。用户授权后，Gemini可以直接读取当前屏幕内容，提供基于上下文的辅助——开会、写文档、查资料时，它能"看到"你在做什么，而不只是等着你输入问题。此外，应用还支持多种语音播报选择，以及迷你聊天的定时重置等个性化设置。

定价方面，基础功能免费但额度有限，付费档分三档:AI Plus月费7.99美元，AI Pro月费19.99美元，顶配AI Ultra则高达249.99美元，价格跨度相当大。系统要求macOS15Sequoia或以上版本。

值得注意的是，谷歌对这款应用的定位表述颇为明确——"桌面助手"，而非单纯的聊天工具。官方表示，这只是构建个性化、主动性桌面助手的第一步，未来数月还有更多功能更新。

相比OpenAI和Anthropic更早布局Mac端，谷歌此次入场稍晚，但带着明确的差异化打法来的。桌面AI入口这块地，三家都已插旗，接下来比的是谁能真正留住用户。

谷歌DeepMind正式发布了其最新一代AI音乐生成模型Lyria 3，该模型现已作为测试版（Beta）集成至Gemini应用，并向全球年满 18 岁的用户免费开放。

Lyria3 最为引人注目的特点在于其全场景创作能力。即便用户毫无音乐基础，也能通过三种方式轻松生成音乐。用户只需输入自然语言提示，如“一首欢快的雷鬼音乐，适合海滩派对”或“一首关于太空探索的史诗电子乐”，模型便能迅速生成一首包含人声、歌词和乐器伴奏的完整 30 秒歌曲，且自动匹配描述的风格、情绪和节奏。

谷歌向开发者开放新版深度研究代理，可嵌入应用。该代理采用迭代研究方法，能自主搜索、分析并持续优化答案，性能优于前代模型。

谷歌Gemini应用更新，支持在视频提示中上传多张参考图像，结合文本生成视频和音频，让用户更精准控制视频外观和声音。此功能已在Flow平台测试，Flow还支持视频扩展和场景拼接，提供更高视频质量。

印度初创公司Emergent推出AI代理Wingman，进军AI代理软件市场。该产品主打“消息传递优先”，集成于WhatsApp等主流通讯平台，用户可通过自然语言指令跨工具执行邮件管理、日程对接等任务。公司此前凭借“氛围编码”平台已积累超800万开发者用户。

谷歌推出Gemini-TTS模型，定位为“最富表现力的文本转语音解决方案”。其核心突破在于赋予开发者对语音的精细控制能力，通过提示词可灵活调节情感、节奏和风格，告别传统TTS声音单调、缺乏表现力的局限。

关注 “悠AI” 更多干货技巧行业动态

AI广播站

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

谷歌Gemini Mac版来了，三大AI全部登陆苹果桌面，…

OpenAI 拟推出按点击计费模式并升级自助平台，加速 C…

谷歌发布原生 macOS 版 Gemini 应用，支持全局…

相关文章

暂无评论