谷歌Gemini Mac版来了,三大AI全部登陆苹果桌面,…

AI广播站3天前更新 小悠
14 0 0

谷歌于4月15日正式推出Mac原生版Gemini应用,至此OpenAI、Anthropic和谷歌三大AI服务已全部登陆Mac平台。这个时间节点本身就很说明问题——谁都不想在桌面端缺席。

这款应用100%采用Swift原生开发,针对苹果设备专门优化,而非简单套壳网页版。交互体验上下了不少功夫:按下Option+Space可以唤起迷你聊天窗口,Option+Shift+Space则打开完整界面,全程无需切换浏览器标签页,菜单栏图标和Dock也都能快速启动。对于频繁使用AI的用户来说,这种"随叫随到"的操作逻辑,确实比每次都去开浏览器顺手得多。

谷歌Gemini Mac版来了,三大AI全部登陆苹果桌面,抢占入口的战争打响

功能层面,屏幕感知是亮点之一。用户授权后,Gemini可以直接读取当前屏幕内容,提供基于上下文的辅助——开会、写文档、查资料时,它能"看到"你在做什么,而不只是等着你输入问题。此外,应用还支持多种语音播报选择,以及迷你聊天的定时重置等个性化设置。

定价方面,基础功能免费但额度有限,付费档分三档:AI Plus月费7.99美元,AI Pro月费19.99美元,顶配AI Ultra则高达249.99美元,价格跨度相当大。系统要求macOS15Sequoia或以上版本。

值得注意的是,谷歌对这款应用的定位表述颇为明确——"桌面助手",而非单纯的聊天工具。官方表示,这只是构建个性化、主动性桌面助手的第一步,未来数月还有更多功能更新。

相比OpenAI和Anthropic更早布局Mac端,谷歌此次入场稍晚,但带着明确的差异化打法来的。桌面AI入口这块地,三家都已插旗,接下来比的是谁能真正留住用户。

谷歌DeepMind正式发布了其最新一代AI音乐生成模型Lyria 3,该模型现已作为测试版(Beta)集成至Gemini应用,并向全球年满 18 岁的用户免费开放。

Lyria3 最为引人注目的特点在于其全场景创作能力。即便用户毫无音乐基础,也能通过三种方式轻松生成音乐。用户只需输入自然语言提示,如“一首欢快的雷鬼音乐,适合海滩派对”或“一首关于太空探索的史诗电子乐”,模型便能迅速生成一首包含人声、歌词和乐器伴奏的完整 30 秒歌曲,且自动匹配描述的风格、情绪和节奏。

谷歌向开发者开放新版深度研究代理,可嵌入应用。该代理采用迭代研究方法,能自主搜索、分析并持续优化答案,性能优于前代模型。

谷歌Gemini应用更新,支持在视频提示中上传多张参考图像,结合文本生成视频和音频,让用户更精准控制视频外观和声音。此功能已在Flow平台测试,Flow还支持视频扩展和场景拼接,提供更高视频质量。

印度初创公司Emergent推出AI代理Wingman,进军AI代理软件市场。该产品主打“消息传递优先”,集成于WhatsApp等主流通讯平台,用户可通过自然语言指令跨工具执行邮件管理、日程对接等任务。公司此前凭借“氛围编码”平台已积累超800万开发者用户。

谷歌推出Gemini-TTS模型,定位为“最富表现力的文本转语音解决方案”。其核心突破在于赋予开发者对语音的精细控制能力,通过提示词可灵活调节情感、节奏和风格,告别传统TTS声音单调、缺乏表现力的局限。

谷歌Gemini Mac版来了,三大AI全部登陆苹果桌面,…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...