“国产双星”四月同耀?DeepSeek V4携长期记忆突进,腾讯姚顺雨首份答卷浮出水面

AI广播站14小时前发布 小悠
4 0 0

三月中旬的AI圈暗流涌动。就在开源社区为“小龙虾”OpenClaw的Token消耗狂飙而兴奋时,一则更为重磅的消息悄然炸开:被戏称为“贾跃亭式发布”的DeepSeek V4,终于锁定了4月的上线窗口。 而这一次,它并非孤身前来。

据《白鲸实验室》等多方媒体爆料,DeepSeek V4与由腾讯首席AI科学家姚顺雨领衔的混元新模型,均预计于下月同期正式发布 。这不仅是两款国产顶级大模型的狭路相逢,更预示着中国AI竞赛从单纯的参数军备,正式迈入 “长记忆+强应用”的深水区

一边是让开发者“等到心焦”的DeepSeek。自去年12月V3.2版本后,这家开源王者便陷入沉寂,引发外界对其“掉速”的质疑 。但最新消息显示,梁文锋团队将憋出一个大招。DeepSeek V4被定位为一款打磨已久的原生多模态大模型,其核心突破点在于 LTM(长期记忆)与代码能力的代际跃升 。结合梁文锋1月署名的论文《Conditional Memory via Scalable Lookup》,V4试图解决的正是大模型在复杂任务中“边做边忘”的致命短板 。更值得注意的是战略卡位:V4将深度适配华为等国产芯片,力求成为首个完全跑通国产算力生态的核心模型,在当前的供应链博弈下,这步棋显得意味深长 。

“国产双星”四月同耀?DeepSeek V4携长期记忆突进,腾讯姚顺雨首份答卷浮出水面

而舞台的另一半,则属于腾讯和那位AI界明星——姚顺雨。自去年年底加入腾讯担任总办首席AI科学家后,此次即将发布的混元新模型将是姚顺雨交出的首份“实战答卷” 。不同于单纯比拼参数规模,市场传闻该模型更侧重于 “上下文学习”的真实可用性。姚顺雨此前提出的CL-bench评测基准,直指长上下文在Agent(智能体)调用中的效率问题 。这恰好与腾讯近期在“AI养虾”热潮中的布局相呼应——无论是已上线的WorkBuddy还是内测的QClaw,腾讯正疯狂抢占AI智能体的应用场景,而新混元模型,极有可能是支撑这些“龙虾”高效运转的底层引擎 。

一边是用“长期记忆”打通数据孤岛的破局者,一边是用“真实评测”连接应用场景的操盘手。四月的这场双星同耀,或许将重新定义国产大模型从“能聊天”到“能办事”的关键一跃。对于等待已久的开发者而言,这一次,希望不再是“狼来了”。

“国产双星”四月同耀?DeepSeek V4携长期记忆突进,腾讯姚顺雨首份答卷浮出水面

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...