3月18日,国内AI大模型公司MiniMax发布了一款颇具“哲学意味”的新品——新一代Agent旗舰大模型M2.7。与以往所有模型不同,M2.7的最大亮点并非某项单一能力的提升,而是首次向外界展示了一条名为 “模型自我进化” 的技术路径。这意味着,AI不再仅仅是被调用的工具,开始深度参与自身的训练与优化流程,上演一出真实的AI版“自我迭代”。
想象一下,如果一个大模型不仅能写代码,还能反过来用这些代码能力去优化自己的训练流程,这会是一幅怎样的场景?MiniMax M2.7就正在将这一设想变为现实。通过构建一套名为 “Agent Harness” 的智能体执行框架,M2.7能够像一个“数字研究实习生”一样,深度参与到数据处理、实验设计、训练调优乃至Bug排查等复杂研发环节中。

在真实的内部研发场景中,这一能力的突破尤为惊人。据MiniMax官方透露,基于M2.7构建的研究型Agent,在部分工作流中已能承担约 30%至50% 的工作量。例如在强化学习场景中,它可以从实验设想出发,自动完成文献调研、环境配置、实验监控甚至代码修复,研究员只需在关键决策点进行干预即可。更令人惊叹的是其“自我优化闭环”:在一次内部测试中,M2.7自主运行了超过100轮“分析-改进-验证”的循环,通过调整采样参数、优化工作流策略,最终在内部评测集上实现了约 30%的效果提升。
除了“自我进化”的范式革新,M2.7在硬核能力上也展现出了国际一线的水准。在衡量真实软件工程能力的SWE-bench Pro测试中,M2.7拿下了 56.22% 的成绩,追平国际顶尖模型;在端到端的项目交付测试VIBE-Pro中,其得分也高达55.6%。这意味着,无论是处理线上生产环境的突发故障(MiniMax称已能将修复时间缩短至3分钟以内),还是完成复杂的Office文档多轮高保真编辑,M2.7都展现出了从“对话者”向“执行者”跨越的能力。
随着OpenClaw(龙虾)等Agent框架在全球范围内的走红,AI行业的竞争焦点正从单纯的模型参数转向复杂任务的执行能力。业内分析人士指出,MiniMax M2.7的发布,标志着国产大模型正在重新定义AI的演进方向:未来的AI将不再是一个等待升级的软件,而是一个能够 “自己生产自己”的数字生命体。目前,M2.7已在MiniMax Agent与开放平台全球上线,这场关于“自进化”的探索,才刚刚开始。

关注 “悠AI” 更多干货技巧行业动态