4月15日,全球权威AI模型评测平台LM Arena公布最新Video Edit(视频编辑)方向排行榜,阿里巴巴ATH事业群旗下的happyhorse-1.0模型以1299分的Elo评分位列全球榜首,成功超越Grok等国际主流模型。值得注意的是,这是中国AI团队首次在该评测方向的榜单中获得第一,标志着国产视频生成与编辑技术进入世界顶尖梯队。
LM Arena作为全球AI社区公认的盲测评估标杆,采用匿名对比投票机制,通过收集用户对未知模型生成效果的真实偏好,并结合Elo评分体系生成排名。此次上榜的happyhorse-1.0隶属阿里巴巴新成立的ATH(Alibaba Token Hub)事业群,内部组织代号为Alibaba-ATH。该模型主打高保真的人像表现、自然的动态控制以及精准的视频编辑能力,能够根据指令实现对视频内容的无缝修改与重塑。

此前,HappyHorse系列模型已在另一权威平台Artificial Analysis的Video Arena榜单中大放异彩。在匿名测试阶段,该系列模型即登顶文生视频(Text-to-Video)与图生视频(Image-to-Video)双赛道,Elo评分领先字节跳动Seedance2.0、快手可灵3.0及Google Veo3Fast等国内外头部模型。
行业专家认为,happyhorse-1.0的胜出不仅展示了阿里巴巴在多模态大模型领域的底层创新能力,更预示着AI视频技术正从单纯的“内容生成”向“精准编辑与可控生产”进化。随着中国模型频繁领跑国际权威榜单,全球AI视频产业的竞争重心正加速向更具实用性的垂直作业场景偏移。
阿里巴巴千问Qwen3.5-Max-Preview模型在LMArena盲测榜单中表现突出,以1464分刷新国产模型纪录,并在多项评测中超越GPT5.4、Claude4.5及Grok4.1等海外顶尖模型,标志着中国自研大模型正式跻身全球第一梯队。
微软AI首席执行官穆斯塔法·苏莱曼宣布推出第二代图像生成模型MAI-Image-2。该模型在权威评测榜单LMArena中表现强劲,跃升至全球第三位,仅次于谷歌Gemini-3.1-flash-image-preview和OpenAI GPT-image-1.5-high-fidelity。相比初代模型,第二代在综合质量上实现显著提升。
阿里千问大模型家族发布旗舰预览版Qwen3.5-Max-Preview,在全球权威评测平台LM Arena中刷新纪录,综合得分1464分。该模型在LMSYS匿名盲测中表现强劲,全球总排名第五,为中国大模型最高;其数学能力位列全球第五,展现出专家级文本处理水平。
阿里千问家族推出旗舰模型Qwen3.5-Max-Preview,在LM Arena全球大模型竞技平台以1464分综合得分亮相,使阿里通义千问在全球大模型公司排行榜中升至第五位,稳居中国首位,标志着国产大模型在全球竞争中已进入顶尖行列。
腾讯混元团队开源混元图像3.0图生图模型,拥有800亿参数,采用混合专家架构,在全球影像编辑榜单中位列第七。其核心突破在于“先思考,后编辑”的多模态架构,成为当前全球最强的开源图生图模型。

关注 “悠AI” 更多干货技巧行业动态