SuperCLUE-VLM 发布了最新的中文多模态视觉语言模型测评结果,标志着国内人工智能领域的一次重大突破。在此次评测中,字节跳动的 Doubao-Seed-2.0-Pro-260215 以 90.66 分的优异成绩荣获总榜第一,成功超越了谷歌的 Gemini-3.1-Pro-Preview,后者得分为 89.35 分。
本次测评涵盖了国内外 17 款主流视觉语言模型,国产模型表现出色,不仅在榜单中占据多个前列名次,阿里巴巴的 Qwen3.5 系列、商汤的 SenseNova、以及智谱 GLM 等均表现不俗。相比之下,OpenAI 的 GPT-5.4 和其他一些海外知名模型则只能排在中游位置,显示出国产模型的强劲上升势头。

评测的内容涉及三个主要维度:基础认知、视觉推理和视觉应用,涵盖了多达 25 项具体任务,包括通用识别和医疗影像等。评测结果显示,国产模型在基础认知和数据分析上表现尤为突出,得分普遍超过 90 分,展现了成熟而稳定的能力。然而,在视觉推理及工业、医疗等专业应用领域,国内模型仍然有待进一步提升,某些专业场景的得分相对较低。
🌟 Doubao-Seed-2.0-Pro-260215 以 90.66 分获评第一,超越谷歌 Gemini-3.1-Pro-Preview。
📊 国产模型在基础认知和数据分析上得分普遍超过 90 分,表现稳定。
🛠️ 在视觉推理及专业应用领域,国产模型仍需提升,部分场景得分偏低。
SuperCLUE-VLM 2026年4月评测报告显示,中文多模态视觉语言模型领域发生结构性变动。在对全球17款主流大模型深度横评中,国产AI阵营表现强劲,中文理解优势显著,综合得分反超海外顶尖模型。字节跳动Doubao-Seed-2.0-Pro-260215以90.66分登顶总榜,多款国产模型跻身第一梯队。
SuperCLUE-VLM最新榜单显示,谷歌Gemini-3-Pro以83.64分大幅领先,在视觉理解与推理方面优势明显。国产模型表现突出,商汤SenseNova V6.5Pro和字节豆包分列第二、三位,展现中国AI在多模态领域的快速进步。评测涵盖三大核心能力维度。
SuperCLUE-VLM多模态测评显示,谷歌Gemini-3-pro以83.64分夺冠,在基础认知、视觉推理和应用三大维度全面领先。国产模型表现亦受关注。
SuperCLUE-VLM多模态模型评测榜单发布,Gemini-2.5-Pro以74.99分排名第一,GPT-5(high)以68.59分位列第二。该基准针对中文场景设计,从基础认知、视觉推理和视觉应用三大维度评估模型性能,为行业发展提供客观标准。评测涵盖Claude-Opus-4.1、ERNIE-4.5-Turbo-VL等主流模型。
Mistral AI于4月28日发布企业级AI编排层Workflows,作为Mistral Studio平台关键组件,旨在将零散AI流程转化为可大规模生产的系统。该工具已进入公开预览,获ASML、ABANCA及CMA-CGM等跨国巨头应用。技术架构基于Temporal引擎,支持Python定义复杂流程,提升核心业务效率。

关注 “悠AI” 更多干货技巧行业动态