蚂蚁集团斩获计算机视觉顶会冠军,AIGC检测实现“实战级”…

AI广播站9小时前更新 小悠
6 0 0

近日,在计算机视觉顶会CVPR 2026 NTIRE 图像检测挑战赛中,蚂蚁集团同时获得“复杂真实场景鲁棒性样本测试”赛道和“人脸增强异常检测”赛道冠军,为进一步提升AI时代支付、内容安全审核、金融身份认证等场景的风险识别能力提供重要支撑。

当前,深度伪造(Deepfake)与AIGC滥用风险加剧,不仅肉眼难辨真假,现有检测模型在面对真实场景与多模态大模型快速迭代时,准确率也出现断崖式下跌。本次CVPR挑战赛直击这一痛点,要求模型在“未知生成架构”与“复杂退化干扰”的双重极限考验下,保持高准确率与强鲁棒性。

蚂蚁集团斩获计算机视觉顶会冠军,AIGC检测实现“实战级”跃迁

蚂蚁集团以支付场景起家,在过去 20 年里积累的安全技术代表了国际领先水平,这一优势正延续至 AI 安全领域。蚂蚁集团提出了一个基于 DINOv3 视觉基础模型的检测框架,实现了 AIGC 检测从实验室向真实场景的能力跃迁。

在“复杂真实场景鲁棒性样本测试”赛事,蚂蚁AI安全实验室参赛团队搭建了一个包含数百万高质量样本的复杂训练语料库,覆盖WildFake、Z-Image、Seedream、Nano-banana-pro 等开源数据集和前沿模型;底层采用双流并行集成架构,如同为检测模型配备两双互补的眼睛,分别捕捉图像的局部细节与整体特征。团队模拟图像从单一噪点到多重失真的全链路退化效果,深度还原社交平台传播、二次翻拍等真实场景的图像失真特征,大大提升了模型在真实场景下的检测能力。

此外,团队还提出了“先定位可疑区域,再进行细节审查”(Locate-Then-Examine)的两阶段检测范式,并构建了提供局部区域文本解释的数据集 FakeXplained。在面对可疑图像时,该方法不仅能准确判断其是否由 AI 生成,还能在图像上定位出存在伪造瑕疵或违背物理常识的区域,并同步生成详尽的解释。该方法突破了传统“黑盒”检测的局限,让模型决策“有据可查”。为方便技术从业者共同应对 Deepfake 挑战,团队还通过 GitHub 开源了领域内最全面的 AIGC 图像视频检测资源仓库。

在“人脸增强异常检测”赛事,蚂蚁国际参赛团队凭借精准定位人脸图像异常区域的技术能力夺冠。这项技术能够精确识别并定位人脸图像中的异常区域,主要应用于金融交易身份鉴别、开户材料审核等场景,为防范Deepfake深度伪造与AIGC攻击提供重要技术保障。在跨境支付与金融服务领域,蚂蚁国际将AIGC识别技术深入应用到EKYC、凭证、材料的防伪当中,确保了对各类生成内容的检测能力。

CVPR是IEEE主办的国际计算机视觉与模式识别会议,与ICCV、ECCV并称为计算机视觉领域的世界三大顶级会议,该挑战赛共吸引 500 多支国内外队伍参赛。

联想在2026/2027财年誓师大会上宣布推出全新品类“AI主机”,旨在加速AI在企业与个人场景的规模化应用。核心战略是将AI从软件应用转向硬件原生深度融合,推出面向不同规模客户的AI主机,推动AI技术更广泛落地。

Meta推出新AI模型Muse Spark,由前Scale AI负责人Alexandr Wang领导的团队开发。该模型发布后迅速推动Meta AI应用在美国App Store排名从第57位跃升至第5位,首日下载量显著增长,显示市场对AI技术的高度关注。

小米自研大模型MiMo-V2系列正式接入全球顶级开源Agent框架Hermes Agent,实现强强联合。开发者更新框架后即可通过Nous Portal直接调用小米旗舰模型。同时,小米开启为期两周的“限免全家桶”活动回馈开发者。

字节跳动AI核心部门Seed团队近一年流失近70名技术人才,流向头部大厂及AI初创公司,反映国内大模型人才竞争白热化。该团队成立于2023年,专注LLM、语音、视觉及世界模型等前沿研究,其豆包大模型已支持豆包、扣子等50多个应用场景。

近日,Chaofan联合发布论文《Your Agent Is Mine》,首次系统性揭露第三方LLM路由器(中转站)已成为AI Agent领域最致命的中间人攻击点。核心原理在于路由器即应用层MITM,现代AI Agent几乎全部依赖第三方服务,导致开发者可能已在不知不觉中被完全掌控。这一发现让依赖OpenRouter、LiteLLM等低价中转服务的开发者瞬间警醒。

蚂蚁集团斩获计算机视觉顶会冠军,AIGC检测实现“实战级”…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...