蚂蚁集团推出“灵光”应用,AGI相机开启视觉识别新体验

AI广播站3天前发布 小悠
17 0 0

一款名为“灵光”的多模态AI应用悄然登陆各大应用商店,标志着蚂蚁集团在AGI领域迈出重要一步。

通过手机镜头识别世界、快速理解复杂文档、用AI能力解答视觉问题——这些充满未来感的功能正汇聚于蚂蚁集团最新推出的多模态AI应用“灵光”中。

目前,“灵光”已在腾讯应用宝、vivo应用商店等平台上线并开启邀约内测,用户可通过手机号或支付宝账号直接登录,亲身体验AGI相机的魅力。


01 产品亮相:灵光初现

“灵光”这一名称灵感源自灵光闪现,恰如其分地体现了这款应用的核心特质——通过人工智能瞬间识别和理解世界。

作为蚂蚁集团的第四款AI独立APP,灵光紧随支小宝、安诊儿和AQ之后问世,但其多模态能力却实现了质的飞跃。

该应用的开发者为支付宝(杭州)数字服务技术有限公司,目前已在多家主流安卓应用商店提供下载。

用户现在就可以通过手机号或支付宝账号直接登录使用,体验其核心的AGI相机功能。

02 核心功能:AGI相机

“灵光”最大的亮点在于其“AGI相机”功能,该功能可以利用AI能力识别和理解现实世界。

行业人士分析认为,这一功能与元宝App、豆包App的图片识别功能相似,用户可通过相机镜头识别物体并获取相关信息解答。

实际使用中,AGI相机很可能基于蚂蚁集团已有的技术积累。报道推测,它可能类似于支付宝APP已有的“探一下”功能,通过深度学习、计算机视觉等技术对拍摄图像进行智能化分析与处理。

除了视觉识别,灵光还具备“快速研究”功能,能够将逻辑复杂的文档、文章迅速整理出要点,真正实现“把复杂讲清楚”。

03 技术背景:深厚积累

“灵光”的诞生并非偶然,而是蚂蚁集团长期技术积累的必然结果。

在今年四月底,蚂蚁集团发布的模型首次实现了图像理解与生成的统一,验证了该方向的技术潜力与发展空间。

短短一个月后,蚂蚁集团又推出了Ming-Lite-omni-Preview版本,这是全球首个在模态支持能力上可媲美GPT-4o的开源模型,进一步实现了语音和图像的生成与理解整合。

蚂蚁集团在人才储备方面也做足了准备。据报道,蚂蚁集团在招聘平台大量招募“多模态理解与生成算法”专家等岗位,显示出其对多模态技术的高度重视。

04 战略布局:AI First

“灵光”的发布是蚂蚁集团“AI First”战略的重要落地形式之一。

自2023年以来,蚂蚁集团持续推进“AI First、支付宝双飞轮、加速全球化”三大战略,陆续推出多款AI应用。

2025年3月韩歆毅正式接任CEO后,公司进一步设立了AGI部门,由蚂蚁集团CTO何征宇直接负责,专攻通用人工智能算法和应用。

这一系列举措表明,蚂蚁集团正将人工智能特别是通用人工智能作为未来发展的核心方向。

05 行业前景:多模态竞赛

随着“灵光”的加入,国内多模态AI应用赛场变得更加热闹。

此前,元宝App、豆包App等已推出类似的图片识别功能,获得了不少用户的青睐。蚂蚁集团的“灵光”直接对标这些行业竞品,显示出其抢占多模态AI高地的决心。

多模态AI被视为人工智能发展的下一个风口,它打破了单一文本交互的模式,让AI能够理解和生成图像、声音、文本等不同形式的内容。

随着技术的不断成熟,多模态AI应用正逐步从概念验证走向规模化商用,未来有望在教育、医疗、娱乐等多个领域发挥更大价值。


随着“灵光”加入战场,国产多模态AI应用竞争日趋激烈。科技巨头们不再满足于单一文本交互,而是朝着融合视觉、语音的通用人工智能迈进。

从“灵光”到“豆包”再到“元宝”,这些充满生活气息的命名背后,是中国AI企业让技术落地、让智能普惠的探索。

关注 “悠AI” 更多干货技巧行业动态

© 版权声明
广告也精彩

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...