商汤发布原生理解生成统一模型 SenseNova U1 告…

国产人工智能领域再次迎来技术性突破。 4 月 28 日晚间,商汤科技正式向外界展示并开源了其最新研发成果——“日日新SenseNova U1”系列。这一系列被定义为“原生理解生成统一模型”,其核心价值在于打破了以往多模态模型依赖于不同模块“拼接”的传统思路。

长期以来,多模态大模型大多采用将视觉模块与语言模块进行拼合的模式,这种“拼接式”设计往往导致信息在不同表征空间传递时产生损耗。而 SenseNova U1 系列基于商汤今年 3 月自主研发的 NEO-unify 架构,成功在单一模型框架内实现了多模态理解、推理与生成的深度统一。

商汤发布原生理解生成统一模型 SenseNova U1 告别插件式AI

这种技术路径的转变,构建了一个统一的表征空间。这意味着模型在处理信息时,语言与视觉信号能够实现更高效的协同。在实际表现中,这种架构不仅增强了模型对复杂信息的感知深度,也让生成能力的自然度和精准度同步得到显著提升。

为了促进开源社区的共同发展,商汤此次率先推出了 SenseNova U1 Lite 轻量版。该版本包含两个规格的模型,旨在满足不同应用场景下的性能平衡需求。目前,相关模型的代码及文件已正式上线相关开源平台。

商汤方面透露,目前的轻量版仅仅是开始,未来计划推出体量更大、参数更丰富的模型版本。业内专家认为,这种原生统一架构的成熟,将为自动驾驶、智能硬件以及更复杂的工业协作等领域打开全新的应用想象空间,标志着国产AI正在从“功能叠加”向“结构进化”迈进。

Mistral AI于4月28日发布企业级AI编排层Workflows,作为Mistral Studio平台关键组件,旨在将零散AI流程转化为可大规模生产的系统。该工具已进入公开预览,获ASML、ABANCA及CMA-CGM等跨国巨头应用。技术架构基于Temporal引擎,支持Python定义复杂流程,提升核心业务效率。

前推特CEO Parag Agrawal创办的Parallel Web Systems完成1亿美元B轮融资,估值达20亿美元。本轮由Sequoia Capital领投,现有投资者跟投。公司现有约50名员工,去年A轮融资1亿美元时估值为7亿美元。

商汤科技发布并开源日日新SenseNova U1系列模型,基于自研NEO-unify架构,实现多模态理解、推理与生成的深度统一,标志着从“集成式”向“原生统一”的跨越。该架构摒弃拼接式设计,去除视觉编码器和变分自编码器,提升了模型效率与性能。

英伟达发布开放式多模态大模型Nemotron3Nano Omni,整合视频、音频、图像和文本的深度推理能力,采用30B-A3B混合专家架构,内置视觉与音频编码器,旨在为开发者提供更快速、更智能的交互响应方案。

Perplexity旗下AI浏览器Comet推出iPad版本,全面适配iPadOS,支持多窗口浏览与多任务处理,并深度整合OpenAI、Anthropic等主流AI模型,提升智能上网体验,强化用户与AI聊天机器人的互动。

商汤发布原生理解生成统一模型 SenseNova U1 告…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...