4月15日,小红书AI平台团队悄悄做了一件在技术圈颇具分量的事——正式开源了一款名为Relax的大模型强化学习训练引擎。
Relax的设计定位很明确:专为全模态与Agentic场景打造。换句话说,它不只是处理文字,图像、音频、视频等多种输入形式,都能在这套引擎里统一处理、灵活接入。对于当下AI发展的方向来说,这个切入点踩得相当准——多模态和智能体(Agent)正是行业公认的下一个主战场。
在技术层面,Relax引入了模态感知并行与端到端异步流水两项核心机制。前者让系统能够根据不同模态的特性智能分配计算资源,后者则通过异步流水线设计减少训练过程中的等待与空转。两者结合,直接目标是提升多模态训练的整体效率与可扩展性——这对于需要大规模训练的AI团队来说,是实实在在的工程价值。
值得关注的是开源这个动作本身。小红书并非传统意义上的AI基础设施公司,此次主动将内部训练引擎对外开放,一方面展示了其在AI工程领域的积累深度,另一方面也在向开发者社区递出橄榄枝——用技术贡献换取生态影响力,这是越来越多科技公司在AI时代选择的路径。
AI军备赛里,小红书这张牌,打得有点出人意料。
字节跳动火山引擎4月2日开放Seedance2.0多模态视频生成模型的普通API申请,标志着该模型从限量测试走向广泛开放。该模型支持文字、图片、音频、视频四种输入,能实现角色一致性、导演级镜头控制和物理模拟。
智象未来推出多模态原生应用HiDreamClaw,接入其个人创意平台,率先向海外用户开放。该应用以强大的底层兼容性为核心,整合自研与前沿模型,标志着公司在构建全流程AI创意生态上迈出关键一步。
阿里通义实验室近期经历组织架构调整,将Qwen团队拆分为预训练、后训练等多条平行线。随后,原Qwen后训练负责人郁博文被曝已加入字节跳动,担任Seed团队视觉模型与多模态交互的后训练负责人。字节跳动尚未官方回应。
OpenRouter平台新增Hunter Alpha与Healer Alpha两款模型。Hunter Alpha参数达1万亿,支持100万token上下文和多模态输入,专为智能体场景设计,擅长复杂推理与多步骤任务。Healer Alpha则具备262K token上下文窗口。两款模型均引发社区关注。
2026年除夕,阿里巴巴开源新一代大模型千问Qwen3.5-Plus,性能媲美Gemini3Pro,成为全球最强开源大模型。该模型采用底层架构革新,参数3970亿但激活仅170亿,以更小规模超越万亿参数的Qwen3-Max,部署显存占用降低60%,长上下文推理吞吐量提升19倍。API成本低至每百万Token 0.8元,仅为Gemini3Pro的1/18。此外,它实现了从纯文本到原生多模态的跃迁。

关注 “悠AI” 更多干货技巧行业动态