腾讯发布 HY-Embodied-0.5具身模型,22项评…

AI广播站8小时前更新 小悠
16 0 0

近日,腾讯 Robotics X 实验室联合腾讯混元团队正式推出专为具身智能打造的基础模型 HY-Embodied-0.5。此举旨在解决通用视觉语言模型(VLM)因缺乏精细三维空间感知与物理交互能力,难以落地物理世界的行业痛点,标志着大模型认知链路正实质性延伸至机器人控制领域。

该系列模型并非通用基座的简单微调,而是从架构到训练范式的彻底重构。团队同步推出两款主力模型:MoT-2B(总参4B,激活2B)主打端侧实时响应,MoE-32B(总参407B,激活32B)追求极致推理性能。

腾讯发布 HY-Embodied-0.5具身模型,22项评测16项最佳刷新行业纪录

技术上,团队首创视觉与语言模态非共享参数的混合 Transformer(MoT)架构,配合原生分辨率视觉编码器 HY-ViT2.0与视觉潜在 Token 机制,有效避免了小模型在多模态训练中的灾难性遗忘。训练层面,依托超1亿条高质量具身专属数据,结合拒绝采样微调、强化学习与在线蒸馏等多阶段后训练策略,驱动模型思维链自主进化。

性能验证显示,MoT-2B 在涵盖感知、推理、规划的22项权威评测中斩获16项最佳,超越 Qwen3-VL-4B 及 RoboBrain2.5等同参数竞品;旗舰版 MoE-A32B 综合成绩亦能与 Gemini3.0Pro 等国际标杆抗衡。

实机测试中,搭载该基座的机器人在打包、堆叠等任务上表现优于主流基线模型。这一进展为具身智能从虚拟仿真走向物理实操提供了高性能的底层基座支撑。

MiniMax推出MMX-CLI命令行工具,专为AI Agent设计,简化全模态模型调用流程。该工具解决了接口适配繁琐、代码冗余等问题,使Agent能像原生应用一样轻松调度多种AI能力。用户可在主流开发环境中一键调用编程、视频生成等功能,无需额外编写MCP Server或适配复杂接口。

腾讯发布国内首个AI浏览器“龙虾”QBotClaw,将浏览器升级为全场景AI助理。其最大亮点是高度开放,支持用户自由配置主流大模型API,打破单一模型绑定。Mac版已上线并集成QQ浏览器Skill,Windows版即将推出,旨在降低使用门槛。

4月8日,港股科技股迎来集体上涨,主要受全球AI技术突破和应用落地加速的利好推动。大模型及AI应用板块开盘表现强劲,智谱AI和MiniMax成为市场焦点,分别高开近15%和超过8%,引领板块上涨。

阿里通义实验室Qwen Pilot团队推出FIPO算法,通过引入Future-KL机制,精准识别推理链中的关键Token,以优化大模型推理能力,突破传统强化学习方法在区分重要Token上的瓶颈。

阿里Qwen3.6-Plus在OpenRouter周榜中位列全球大模型调用量第一,连续四天霸榜日榜。其单日调用量突破1万亿Token,成为该平台首个达到此里程碑的模型,展现了千问系列在全球模型竞争中的强劲实力。

腾讯发布 HY-Embodied-0.5具身模型,22项评…

关注 “悠AI” 更多干货技巧行业动态

© 版权声明

相关文章

没有相关内容!

暂无评论

您必须登录才能参与评论!
立即登录
none
暂无评论...