视频生成速度慢、成本高,一直是AIGC领域的痛点。腾讯混元团队这次给出了一个新的解法。
腾讯混元正式开源了全新视频生成加速方案DisCa,代码与模型权重均已公开可用。这项工作已被计算机视觉顶会CVPR2026收录,也是学界和业界首次在蒸馏后少步模型上探索可学习特征缓存加速技术的尝试。

DisCa的核心思路,是在已经完成蒸馏、推理步数已经很少的模型上,进一步压缩推理成本。传统的特征缓存方案在多步生成模型上效果不错,但直接用在少步蒸馏模型上会产生过大的缓存误差,导致生成结果崩坏。DisCa的解决方式是引入一个轻量级神经网络预测器,通过对抗学习训练,让预测器学会根据缓存特征更精准地预测后续特征的演化轨迹,从而在保证生成质量的前提下,将加速边界拓展至11.8倍。
另一个值得关注的方向是R-MeanFlow。来自MIT何恺明团队的MeanFlow方案在图像生成上表现亮眼,但腾讯混元团队发现,将其直接用于更复杂的视频生成任务时,"一步生成"的目标过于激进,反而会对模型训练产生负面影响。他们的改进思路简单直接:既然暂时不做一步生成,就把训练中的激进场景剪掉,将步长范围约束在合理区间内。这一结论与MIT和谷歌团队的同期研究相互印证,相关成果已被用于当前最佳开源视频生成模型HunyuanVideo-1.5的实际训练中。
两个方向加在一起,DisCa的意义不只是一篇论文,而是在工程落地层面给出了可复现的路径。对于需要大规模部署视频生成能力的团队来说,这份开源方案值得认真研究。
腾讯混元团队开源“混元3D世界模型2.0”,实现从视频生成到可交互、可编辑3D资产的升级。支持文、图、视频输入,能自动生成包含人、物、景的完整3D空间,并支持多种格式导出,无缝对接主流游戏引擎。
耀客传媒推出AIGC奇幻悬疑短剧《秦岭青铜诡事录》,由AI数字人“秦凌岳”与“林汐颜”主演。故事围绕退役侦察兵秦岳在秦岭矿区探索,揭开矿难异变与两代人血祭真相。该剧是国内首批由AI艺人独立担纲的影视作品。
哩布哩布AI针对AIGC安全问题发布公告,承认平台在复杂提示词组合下曾出现不合规内容,现已完成技术修复并封堵风险路径,承诺加强防范。
可灵AI于2026年4月1日推出“会员模型优惠计划”,旨在降低高阶视频创作门槛。活动持续至6月30日,覆盖Web和App端。期间,铂金及以上会员可享视频模型8折灵感值优惠,黄金会员享9折。平台还延长了图片模型优惠。
《天问》作为首部全流程AI制作的科幻短片,由鲍德熹监制、爱奇艺联合发起,上线9小时即登顶双榜,标志着电影工业迎来“奥本海默时刻”。该片以震撼视觉效果和AI全流程制作引发行业广泛关注,展示了AIGC在影视精品化赛道的重要突破。

关注 “悠AI” 更多干货技巧行业动态