清华突破性开源模型GUAVA:0.1秒实现单张照片高精度3D数字人重建

AI广播站1周前更新 小悠
40 0 0

最新消息:清华大学研究团队于近日正式开源高性能三维数字人生成模型GUAVA(Geometry-aware Unified Avatar),该技术实现仅通过单张肖像照片在0.1秒内生成高保真、可驱动的3D数字人,标志着我国在实时三维重建领域取得突破性进展。


在人工智能与计算机视觉融合不断深化的当下,3D数字人技术已成为元宇宙、影视制作和虚拟交互等领域的关键基础设施。然而,传统数字人建模往往依赖专业设备、复杂算法与长时间计算,难以实现高效率、低门槛的普及应用。清华团队此次发布的GUAVA模型,以极速、高精度的生成能力打破技术壁垒,展现出强大的科研创新与工程实现能力。

GUAVA模型基于原创的几何感知统一表示框架,深度融合神经辐射场(NeRF)与显式网格建模技术。它不仅能够从任意用户自拍照片中提取几何与纹理信息,还在保持面部特征、光影细节和表情动态方面表现优异。实际测试表明,该模型在消费级GPU上仅需0.1秒即可完成推理,生成可用于动画驱动和实时渲染的3D数字资产。

团队负责人表示,GUAVA相较于国际同类方案如ECMA、IMavatar等,在训练速度、输出一致性和跨身份泛化能力上均具备显著优势。目前其代码及预训练模型已在GitHub平台面向全球开放,短短三天内已获得超过3000次星标订阅,引起国内外学术界与工业界的广泛关注。

业内专家评价称,GUAVA的开源极大降低了3D内容生成的技术门槛,可快速应用于虚拟直播、游戏角色创建、线上试衣、文化遗产数字化等领域,真正实现“一张照片,塑造数字自我”。

值得注意的是,该技术仍面临复杂光照、遮挡场景下的生成稳定性挑战,团队表示将继续优化模型鲁棒性并推进多模态输入融合研发。

关注 “悠AI” 更多干货技巧行业动态

© 版权声明
广告也精彩

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...