英伟达 7 月 2 日推出 Nemotron-Labs-TwoTower 离散扩散语言模型,旨在解决大模型逐一生成 Token 速度慢的痛点,相关权重已在 Huggingface 开源。模型基于现有 Nemotron 骨干网络改造,复用预训练权重,无需从零完整训练,大幅降低开发成本。
模型总参数量 60B,拆分为两座 30B 独立神经网络协同工作,每塔激活 3B 参数,搭载 128 个可路由专家模块。上下文塔固定冻结,负责留存全文语义信息;去噪塔专门训练,依靠扩散机制并行生成文本,两塔通过交叉注意力互通数据。

传统模型逐 Token 串行输出,双塔架构可并行写入文本,大幅拉高推理吞吐量,兼顾速度与输出效果。多类基准测试数据显示,模型综合能力保留原版 98.7% 水准,文本生成吞吐速度直接提升 2.42 倍,仅代码、数学类任务小幅下滑。
该模型采用英伟达专属开源协议开放权重,开发者可自由下载测试、商用部署。运行需搭配双张 H100 或 A100 80GB 显卡,单卡仅支持纯自回归模式,双塔完整推理需双卡协同。测试覆盖常识、数学、代码、阅读理解等多项任务,多数指标与原版基本持平,平衡了生成速度与内容质量。
微软内部AI操作系统Project Aion曝光,专为AI PC打造。系统基于Edge与网页轻量化技术,摒弃传统开始菜单与桌面图标,任务栏直唤Copilot成唯一交互入口。平台聚焦信息流、创作与实时资讯,独创“空间”功能可自动归类网页,交互逻辑彻底重构。
巨量引擎发布自研广告治理大模型Mamoda 2.5,实现内容安全风控技术升级。该模型从1.0仅能识别基础违规文本起步,经持续迭代,能力边界不断扩展,为数字化广告生态的违规内容高效精准识别与治理提供更强支撑。
Anthropic宣布2026年7月7日起,其订阅服务将移除最强模型Claude Fable5的访问权限,核心功能不再纳入会员权益,开发者和重度用户的包月、包年使用成本预计将大幅上涨。此前美国商务部刚撤销对Fable系列出口限制,公司正进行全球重新部署。
中国科学家在第五届国际地层学大会上发布首个地层学AI大模型及智能全球地层剖面对比系统,旨在整合全球地质数据,用人工智能取代繁杂的人工比对,高效解读地球46亿年演化史,成为地球的“智能管家”。
Anthropic宣布7月7日起将旗下最强模型Claude Fable5从各档订阅中移除,转为按使用量积分计费。此前Pro、Max等用户每周可使用该模型的额度最高占50%,现将失效,这一调整引发用户争议。

关注 “悠AI” 更多干货技巧行业动态