一排排超级计算机指示灯在黑暗中闪烁,庞大的计算力正将超过650亿个印地语标记转化为能理解文化细微差别的人工智能。
阿布扎比科技集团G42正式发布NANDA 87B——一个拥有87亿参数的开源双语大语言模型,专为印地语和英语设计。
这款模型基于Meta的Llama-3.1 70B架构打造,专门针对印地语进行了深度优化,训练数据包含超过650亿个印地语标记。
01 技术突破
NANDA 87B的技术基础体现了当前大规模AI开发的最新进展。该模型建立在Meta强大的Llama-3.1 70B架构之上,并针对印地语进行了显著增强。
模型训练使用了由G42与AI硬件公司Cerebras合作构建的Condor Galaxy超级计算机,这是全球最强大的AI超级计算机之一。
开发团队专门创建了定制化的印地语中心分词器,这一创新提高了效率,同时降低了训练和推理过程所需的时间和计算成本。

02 语言包容
NANDA 87B的设计目标是服务全球超过6亿印地语使用者,满足他们与数字世界互动的需求。
模型不仅精通使用梵文书写的正式印地语,还能理解日常口语和“Hinglish”——印地语和英语广泛使用的混合语言。
G42印度首席执行官Manu Jain强调:“印度应得说其语言的世界级技术。” 这一表态凸显了该模型致力于为印度用户提供符合其语言习惯的技术解决方案。
03 应用场景
该模型展现出多方面的实用能力,在翻译、总结、指令跟随和音译等关键任务中表现强劲。
模型设计的核心包括安全性和文化对齐,使其能够生成情境感知和负责任的回应。
行业估计显示,印度超过80%的新互联网用户更喜欢使用本地语言,这为定制化语言模型创造了巨大需求。NANDA 87B的推出恰逢其时。
04 开源战略
与大多数仅发布权重的“开放”AI模型不同,G42将NANDA 87B作为完全开源项目发布。
该模型已在MBZUAI的Hugging Face页面上提供,使开发者和研究者能够自由访问、探索并基于其先进能力进行构建。
这种开放策略促进了创新浪潮,使更广泛的群体能够参与AI开发并从技术进步中受益。
05 行业影响
NANDA 87B的发布标志着多语言人工智能发展的一个重要时刻。通过基于领先架构构建并使用大规模印地语数据集进行训练,G42提供了一个强大、文化适配且易于获取的工具。
这一举措不仅为印地语-英语语言模型设立了新标准,也体现了对促进全球增长最快数字经济之一内AI创新的战略承诺。
随着开发者和研究者开始利用其能力,NANDA 87B有望解锁AI驱动服务和应用的新可能性,特别是在教育、娱乐和企业服务等领域。
阿联酋《国民报》在评论中指出,G42的这一举措不仅是技术展示,更是全球AI力量平衡变化的信号。
通过将先进AI能力扩展到英语以外的语言世界,NANDA 87B正悄然改变全球6亿人的数字体验,而这只意味着开始——G42的下一步,可能将指向更多被主流AI忽视的语言社群。

关注 “悠AI” 更多干货技巧行业动态