去年底,AI芯片初创企业Groq以 200 亿美元的高价,将自研LPU推理技术非独家授权给了英伟达,部分核心团队成员也随之加入英伟达麾下。这笔交易完成后,外界一度对Groq的未来走向充满疑问。然而不到半年,Groq就给出了答案:转型为AI推理云服务供应商,并完成了一轮高达6. 5 亿美元(约 44 亿元人民币)的新融资。
Groq的自信源于一张独门牌:全球唯一具备大规模LPU实际操作经验的工程团队。LPU(语言处理单元)是Groq自研的专用推理芯片,擅长以极低延迟处理大模型推理任务,曾凭借惊人的生成速度在开发者社区圈粉无数。
技术授权给了英伟达,但人还在、经验还在,Groq认为这套"肌肉记忆"正是其区别于其他云服务商的核心壁垒。目前,Groq已在北美、欧洲、中东、亚太四大区域运营 13 座数据中心,累计服务超过 500 万开发者和数千家AI原生企业,每周消耗的词元(Token)数量以万亿计。
这笔融资将被重点用于扩张AI推理基础设施。Groq计划部署最新推理技术及英伟达LPX系统,目标在 2027 年底前将算力规模推进至 200 兆瓦,支撑更大体量的推理业务。
从一家芯片设计公司到AI推理云服务商,Groq的这次转型并非简单的业务重组。在英伟达主导算力市场的当下,将技术授权给竞争最强的对手,同时借助其平台快速扩张自身的云服务版图,这套"以退为进"的打法,或许正在成为一种新的AI创业生存智慧。
凌川科技完成数亿元A+轮融资,由啟赋资本领投,百度风投等跟投,用于下一代AI芯片研发、量产及海外拓展。公司成立于2024年3月,北京市人工智能基金与快手集团共同发起,专注智能视频与生成式视频等多模态大模型底层算力硬件。
亚马逊正就向外部企业出售自研AI芯片Trainium进行深度商谈,一改过去仅以云服务提供算力的模式,有望以硬件形式进入企业自建数据中心。此举标志AI算力市场竞争升级,从云端租赁转向芯片直销的新博弈阶段。
字节跳动计划与国内高性能计算厂商天数智芯洽谈,大规模采购约5万颗AI芯片,主要用于部署推理任务场景,以支持其AI聊天机器人“豆包”的迭代和用户增长。此举反映AI大模型用户规模扩张下,算力基础设施自主可控成为科技企业战略重心。
英国政府计划通过直接采购本土AI芯片和半导体设备,阻止科技初创企业迁往美国。技术大臣莉兹·肯德尔将在伦敦科技周宣布这一“战略性采购”举措,旨在留住企业、确保英国在AI领域的技术主权,减少对美国科技巨头的依赖。
欧洲最大AI初创公司Mistral AI首席执行官表示,长期看自研定制AI芯片是趋势。随着大模型算力需求激增,科技巨头及OpenAI等独角兽纷纷自研芯片或与半导体企业合作,以降低成本。

关注 “悠AI” 更多干货技巧行业动态