在摆脱单一算力供应依赖的道路上,OpenAI 迈出了极具标志性的一步。当地时间6月24日,OpenAI 正式与半导体巨头博通联合发布了首款定制化 AI 推理芯片——Jalapeño。这一举措标志着 OpenAI 已经不再满足于仅在软件与算法层面领先,而是开始深度介入底层硬件的架构设计。
Jalapeño 是一款专门为大语言模型(LLM)推理任务量身打造的专用集成电路(ASIC)。该项目展现出了惊人的开发效率,从最初的蓝图设计到最终的流片交付,仅耗时9个月。为了实现这一目标,OpenAI 甚至调用了自家的 AI 模型来加速芯片的设计流程。在分工协作上,OpenAI 负责核心的架构设计,博通承担了复杂的硅片实现与网络硬件支持,而加拿大电子制造服务商 Celestica 则负责后续的板卡与机架集成工作。

在性能表现上,虽然 OpenAI 目前仍在评估最终数据,但早期实验室测试结果显示,Jalapeño 在运行 GPT-5.3、Codex 和 Spark 等关键机器学习任务时,表现出了卓越的每瓦性能。通过精心设计的架构,该芯片有效减少了数据传输的损耗,并实现了计算、内存与网络资源的极致均衡,使得实际利用率远高于行业通用水平。
OpenAI 总裁兼联合创始人格雷格·布罗克曼表示,随着世界进入以计算为核心的经济时代,Jalapeño 是公司构建全栈基础设施战略的关键环节。通过自主掌握底层技术栈,OpenAI 不仅能大幅降低昂贵的运营成本,还能以更高的效率驱动更强大的智能。博通 CEO 陈福阳则透露,这仅仅是双方跨代研发路线图的开端。
事实上,此次自研芯片的布局,也是 OpenAI 应对激烈市场竞争的必然选择。过去,OpenAI 深度依赖微软的 Azure 云算力集群,而如今,随着行业推理算力需求迅速超越训练需求,多元化的算力底座已成为保持商业领先的生命线。谷歌早已凭借自研 TPU 证明了软硬协同带来的巨大成本优势,而 OpenAI 的入局,无疑将进一步加剧全球 AI 产业在基础设施层面的竞争。
据悉,Jalapeño 将作为 OpenAI 多代计算平台的第一块拼图,计划于2026年底前完成首次部署。随着未来几年该计划的持续推进,OpenAI 正试图通过这种“软硬一体”的战略,重塑其在算力供应链中的话语权。
谷歌于6月25日发布Gemini 3.5 Flash模型,核心亮点是深度优化的计算机操作能力,可直接接管电脑界面、自主执行跨软件工作流。这标志着人工智能从问答机器转向行动派,突破文本生成与信息检索的局限,朝向直接代劳迈出关键一步。
Meta因士气低迷与裁员风波,撤回强制工程师加入AI训练组的要求,改由员工自主选择。此前公司调动七千人参与AI专项,却被批评工作类似流水线数据标注、缺乏挑战,引发强烈不满,政策转变旨在缓解内部矛盾。
谷歌新一代旗舰模型Gemini 3.5 Pro原定本月发布,现推迟至7月。延迟并非技术停滞,而是为追求更高产品成熟度,内部决定给研发团队更多时间深度优化与磨合。这反映算力与模型竞赛激烈,大厂更审慎权衡发布节奏与质量。
OpenAI升级GPT-5.5 Instant模型,显著增强意图识别与引申义捕捉能力,复杂任务处理更稳定。该模型5月5日发布,高风险领域幻觉率下降52.5%,数学、科学及视觉推理进步明显。5月30日的更新进一步优化回复自然度。
OpenAI于6月25日推出轻量模型GPT-5.5 Instant新版,核心升级聚焦提升“洞察力”与任务执行稳定性,使AI更精准把握用户意图。自5月首发以来,该模型在医学、金融及法律等高风险领域幻觉率已大幅降低52.5%,数理推理能力突出。本次迭代则在此基础上再进一步,强化专业场景下的可靠表现。

关注 “悠AI” 更多干货技巧行业动态