一张据称是内部基准测试的截图在社交平台流传,图表中一条代表“Snow Bunny”的性能曲线将竞争对手们远远甩在身后,迅速点燃了全球AI社区。
近日,社交平台X上曝出关于谷歌下一代大模型Gemini 3.5的重磅泄露信息,一个代号为“Snow Bunny”的内部测试版本展示了令人震惊的工程能力。
据泄露信息显示,该模型能够一次性构建完整应用程序,仅通过单次提示便可生成多达3000行可运行代码。更引人注目的是,泄露数据声称其性能已经超越了备受关注的GPT-5.2和Claude Opus4.5。
01 泄露风暴
上周,社交平台X成为全球AI技术圈风暴的中心。博主Pankaj Kumar发布的一系列帖文,突然将谷歌尚未公布的下一代模型推到了聚光灯下。
泄露信息描绘了一个代号“Snow Bunny”(雪兔)的Gemini 3.5内部测试版本。这个看似温和的代号背后,隐藏着颠覆性的技术能力。
据称该模型能够通过单次提示生成多达3000行可运行代码,并一次性构建出完整的应用程序。对于软件开发行业而言,这意味着从需求到成品的路径可能被大幅缩短。
泄露的代码片段中已经出现了“gemini-for-google-3.5”相关的变量,预示着该模型的API可能已经准备就绪。
02 架构突破
此次泄露最核心的技术亮点,是Gemini 3.5对“系统2思维”的引入。这一概念源于心理学家丹尼尔·卡尼曼的理论,代表了一种缓慢、深思熟虑的思考方式。
与当前主流AI模型主要依赖的快速直觉反应不同,“系统2思维”允许模型在回答前进行深度思考,并行探索多种解题路径,并从中筛选最优方案。

泄露数据显示,在这种被称为“Deep Think”的模式下,Gemini 3.5在高难度逻辑测试中得分高达80%,而主要竞争对手的成绩约为55%。
03 性能碾压
泄露信息中最具争议的部分是性能对标数据。据称,Gemini 3.5在多项基准测试中表现出色,甚至超越了尚未正式发布的GPT-5.2。
在象形文字基准测试中,“Snow Bunny”取得了80%的成功率,远超GPT-5.2的55%和自家前代产品Gemini 3.0 Pro的45%。这项测试主要评估横向思维能力,即发现看似无关概念之间联系的能力。
“这不仅仅是简单的数字游戏”,一位行业观察者指出,“如果数据属实,这表明谷歌在AI架构上取得了质变性的突破”。
04 市场版图
泄露事件发生在一个关键时刻。根据市场分析,OpenAI在AI用户中的市场份额已从2025年的87%下降至68%。
与此同时,谷歌Gemini的市场份额从5.4%上升至18.2%。这一变化不仅是数字的增减,更反映了AI技术融入生产力体系的结构性变革。
谷歌已将Gemini深度集成到Chrome、Android和Google Workspace等产品中,使其从用户主动打开的应用程序转变为操作系统和日常工具的固有功能。
价格策略方面,谷歌也展现出明显优势。GPT-5.2每百万输入令牌的定价为1.75美元,而谷歌Gemini Flash仅为0.50美元,价格差距高达71%。
05 行业地震
泄露事件引发了整个AI行业的震动。“如果这些信息属实,2026年AI行业的权力平衡将发生根本性转变”,技术分析师Konrad Wolfenstein指出。
传统上,AI模型的进步主要通过增加参数和提升计算能力实现。但最新研究表明,单纯的规模扩展已不足以带来质的飞跃。
需要真正的架构创新,即从“统计预测下一个词元”向“分解问题、层级推理、验证”的范式转变。Gemini 3.5似乎正是这一转变的代表。
摩根士丹利估计,如果谷歌将其现有Workspace客户群的30%转化为Gemini Enterprise用户,到2027年可能创造80亿至100亿美元的年度经常性收入。
泄露信息中一个值得玩味的细节是:“原始”版本和采用更严格安全过滤器的“改进版”在基准测试中均达到了80%的成功率。这与AI研究中长期存在的假设——安全校准必然会损害纯粹的认知性能——形成了鲜明对比。
目前所有泄露信息均未得到谷歌官方证实。行业观察者普遍认为,无论泄露数据是否完全准确,谷歌Gemini 3.5的方向——强推理能力与高实用性结合——已经精准地踩中了AI发展的关键赛道。

关注 “悠AI” 更多干货技巧行业动态