在生成式 AI 的激烈竞争中,算力与调用成本始终是开发者最为关注的“生命线”。近日,谷歌在开发者生态层面释放重磅利好:针对部分账户的Gemini API免费配额进行了大幅上调,部分模型的单分钟 Token 处理上限(TPM)已正式提升至100万大关。
根据测试反馈,此次调整的覆盖范围主要集中在 Gemini2.5系列模型。其中,Gemini2.5Flash 与 Flash-Lite 两款轻量化模型在部分账号中,已率先实现了100万 Token/分钟的超高吞吐能力。更为吸引人的是,这一免费层级依然保持了“免绑卡、不限总量”的极低门槛,为个人开发者和初创团队提供了极具竞争力的低成本试错空间。

不过,谷歌的此次策略性扩容呈现出明显的“差异化”特征。并非所有用户都能享受到这一顶级额度,且不同模型之间的性能限制依然存在。目前,虽然 Token 处理上限大幅放宽,但各模型的请求频率限制(RPM)仍被控制在每分钟15次至30次不等,且每日请求总量(RPD)锁定在1500次。此外,作为该系列中的高端方案,Pro 版本模型目前暂未进入免费开放队列。
对于关注隐私的开发者而言,需要额外留心的是,谷歌在服务条款中明确指出,其有权利用免费层级下的提示词(Prompt)与反馈内容进行模型训练。针对这一潜在的数据合规痛点,开发者可以通过官方查询页面查看当前账户的具体额度详情,并根据业务敏感度评估是否选择升级至付费版本。
行业人士认为,谷歌此举不仅是为了通过高规格的免费配额吸引开发者迁入其 API 生态,更是为了在开源模型冲击下,通过极致的性价比稳固其在推理服务市场的领先地位。随着这一免费策略的持续铺开,个人开发者构建复杂 AI 应用的门槛有望被进一步压低。
Snap因内部生成式AI成本高昂,将AI视频团队分拆为独立公司Dotmo,以减轻财务压力并提升运营灵活性。新公司专注开发可生成互动游戏体验的AI模型,核心团队由Snap离职员工组成。Dotmo虽架构独立,但与Snap仍保持紧密的资本和技术纽带。
Getty Images与OpenAI达成合作,将庞大授权图片库接入ChatGPT,为用户搜索提供视觉化内容支持。作为全球视觉素材巨头,Getty此前已与英伟达在生成式AI领域布局,此次合作进一步深化其AI赋能战略。
SpaceX与AI编程工具Cursor开发商Anysphere达成最终合并协议,Cursor隐含股权估值约600亿美元,股东将换取SpaceX股票,全股票交易无现金支付,预计2026年第三季度完成,尚需监管批准。Cursor是依托大模型快速增长的AI编程产品。
WordPress VIP报告显示,消费者对AI信任度持续走低:60%反感品牌使用“人工智能”营销,86%不完全信任AI,73%认为互联网更缺人情味。42%的受众对缺乏明确来源的内容信任度更低,品牌获取AI引用虽便捷,但赢得信任难度加大。
OpenAI过去一年总支出达340亿美元,其中研发投入约190亿美元,销售等运营费用近60亿美元。尽管成本高昂,资本仍持续支持其运营和技术迭代。公司正推进IPO,市场预计其上市后估值或超1万亿美元。

关注 “悠AI” 更多干货技巧行业动态