开源“轻骑兵”加速智能体落地，阶跃星辰Step 3.5 Flash发布

一次预测三个词、每秒生成350个词，这款总参数1960亿的模型，正以轻量化架构重新定义AI智能体的成本边界。

2026年2月2日，阶跃星辰正式发布了新一代开源智能体基座模型Step 3.5 Flash。该模型专为实时智能体工作流场景打造，最高推理速度可达每秒350个词，在单请求代码类任务上表现尤为突出。

在多家头部芯片厂商已完成适配的背景下，这款被业界称为“智能体轻骑兵”的模型，正在引发新一轮开源AI应用热潮。

01 技术突破

Step 3.5 Flash的技术架构体现了当前大模型设计的先进理念。模型采用稀疏MoE架构，总参数量高达1960亿，但每个词元仅激活约110亿参数，有效平衡了模型能力与计算效率。

这种设计使模型既保持了足够的容量处理复杂任务，又避免了传统大模型庞大的计算开销。

在关键技术方面，Step 3.5 Flash引入了MTP-3技术，实现了一次预测三个词元的突破，相比传统单词预测方法，效率直接翻倍。

混合了3:1滑动窗口与全局注意力的架构使模型能够在256K的超长上下文中精准捕捉关键信息，显著降低了计算负担。

在实际性能方面，Step 3.5 Flash展现出令人印象深刻的水平。在智能体核心应用场景和数学逻辑任务上，其表现足以媲美主流闭源大模型。

官方演示中，仅凭一段文字描述，该模型即可自动编写并输出基于WebGL2.0引擎的高性能可视化平台，展现了强大的代码生成能力。

开源“轻骑兵”加速智能体落地，阶跃星辰Step 3.5 Flash发布

在处理复杂计算任务时，Step 3.5 Flash能够在不使用外部工具的情况下，快速完成等差数列求和、阶乘累加等高难度数学运算。

这种能力使模型尤其适用于需要复杂推理和代码执行的智能体应用场景。

为加速模型落地，阶跃星辰已与华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部芯片厂商完成适配工作。

这种深度协同优化将有效提升模型在各类硬件平台上的运行效率，降低推理成本。

模型目前已在GitHub、HuggingFace以及OpenRouter等主流平台全量上线。特别值得注意的是，OpenRouter平台目前提供限免使用，为零成本尝试智能体升级提供了便利。

针对本地部署需求，阶跃星辰专门优化了模型在个人工作站上的运行性能，包括NVIDIA DGX、Apple M4Max等硬件平台。

Step 3.5 Flash的发布正值智能体应用蓬勃发展的关键时期。随着推理模型逐渐成为主流，模型与算力的深度协同正在成为推动大模型规模化应用的重要路径。

这款专为智能体场景优化的模型，有望进一步降低企业和开发者在应用大模型时的综合门槛。

阶跃星辰在2025年7月联合近10家芯片及基础设施厂商发起的“模芯生态创新联盟”初见成效。

通过打通芯片、模型与平台之间的技术壁垒，联合优化提升了算力利用效率，加速了大模型在各行业场景中的应用落地。

发布现场，阶跃星辰工程师演示了Step 3.5 Flash作为“云端大脑”处理复杂任务的场景：用户只需提出“对比各平台价格”这样的模糊需求，模型即可自动拆解为具体的搜索与抓取子任务。

目前，Step 3.5 Flash已在三大主流平台全量上线。与此同时，阶跃星辰已启动Step 4模型的训练工作，并邀请全球开发者共同定义下一代智能体基础模型。

关注 “悠AI” 更多干货技巧行业动态

文章版权归作者所有，未经允许请勿转载。

没有相关内容!

您必须登录才能参与评论！

立即登录

暂无评论...