阶跃星辰开源Step 3.7 Flash:196B参数11B激活 生产级Agent时代来临

(AI 资源之家讯)当谷歌和 Anthropic 还在用闭源 API 锁住开发者时,阶跃星辰选择了另一条路——直接开源模型权重。5 月 29 日,这家成立仅三年的 AI 公司发布并开源了 Step 3.7 Flash,一款专为生产级 Agent 打造的高效模型。

参数配置:196B 大身板 11B 小消耗

Step 3.7 Flash 采用稀疏 MoE(混合专家)架构,总参数量高达 196B,另配有 1.8B 参数的视觉模块。但关键在于——每次推理只激活约 11B 参数。这意味着它在保持大模型能力的同时,推理成本不到同等规模密集模型的十分之一。最高生成速度达到每秒 400 tokens,对比同级前沿模型快了约四倍,堪称闪电版。

该模型支持 256K 上下文窗口,并提供低、中、高三档推理级别,开发者可以根据场景需求灵活平衡响应速度和任务复杂度。这在 Agent 场景中尤为重要——简单任务快速响应,复杂任务深度思考。

Agent 专属优化:不只回答问题,更要动手干活

阶跃星辰对 Step 3.7 Flash 的定位非常清晰:不是聊天机器人,而是生产级 Agent 的基础设施。在 Toolathlon 多工具协同测试中得分 49.5%,在 ClawEval-1.1 真实环境自主任务执行测试中拿下 67.1%,在 t2-bench Telecom 的三档难度测试中通过率全部超过 98%。

更厉害的是它的多模态处理能力。Step 3.7 Flash 可以直接理解 UI 界面、图表、文档和图片内容,将复杂视觉信息转化为结构化结果和可执行任务。遇到不确定的信息时,它还能主动发起联网搜索和视觉搜索进行交叉验证——这种主动求证能力是 Agent 从演示走向生产环境的关键一步。

实测案例显示,输入做一份美伊局势的分析 PPT,系统能并行生成四个不同风格的完整版本,每个版本 6 - 8 页,单个耗时仅数十秒。这种批量出活的能力,让它非常适合企业级高频调用的场景。

开源生态布局:手机到云端全覆盖

Step 3.7 Flash 已全面兼容 Claude Code、OpenClaw、Hermes Agent、KiloCode 等主流 Agent 和编程工具,支持 MCP 和 Skills 协议。而阶跃星辰的商业化也不含糊——端侧授权收费加云侧按消耗计费,其模型已预装进 OPPO、荣耀等手机,总装机量超 4200 万台。

AI 资源之家认为,阶跃星辰的这次开源具有标志性意义。前代 Step 3.5 Flash 上线一个月就登顶 OpenRouter 平台 OpenClaw 调用量全球第一,HuggingFace 下载量超 30 万。如今 Step 3.7 Flash 以更强的 Agent 能力和完全开源策略推向市场,Flash 模型正从轻量替代品进阶为支撑生产级 Agent 规模化落地的核心基础设施。国产大模型在 Agent 赛道上的开源攻势,才刚刚开始。

正文完
post-qrcode
 0
admin
版权声明:本站原创文章,由 admin 于2026-06-01发表,共计1124字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。