(AI 资源之家讯)当谷歌和 Anthropic 还在用闭源 API 锁住开发者时,阶跃星辰选择了另一条路——直接开源模型权重。5 月 29 日,这家成立仅三年的 AI 公司发布并开源了 Step 3.7 Flash,一款专为生产级 Agent 打造的高效模型。
参数配置:196B 大身板 11B 小消耗
Step 3.7 Flash 采用稀疏 MoE(混合专家)架构,总参数量高达 196B,另配有 1.8B 参数的视觉模块。但关键在于——每次推理只激活约 11B 参数。这意味着它在保持大模型能力的同时,推理成本不到同等规模密集模型的十分之一。最高生成速度达到每秒 400 tokens,对比同级前沿模型快了约四倍,堪称闪电版。
该模型支持 256K 上下文窗口,并提供低、中、高三档推理级别,开发者可以根据场景需求灵活平衡响应速度和任务复杂度。这在 Agent 场景中尤为重要——简单任务快速响应,复杂任务深度思考。
Agent 专属优化:不只回答问题,更要动手干活
阶跃星辰对 Step 3.7 Flash 的定位非常清晰:不是聊天机器人,而是生产级 Agent 的基础设施。在 Toolathlon 多工具协同测试中得分 49.5%,在 ClawEval-1.1 真实环境自主任务执行测试中拿下 67.1%,在 t2-bench Telecom 的三档难度测试中通过率全部超过 98%。
更厉害的是它的多模态处理能力。Step 3.7 Flash 可以直接理解 UI 界面、图表、文档和图片内容,将复杂视觉信息转化为结构化结果和可执行任务。遇到不确定的信息时,它还能主动发起联网搜索和视觉搜索进行交叉验证——这种主动求证能力是 Agent 从演示走向生产环境的关键一步。
实测案例显示,输入做一份美伊局势的分析 PPT,系统能并行生成四个不同风格的完整版本,每个版本 6 - 8 页,单个耗时仅数十秒。这种批量出活的能力,让它非常适合企业级高频调用的场景。
开源生态布局:手机到云端全覆盖
Step 3.7 Flash 已全面兼容 Claude Code、OpenClaw、Hermes Agent、KiloCode 等主流 Agent 和编程工具,支持 MCP 和 Skills 协议。而阶跃星辰的商业化也不含糊——端侧授权收费加云侧按消耗计费,其模型已预装进 OPPO、荣耀等手机,总装机量超 4200 万台。
AI 资源之家认为,阶跃星辰的这次开源具有标志性意义。前代 Step 3.5 Flash 上线一个月就登顶 OpenRouter 平台 OpenClaw 调用量全球第一,HuggingFace 下载量超 30 万。如今 Step 3.7 Flash 以更强的 Agent 能力和完全开源策略推向市场,Flash 模型正从轻量替代品进阶为支撑生产级 Agent 规模化落地的核心基础设施。国产大模型在 Agent 赛道上的开源攻势,才刚刚开始。