Model-Computing Power Collaboration
搜索文档
阶跃星辰发布开源基座模型Step 3.5 Flash,多家头部芯片厂商完成适配
凤凰网· 2026-02-02 14:32
凤凰网科技讯2月2日,阶跃星辰发布新一代开源Agent基座模型Step3.5Flash。该模型面向实时Agent工 作流场景,采用稀疏MoE架构,总参数量为1960亿,每个token激活约110亿参数,旨在兼顾推理速度与 使用成本。 据官方介绍,在单请求代码类任务中,Step3.5Flash的推理速度最高可达每秒350个token。目前,包括华 为昇腾、沐曦股份、壁仞科技、燧原科技等在内的多家芯片厂商已完成对该模型的适配。 阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起"模芯生态创新联盟",旨在通过联合优化提 升算力效率,推动大模型在应用场景中的落地。此次模型发布被视为其在模型与算力协同方向的进一步 实践。 ...
阶跃星辰发布开源基座模型 Step 3.5 Flash 多家头部芯片厂商完成适配
新浪财经· 2026-02-02 10:44
公司产品发布 - 阶跃星辰发布新一代开源Agent基座模型Step 3.5 Flash [1][3] - 该模型面向实时Agent工作流场景打造,兼顾推理速度、智能水平与使用成本 [1][3] - 在单请求代码类任务上,Step 3.5 Flash最高推理速度可达每秒350个token [1][3] 模型技术架构 - Step 3.5 Flash采用稀疏MoE架构,每个token仅激活约110亿个参数,模型总参数为1960亿 [1][3] - 该架构在保证模型能力的同时显著提升推理效率 [1][3] - 模型为Agent类应用提供更高效、可负担的底层模型选择 [1][3] 产业生态合作 - 包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商已率先完成对Step 3.5 Flash的适配 [1][3] - 通过底层联合创新提升模型适配性和算力效率 [1][3] - 阶跃星辰于2025年7月联合近10家芯片及基础设施厂商发起“模芯生态创新联盟” [2][4] 行业影响与趋势 - 模型与算力的协同发展,有效降低推理成本,降低企业和开发者在应用大模型时的综合门槛 [1][3] - 此举旨在打通芯片、模型与平台之间的技术壁垒,通过联合优化提升算力利用效率 [2][4] - 业内认为,随着推理模型成为主流,模型与算力的深度协同将成为推动大模型规模化应用的重要路径 [2][4]