模芯生态创新联盟
搜索文档
阶跃星辰发布开源基座模型 Step 3.5 Flash,多家头部芯片厂商已完成适配
扬子晚报网· 2026-02-02 13:37
公司产品发布 - 阶跃星辰发布新一代开源Agent基座模型 Step 3.5 Flash,面向实时Agent工作流场景,旨在成为高效的“Agent搭子” [1] - Step 3.5 Flash在单请求代码类任务上,最高推理速度可达每秒350个token,兼顾推理速度、智能水平与使用成本 [1] - 模型采用稀疏MoE架构,每个token仅激活约110亿个参数,模型总参数为1960亿,在保证能力的同时显著提升推理效率 [1] - 该模型旨在为Agent类应用提供更高效、可负担的底层模型选择 [1] 产业合作与生态 - 包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥在内的多家芯片厂商,已率先完成对Step 3.5 Flash的适配 [1] - 通过底层联合创新提升模型适配性和算力效率,模型与算力的协同发展有效降低推理成本 [1] - 阶跃星辰于2025年7月联合近10家芯片及基础设施厂商发起「模芯生态创新联盟」,旨在打通芯片、模型与平台之间的技术壁垒 [2] - 联盟通过联合优化提升算力利用效率,加速大模型在各行业场景中的应用落地 [2] 行业趋势与影响 - 模型与算力的深度协同,通过降低企业和开发者在应用大模型时的综合门槛,加快大模型在实际应用场景中的落地 [1] - 随着推理模型成为主流,模型与算力的深度协同被视为推动大模型规模化应用的重要路径 [2]
超节点火爆 国产AI算力跑出追赶新路线
中国经营报· 2025-08-04 15:26
超节点技术趋势 - 华为首次展出昇腾384超节点真机Atlas 900 A3 SuperPoD 集成384颗昇腾NPU和192颗鲲鹏CPU 算力规模达300 PFLOPs 接近英伟达GB200 NVL72系统的2倍[1] - 超节点通过高速网络MatrixLink全对等互联 实现大规模并行计算 有效支撑万亿参数大模型与多模态训练需求[3][5] - 超节点采用Scale Up和Scale Out两种路径构建 通过高密度机柜部署或光互连跨机柜扩展 单机柜最高可部署128颗GPU[5][6][7] 国产厂商超节点方案 - 沐曦科技推出Shanghai Cube国产高密度液冷整机柜 采用47U单机柜4组超节点 单机柜128颗GPU 8机柜组成千卡集群[7] - 新华三发布超节点产品H3C UniPod S80000 实现单机柜64卡高密部署 具备向1024卡互联演进能力[7] - 超聚变展出全球首个多元智算即插即用超级集群系统 单柜128个AI加速卡 支持112G/224G高速互连 节能20%以上[8] - 中兴通讯联合多家企业发布国内首个光互连光交换GPU超节点光跃LightSphere X 单机柜搭载64颗GPU[7] 国产AI芯片合作生态 - 阶跃星辰发起"模芯生态创新联盟" 首批成员包括华为昇腾、沐曦、壁仞科技等 推动国产芯片与模型协同优化[11] - 四大国产AI芯片厂商(沐曦、天数智芯、燧原科技、壁仞科技)首度同台合作 共同提供高效大模型解决方案[2][11] - 沐曦推出曦云C600通用GPU 燧原科技发布通推一体L600AI芯片 国产芯片进入百花齐放阶段[9][2] 算力集群技术演进 - 超节点作为Scale Up最优解 通过内部高速总线互连加速GPU间参数交换 缩短大模型训练周期[3][5] - 摩尔线程提出"AI工厂"理念 构建夸娥集群系统 最高支持10240个全功能GPU部署 覆盖全精度计算场景[9] - 国产算力需跨行业协作 涉及网络技术、全光互连、分布式并行计算等系统化解决方案[10][12]