Step 4
搜索文档
阶跃新模型快到“没推理”!印奇上任,果然气势一新
量子位· 2026-02-03 15:45
闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 春节档果然热闹! 印奇上任后,阶跃星辰也气势一新了。 正式发布新一代开源Agent基座模型 Step 3.5 Flash ,总参数196B,激活参数11B,支持256K上下文窗口。 生态层面,依旧走软硬结合的技术路线,优化模型本身的同时,兼容适配主流算力硬件。 目前,Step 3.5 Flash已经和昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥多家芯片厂商完成适配,覆盖了当前主流的国产 AI加速芯片平台。 官方数据称新模型的推理峰值达 350TPS ,在Agent场景和数学任务上媲美闭源模型,能胜任复杂、长链条任务。 被AI"秒回"了 先来看波成绩单。 接下来实测走起! 请在不使用外部工具的情况下,依次计算并列出以下算式的结果:首项为80、公差为4的等差数列前30项和;1²+2²+…+10²的平方和; 2!++4!+6!+8!+10!的和;√169+∛216+⁵√32的和。 好家伙,推理速度是"肉眼几乎不可见"的快,秒回的答案也准确。 看图计算也来试一试: 官方公布了Step 3.5 Flash在推理、编码、智能体三大核心场景的基准测试对比图( ...
阶跃星辰开源Agent 基模 Step 3.5 Flash 下一代模型已开启训练
新浪财经· 2026-02-02 19:58
公司战略与产品路线图 - 阶跃星辰已启动下一代模型Step 4的训练工作,并计划邀请开发者深度参与共建,共同定义下一代Agent基础模型[1][3] - 公司目前围绕“AI+终端”体系已发布超过30款模型,重点发展方向是语言基础大模型、多模态以及端云结合[1][3] 新产品发布与技术规格 - 阶跃星辰于2月2日发布并开源了最新基座模型Step 3.5 Flash[1][3] - Step 3.5 Flash采用稀疏混合专家架构,总参数量达到1960亿,但每个Token仅激活约110亿参数,旨在平衡推理能力与运行效率[1][3] - 该模型针对规模化应用场景的稳定性、响应速度和成本问题进行了专项优化,在单请求代码类任务上,最高推理速度可达每秒350个token[1][3] 模型性能与竞争力 - Step 3.5 Flash在多项基准测试中表现亮眼,包括针对智能体能力的τ²-Bench、BrowseComp测试,以及LiveCodeBench V6代码挑战和AIME 2025数学竞赛[2][4] - 模型在Agent场景和数学任务上展现出强大竞争力[2][4] 实际应用能力展示 - Step 3.5 Flash展示了强大的自动编程与“端云协同”能力[2][4] - 该模型能基于自然语言指令自动构建复杂的可视化地理空间系统[2][4] - 模型可作为“云端大脑”,将复杂用户需求拆解为多个子任务,协同本地设备高效完成跨平台数据分析与决策支持[2][4] 行业趋势 - 越来越多的开发者正从单纯的提示词工程转向构建Agent和Workflow[1][3]