印奇挂帅阶跃星辰一周抛“端侧王牌”：Step 3.5 Flash演示“网购比价”

公司动态：阶跃星辰发布Step3.5Flash模型 - 阶跃星辰正式发布开源Agent基座模型Step3.5Flash，该模型具备350TPS推理速度、1960亿参数稀疏MoE架构及256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350TPS，在Agent场景和数学任务上表现可媲美主流闭源大模型 [1] - 模型在数学与推理能力、编码能力、智能Agent能力上的基准测试成绩均排在前列 [1] - Step3.5Flash能够高效处理256K上下文，胜任复杂、长逻辑链条任务 [1] 技术特点与性能 - Step3.5Flash模型采用MoE架构，能以更低功耗提供更深的思考，其350TPS的生成速度解决了终端侧的“打字机效应” [2] - 作为对比，主流大中型模型的文字回复速度平均为每秒20~~80个token，轻量级模型平均为每秒80~~150个token [2] - 350TPS的高速度意味着首字延迟更短，语音交互能实现瞬时响应，跨多个Agent间的“内部对话”速度极快 [2] - 在车载语音交互或手机实时翻译场景下，低于100ms的首字延迟才能提供丝滑的人机对话体验 [2] 应用场景与演示 - Step3.5Flash可以快速计算复杂数学题并输出正确答案，并能基于文字提示词进行智能体编程并输出可视化平台结果 [2] - 在演示中，模型作为“云端大脑”将“对比Mac Mini M4在各大电商平台价格”的复杂需求拆解成针对淘宝、京东和拼多多的子任务，汇总后识别出拼多多为最低价平台并提供购买指南 [3] - 这种云端规划降低了本地StepGUI的执行难度，使其在从各应用抓取实时数据时获得更高成功率 [3] - 模型展示的网购比价本质是对复杂长链条任务的拆解能力，其Agent智能能够理解“比价”背后的逻辑（搜价格、算优惠、比库存） [3] 战略定位与行业背景 - Step3.5Flash的发布标志着国产模型从“参数崇拜”转向“智能密度”竞争，即从“更大”转变为“更聪明” [2] - 阶跃星辰的新模型彰显其以部署成本效率解决Agent落地痛点的尝试，通过稀疏MoE与MTP-3等技术在降低激活参数的同时实现高速推理，并坚持全面开源 [6] - 公司押注终端场景，已与OPPO、吉利等合作探索手机、汽车等终端侧Agent应用 [6] - 随着50亿元融资落地和产业资本进入，阶跃星辰的重心正快速向手机、PC及智能座舱倾斜 [7] - 新模型发布是阶跃星辰不再单纯“卷”万亿参数闭源大模型的明确信号，转而追求“能跑在端侧的顶级智力” [7] 行业竞争格局 - 智能体能力已成为头部公司竞相角逐的核心，行业处于围绕Agent的“卡位战” [4] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking，宣称其在Agent能力基准测试中刷新SOTA纪录 [5] - 月之暗面开源万亿参数的多模态模型Kimi K2.5，同样宣布在开源Agent场景中取得SOTA表现 [5] - 阿里巴巴强调“模型+生态”闭环，其千问App全面接入淘宝、支付宝、高德等业务，整合超400项服务 [5] - 月之暗面的Kimi K2.5模型能够即时创建并协调上百个专项Agent并行工作，实现从“单一智能体”到“智能体集群”演进 [6] 商业化前景与挑战 - Step3.5Flash的应用场景对用户有吸引力，未来能与电商等App融合，从而用AI增加电商获客量，有可能实现商业化落地 [3] - 模型在技术上已能在128GB RAM的设备上流畅运行，但现实挑战在于如何让淘宝、京东、美团等平台对Agent开放深层数据权限 [4] - 专家倡议互联网巨头提供标准商业API接口、MCP接口，让Agent能真正站在个人用户角度提供更好的贴身服务 [4] - Step3.5Flash接入类似“豆包手机”这样的深度定制化终端在技术上并非难题，最大的挑战来自“生态主权” [3] - 如果阶跃星辰继续采用开源战略，或许能抢夺AI新硬件市场的“安卓地位” [7]