印奇挂帅一周抛“端侧王牌” 阶跃星辰Step 3.5 Flash演示电商“跨平台比价” 能否撬动AI终端革命？

阶跃星辰发布Step 3.5 Flash模型 - 公司正式发布面向Agent场景的开源基座模型Step 3.5 Flash [1] - 模型采用1960亿参数的稀疏MoE架构，具备256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350 TPS [1][5] - 此次发布距离公司完成50亿元B+轮融资及宣布由印奇出任董事长仅一周 [1] 模型技术特点与性能 - Step 3.5 Flash在数学与推理、编码、智能Agent等基准测试中表现均排在前列 [1][4] - 350 TPS的生成速度显著高于主流大中型模型（20-80 TPS）和轻量级模型（80-150 TPS），能有效解决“打字机效应”并实现低于100ms的首字延迟 [5] - 模型通过稀疏MoE与MTP-3等技术，在降低激活参数的同时实现高速推理 [11] - 模型标志着国产模型竞争从“参数崇拜”转向“智能密度”，即从“更大”转变为“更聪明” [4] 模型应用场景与演示 - 模型可快速计算复杂数学题并输出正确答案，并可基于文字提示词进行智能体编程并输出可视化结果 [5] - 在官方演示中，模型作为“云端大脑”成功拆解了跨电商平台比价任务，识别出拼多多为最低价平台并提供购买指南 [6] - 该演示展现了模型对复杂长链条任务的拆解能力，能够理解“比价”背后的逻辑（搜价格、算优惠、比库存） [6] - 经济学家盘和林认为，此类应用场景对用户有吸引力，未来能与电商等App融合以增加获客量，有可能实现商业化落地 [6] 公司战略与行业定位 - 公司重心正快速向手机、PC及智能座舱等终端场景倾斜，印奇挂帅彰显出“模硬一体”的战略突破方向 [11] - 公司已与OPPO、吉利等合作探索终端侧Agent应用，例如OPPO已基于Step系列模型推出“一键问屏”等功能 [11] - 新模型的发布是公司不再单纯“卷”万亿参数闭源大模型的明确信号，转而专注于“能跑在端侧的顶级智力” [12] - 分析认为，如果公司继续采用开源战略，或许能抢夺AI新硬件市场的“安卓地位” [12] 行业竞争格局与发展趋势 - 智能体能力已成为国内大模型头部公司竞相角逐的核心，行业正进行新一轮密集上新 [1][8] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking，宣称其在Agent能力基准测试中刷新了SOTA纪录，并强调“模型+生态”闭环，已将千问App全面接入淘宝、支付宝、高德等业务 [8][9] - 月之暗面开源了万亿参数的多模态模型Kimi K2.5，其核心突破在于能够即时创建并协调上百个专项Agent并行工作，实现从“单一智能体”到“智能体集群”的演进 [8][10] - 围绕AI如何“落地办事”的规模化应用“巷战”已然打响，各公司展现出不同的战略路径 [1][9] Agent生态面临的挑战 - 技术专家田丰指出，让模型接入深度定制化终端在技术上并非难题，最大挑战来自于“生态主权” [7] - 现实挑战在于如何让淘宝、京东、美团等大型平台对Agent开放深层数据权限，而不仅是简单的网页爬取，这涉及商业利益链的重新分配 [7] - 田丰倡议互联网巨头能够提供标准商业API接口、MCP接口，让Agent能真正站在个人用户角度提供更好的贴身服务 [7]