阶跃星辰发布Step 3.5 Flash模型 - 公司正式发布面向Agent场景的开源基座模型Step 3.5 Flash [1] - 模型采用1960亿参数的稀疏MoE架构,具备256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350 TPS [1][5] - 此次发布距离公司完成50亿元B+轮融资及宣布由印奇出任董事长仅一周 [1] 模型技术特点与性能 - Step 3.5 Flash在数学与推理、编码、智能Agent等基准测试中表现均排在前列 [1][4] - 350 TPS的生成速度显著高于主流大中型模型(20-80 TPS)和轻量级模型(80-150 TPS),能有效解决“打字机效应”并实现低于100ms的首字延迟 [5] - 模型通过稀疏MoE与MTP-3等技术,在降低激活参数的同时实现高速推理 [11] - 模型标志着国产模型竞争从“参数崇拜”转向“智能密度”,即从“更大”转变为“更聪明” [4] 模型应用场景与演示 - 模型可快速计算复杂数学题并输出正确答案,并可基于文字提示词进行智能体编程并输出可视化结果 [5] - 在官方演示中,模型作为“云端大脑”成功拆解了跨电商平台比价任务,识别出拼多多为最低价平台并提供购买指南 [6] - 该演示展现了模型对复杂长链条任务的拆解能力,能够理解“比价”背后的逻辑(搜价格、算优惠、比库存) [6] - 经济学家盘和林认为,此类应用场景对用户有吸引力,未来能与电商等App融合以增加获客量,有可能实现商业化落地 [6] 公司战略与行业定位 - 公司重心正快速向手机、PC及智能座舱等终端场景倾斜,印奇挂帅彰显出“模硬一体”的战略突破方向 [11] - 公司已与OPPO、吉利等合作探索终端侧Agent应用,例如OPPO已基于Step系列模型推出“一键问屏”等功能 [11] - 新模型的发布是公司不再单纯“卷”万亿参数闭源大模型的明确信号,转而专注于“能跑在端侧的顶级智力” [12] - 分析认为,如果公司继续采用开源战略,或许能抢夺AI新硬件市场的“安卓地位” [12] 行业竞争格局与发展趋势 - 智能体能力已成为国内大模型头部公司竞相角逐的核心,行业正进行新一轮密集上新 [1][8] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking,宣称其在Agent能力基准测试中刷新了SOTA纪录,并强调“模型+生态”闭环,已将千问App全面接入淘宝、支付宝、高德等业务 [8][9] - 月之暗面开源了万亿参数的多模态模型Kimi K2.5,其核心突破在于能够即时创建并协调上百个专项Agent并行工作,实现从“单一智能体”到“智能体集群”的演进 [8][10] - 围绕AI如何“落地办事”的规模化应用“巷战”已然打响,各公司展现出不同的战略路径 [1][9] Agent生态面临的挑战 - 技术专家田丰指出,让模型接入深度定制化终端在技术上并非难题,最大挑战来自于“生态主权” [7] - 现实挑战在于如何让淘宝、京东、美团等大型平台对Agent开放深层数据权限,而不仅是简单的网页爬取,这涉及商业利益链的重新分配 [7] - 田丰倡议互联网巨头能够提供标准商业API接口、MCP接口,让Agent能真正站在个人用户角度提供更好的贴身服务 [7]
印奇挂帅一周抛“端侧王牌” 阶跃星辰Step 3.5 Flash演示电商“跨平台比价” 能否撬动AI终端革命?
每日经济新闻·2026-02-05 00:05