Step3.5Flash - 财报，业绩电话会，研报，新闻

Step3.5Flash

搜索文档

印奇挂帅阶跃星辰一周抛“端侧王牌”：Step 3.5 Flash演示“网购比价”

每日经济新闻· 2026-02-05 20:01

公司动态：阶跃星辰发布Step3.5Flash模型 - 阶跃星辰正式发布开源Agent基座模型Step3.5Flash，该模型具备350TPS推理速度、1960亿参数稀疏MoE架构及256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350TPS，在Agent场景和数学任务上表现可媲美主流闭源大模型 [1] - 模型在数学与推理能力、编码能力、智能Agent能力上的基准测试成绩均排在前列 [1] - Step3.5Flash能够高效处理256K上下文，胜任复杂、长逻辑链条任务 [1] 技术特点与性能 - Step3.5Flash模型采用MoE架构，能以更低功耗提供更深的思考，其350TPS的生成速度解决了终端侧的“打字机效应” [2] - 作为对比，主流大中型模型的文字回复速度平均为每秒20~80个token，轻量级模型平均为每秒80~150个token [2] - 350TPS的高速度意味着首字延迟更短，语音交互能实现瞬时响应，跨多个Agent间的“内部对话”速度极快 [2] - 在车载语音交互或手机实时翻译场景下，低于100ms的首字延迟才能提供丝滑的人机对话体验 [2] 应用场景与演示 - Step3.5Flash可以快速计算复杂数学题并输出正确答案，并能基于文字提示词进行智能体编程并输出可视化平台结果 [2] - 在演示中，模型作为“云端大脑”将“对比Mac Mini M4在各大电商平台价格”的复杂需求拆解成针对淘宝、京东和拼多多的子任务，汇总后识别出拼多多为最低价平台并提供购买指南 [3] - 这种云端规划降低了本地StepGUI的执行难度，使其在从各应用抓取实时数据时获得更高成功率 [3] - 模型展示的网购比价本质是对复杂长链条任务的拆解能力，其Agent智能能够理解“比价”背后的逻辑（搜价格、算优惠、比库存） [3] 战略定位与行业背景 - Step3.5Flash的发布标志着国产模型从“参数崇拜”转向“智能密度”竞争，即从“更大”转变为“更聪明” [2] - 阶跃星辰的新模型彰显其以部署成本效率解决Agent落地痛点的尝试，通过稀疏MoE与MTP-3等技术在降低激活参数的同时实现高速推理，并坚持全面开源 [6] - 公司押注终端场景，已与OPPO、吉利等合作探索手机、汽车等终端侧Agent应用 [6] - 随着50亿元融资落地和产业资本进入，阶跃星辰的重心正快速向手机、PC及智能座舱倾斜 [7] - 新模型发布是阶跃星辰不再单纯“卷”万亿参数闭源大模型的明确信号，转而追求“能跑在端侧的顶级智力” [7] 行业竞争格局 - 智能体能力已成为头部公司竞相角逐的核心，行业处于围绕Agent的“卡位战” [4] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking，宣称其在Agent能力基准测试中刷新SOTA纪录 [5] - 月之暗面开源万亿参数的多模态模型Kimi K2.5，同样宣布在开源Agent场景中取得SOTA表现 [5] - 阿里巴巴强调“模型+生态”闭环，其千问App全面接入淘宝、支付宝、高德等业务，整合超400项服务 [5] - 月之暗面的Kimi K2.5模型能够即时创建并协调上百个专项Agent并行工作，实现从“单一智能体”到“智能体集群”演进 [6] 商业化前景与挑战 - Step3.5Flash的应用场景对用户有吸引力，未来能与电商等App融合，从而用AI增加电商获客量，有可能实现商业化落地 [3] - 模型在技术上已能在128GB RAM的设备上流畅运行，但现实挑战在于如何让淘宝、京东、美团等平台对Agent开放深层数据权限 [4] - 专家倡议互联网巨头提供标准商业API接口、MCP接口，让Agent能真正站在个人用户角度提供更好的贴身服务 [4] - Step3.5Flash接入类似“豆包手机”这样的深度定制化终端在技术上并非难题，最大的挑战来自“生态主权” [3] - 如果阶跃星辰继续采用开源战略，或许能抢夺AI新硬件市场的“安卓地位” [7]

Artificial Intelligence

Agent

Artificial Intelligence

Step3.5Flash

千问App

Kimi K2.5

Artificial Intelligence

Agent

Artificial Intelligence

证券日报· 2026-02-04 00:41

行业动态：国产大模型密集发布与开源趋势 - 近期，百度、阶跃星辰、阿里、DeepSeek、Kimi等多家头部科技企业密集发布自研大模型，覆盖OCR识别、多模态理解、具身智能、推理能力等多个前沿领域，且绝大多数选择了开源路径 [1] - 业内普遍认为，中国AI开源生态正从“可用”迈向“好用”乃至“引领”的关键阶段，国内开源生态的逐步扩大与完善将加快人工智能领域的发展速度 [1] 头部企业具体进展 - **阶跃星辰**：于2月2日推出Step3.5Flash模型，采用稀疏混合专家架构，总参数量高达1960亿，但每Token仅激活约110亿参数，在确保强大推理能力的同时大幅提高运行效率，尤其适用于复杂Agent工作流场景 [2] - **智谱AI**：于2月3日正式开源GLM-OCR模型，这是一款仅0.9B参数的小型模型，支持vLLM、SGLang和Ollama等主流推理框架，显著降低了部署门槛 [2] - **百度**：于1月29日发布文档解析模型PaddleOCR-VL-1.5，该模型以仅0.9B参数的轻量架构，在文档解析评测榜单OmniDocBenchV1.5中取得全球综合性能第一的成绩，整体精度达到94.5% [2] - **优必选**：近日发布自研的“具身大脑”Thinker模型，以“小参数、高性能、全开源”为特色 [2] - **多模态领域**：DeepSeek发布新的OCR2模型，月之暗面发布KimiK2.5模型等 [2] 发布特点与驱动因素 - 模型集中在2026年1月份至2月初密集发布，覆盖文本、图像、语音、具身控制及多模态融合等多个维度，且多数模型强调在特定场景下的性能优化，如文档解析、工业机器人响应、Agent协同等 [3] - 经过三年的技术积累，国产大模型在架构设计、训练方法、工程优化等方面已形成较为成熟的技术体系，具备了规模化输出高质量模型的能力 [3] - 应用场景愈发明确，从工业机器人到智能办公，从金融风控到教育医疗，下游需求促使模型向专业化、轻量化、高效化发展 [3] - 当前正处于全球AI竞争的关键时期，国产大模型不仅是技术产品，更是国家战略科技力量的重要组成部分，通过密集发布高水准模型，中国企业正积极争夺技术话语权与生态主导权 [3] 开源成为主流战略 - 智谱的GLM-OCR、阶跃星辰的Step3.5Flash、KimiK2.5以及DeepSeek-OCR2等均选择发布即开源策略，标志着中国AI产业正从“闭源竞赛”转向“开源协同” [4] - 开源有助于快速验证模型能力、扩大影响力，在模型性能日益相近的当下，谁能率先获得开发者和企业的广泛应用，谁就更有可能成为事实标准 [4] - 通过开源，企业可借助社区力量进行压力测试、场景适配与漏洞修复，形成“发布—反馈—迭代”的高效闭环 [4] - 开源是构建国产AI生态的必经之路，过去中国AI产业高度依赖国外基础模型与框架，如今以Qwen、智谱、Kimi、DeepSeek等为代表的国产开源模型矩阵日益完善，覆盖语言、视觉、语音、具身智能等多个模态，初步形成了从基座模型到工具链、从训练到推理的全栈能力 [4] - “自主可控+开放协作”的模式，既保障了技术主权，又避免了重复建设，有效降低了中小企业和科研机构的创新门槛 [4] 开源生态的反哺效应 - 开源生态的繁荣反过来反哺模型本身，由社区贡献的评测数据、优化方案、插件工具等，成为了模型持续进化的“养分” [5] - 以阿里千问为例，AI开源社区HuggingFace的最新数据显示，阿里千问的衍生模型数量已突破20万个，全球开发者基于千问开发的衍生模型每天新增超过200个，涵盖机器人控制、代码生成、漫画后期制作、多语种翻译等多个方向 [6] - 从密集发布到全面开源，国产大模型正走出一条兼具技术创新与生态共建的发展路径，这不仅是中国AI产业迈向成熟的重要标志，也为全球人工智能的多元化发展增添了新的动力 [6] - 在开源浪潮的推动下，一个更为开放、协同、高效的国产AI生态正在加速形成 [6]

人工智能

开源生态

Artificial Intelligence

Artificial Intelligence

OCR2模型

KimiK2.5模型

阿里千问

阶跃星辰发布新开源Agent基座模型，软件板块持续走强！顺网科技涨超14%，软件ETF汇添富(159590)涨超2%，盘中再“吸金”！

搜狐财经· 2026-02-03 15:11

市场表现 - 2026年2月3日，AI应用与软件板块走强，软件ETF汇添富（159590）大涨超2%，已连续第4日获得资金净流入[1] - 该ETF标的指数热门成分股多数上涨，其中顺网科技涨幅达13.59%，深信服与中科星图涨幅超3%，同花顺涨幅超2%，科大讯飞与三六零涨幅超1%[2][5] - 从成交额看，成分股中科大讯飞成交额达39.88亿元，顺网科技成交29.63亿元，同花顺成交27.26亿元，显示市场关注度较高[2] 行业动态 - 阶跃星辰于2月2日至3日公布AI模型研发进展，启动新一代模型Step4训练，并开源最新基座模型Step3.5Flash，双线推进Agent基础模型技术升级[3] - 开源模型Step3.5Flash采用稀疏混合专家架构，总参数量达1960亿，通过设计实现单Token仅激活约110亿参数，在单请求代码类任务上推理速度最高可达每秒350个token[3] - 多家芯片厂商已完成对Step3.5Flash的适配，实现了模型与国产算力芯片的生态协同，该公司目前已发布超30款模型，聚焦语言大模型、多模态及端云结合方向[3] 产业趋势与机构观点 - 海外推理和训练算力需求旺盛，亚马逊云和谷歌云双双宣布涨价，亚马逊云上调其面向大模型训练的EC2机器学习容量块价格，平均涨幅约为15%[4] - 谷歌云宣布自2026年5月1日起上调数据传输服务价格，其中北美地区单价从每GB 0.04美元翻倍至0.08美元，欧洲和亚洲地区价格也有不同幅度上调[4] - 本轮云服务调价直接源于以Agent为代表的AI应用大规模落地引发的算力需求爆发式增长，以及云厂商在数据中心、网络设施等基建端的高投入带来的成本压力[4] - 上游GPU、存储、CPU等核心部件已陆续启动涨价，成本传导机制正加速向下游延伸，预示AI“云-边-端”协同趋势进一步强化[4] - 2026年有望成为Agent元年，商业化或将全面加速，随着RL训练范式变革、记忆能力增强以及关键协议不断完善，Agent将从单点辅助向全流程大规模渗透，商业化潜力全面爆发[6] - 软件ETF汇添富（159590）标的指数的“AI应用”含量为35.22%，“智能体”含量为39.3%，该ETF跟踪中证全指软件指数，覆盖基础软件、应用软件、软件服务全产业链[6]

Artificial Intelligence

Artificial Intelligence

阶跃星辰发布开源基座模型 Step 3.5 Flash

证券日报网· 2026-02-02 16:11

公司动态 - 阶跃星辰发布新一代开源Agent基座模型Step3.5Flash，该模型面向实时Agent工作流场景，兼顾推理速度、智能水平与使用成本 [1] - Step3.5Flash在单请求代码类任务上，最高推理速度可达每秒350个token [1] - Step3.5Flash采用稀疏MoE架构，每个token仅激活约110亿个参数，模型总参数为1960亿 [1] - 多家芯片厂商，包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥，已率先完成对Step3.5Flash的适配 [1] - 阶跃星辰于2025年7月联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”，旨在打通芯片、模型与平台之间的技术壁垒 [2] 行业趋势 - 模型与算力的协同发展，有效降低推理成本，降低企业和开发者在应用大模型时的综合门槛，加快大模型在实际应用场景中的落地 [1] - 业内认为，随着推理模型成为主流，模型与算力的深度协同将成为推动大模型规模化应用的重要路径 [2]

大模型

模型与算力协同

Artificial Intelligence

Step3.5Flash

大模型

模型与算力协同

Artificial Intelligence

Step3.5Flash

阶跃星辰开源Step 3.5 Flash，华为昇腾等芯片完成适配

凤凰网· 2026-02-02 14:44

公司动态 - 阶跃星辰发布新一代开源Agent基座模型Step3.5Flash 该模型面向实时Agent工作流场景采用稀疏MoE架构总参数量为1960亿每个token激活约110亿参数旨在兼顾推理速度与使用成本 [1] - 在单请求代码类任务中 Step3.5Flash的推理速度最高可达每秒350个token [1] - 阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起"模芯生态创新联盟" 此次模型发布被视为其在模型与算力协同方向的进一步实践 [1] 行业生态 - 包括华为昇腾沐曦股份壁仞科技燧原科技天数智芯阿里平头哥在内的多家芯片厂商已完成对Step3.5Flash模型的适配 [1] - "模芯生态创新联盟"旨在通过联合优化提升算力效率推动大模型在应用场景中的落地 [1]

大模型

Artificial Intelligence

Step3.5Flash

大模型

Artificial Intelligence

Step3.5Flash

阶跃星辰发布开源基座模型Step 3.5 Flash，多家头部芯片厂商完成适配

凤凰网· 2026-02-02 14:32

公司动态 - 阶跃星辰发布新一代开源Agent基座模型Step3.5Flash，该模型面向实时Agent工作流场景，采用稀疏MoE架构 [1] - Step3.5Flash模型总参数量为1960亿，每个token激活约110亿参数，旨在兼顾推理速度与使用成本 [1] - 在单请求代码类任务中，Step3.5Flash的推理速度最高可达每秒350个token [1] - 包括华为昇腾、沐曦股份、壁仞科技、燧原科技等在内的多家芯片厂商已完成对该模型的适配 [1] 行业合作与生态 - 阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起“模芯生态创新联盟”，旨在通过联合优化提升算力效率，推动大模型在应用场景中的落地 [1] - 此次模型发布被视为公司在模型与算力协同方向的进一步实践 [1]

Model-Computing Power Collaboration

Open Source Model

Sparse MoE Architecture

Agent Workflow

Semiconductor

Step3.5Flash

Model-Computing Power Collaboration

Open Source Model

Sparse MoE Architecture

Agent Workflow

Semiconductor

Step3.5Flash