Step3.5Flash
搜索文档
印奇挂帅阶跃星辰一周抛“端侧王牌”:Step 3.5 Flash演示“网购比价”
每日经济新闻· 2026-02-05 20:01
公司动态:阶跃星辰发布Step3.5Flash模型 - 阶跃星辰正式发布开源Agent基座模型Step3.5Flash,该模型具备350TPS推理速度、1960亿参数稀疏MoE架构及256K上下文处理能力 [1] - 模型在单请求代码类任务中推理速度最高可达350TPS,在Agent场景和数学任务上表现可媲美主流闭源大模型 [1] - 模型在数学与推理能力、编码能力、智能Agent能力上的基准测试成绩均排在前列 [1] - Step3.5Flash能够高效处理256K上下文,胜任复杂、长逻辑链条任务 [1] 技术特点与性能 - Step3.5Flash模型采用MoE架构,能以更低功耗提供更深的思考,其350TPS的生成速度解决了终端侧的“打字机效应” [2] - 作为对比,主流大中型模型的文字回复速度平均为每秒20~80个token,轻量级模型平均为每秒80~150个token [2] - 350TPS的高速度意味着首字延迟更短,语音交互能实现瞬时响应,跨多个Agent间的“内部对话”速度极快 [2] - 在车载语音交互或手机实时翻译场景下,低于100ms的首字延迟才能提供丝滑的人机对话体验 [2] 应用场景与演示 - Step3.5Flash可以快速计算复杂数学题并输出正确答案,并能基于文字提示词进行智能体编程并输出可视化平台结果 [2] - 在演示中,模型作为“云端大脑”将“对比Mac Mini M4在各大电商平台价格”的复杂需求拆解成针对淘宝、京东和拼多多的子任务,汇总后识别出拼多多为最低价平台并提供购买指南 [3] - 这种云端规划降低了本地StepGUI的执行难度,使其在从各应用抓取实时数据时获得更高成功率 [3] - 模型展示的网购比价本质是对复杂长链条任务的拆解能力,其Agent智能能够理解“比价”背后的逻辑(搜价格、算优惠、比库存) [3] 战略定位与行业背景 - Step3.5Flash的发布标志着国产模型从“参数崇拜”转向“智能密度”竞争,即从“更大”转变为“更聪明” [2] - 阶跃星辰的新模型彰显其以部署成本效率解决Agent落地痛点的尝试,通过稀疏MoE与MTP-3等技术在降低激活参数的同时实现高速推理,并坚持全面开源 [6] - 公司押注终端场景,已与OPPO、吉利等合作探索手机、汽车等终端侧Agent应用 [6] - 随着50亿元融资落地和产业资本进入,阶跃星辰的重心正快速向手机、PC及智能座舱倾斜 [7] - 新模型发布是阶跃星辰不再单纯“卷”万亿参数闭源大模型的明确信号,转而追求“能跑在端侧的顶级智力” [7] 行业竞争格局 - 智能体能力已成为头部公司竞相角逐的核心,行业处于围绕Agent的“卡位战” [4] - 阿里巴巴发布旗舰推理模型Qwen3-Max-Thinking,宣称其在Agent能力基准测试中刷新SOTA纪录 [5] - 月之暗面开源万亿参数的多模态模型Kimi K2.5,同样宣布在开源Agent场景中取得SOTA表现 [5] - 阿里巴巴强调“模型+生态”闭环,其千问App全面接入淘宝、支付宝、高德等业务,整合超400项服务 [5] - 月之暗面的Kimi K2.5模型能够即时创建并协调上百个专项Agent并行工作,实现从“单一智能体”到“智能体集群”演进 [6] 商业化前景与挑战 - Step3.5Flash的应用场景对用户有吸引力,未来能与电商等App融合,从而用AI增加电商获客量,有可能实现商业化落地 [3] - 模型在技术上已能在128GB RAM的设备上流畅运行,但现实挑战在于如何让淘宝、京东、美团等平台对Agent开放深层数据权限 [4] - 专家倡议互联网巨头提供标准商业API接口、MCP接口,让Agent能真正站在个人用户角度提供更好的贴身服务 [4] - Step3.5Flash接入类似“豆包手机”这样的深度定制化终端在技术上并非难题,最大的挑战来自“生态主权” [3] - 如果阶跃星辰继续采用开源战略,或许能抢夺AI新硬件市场的“安卓地位” [7]
国产大模型密集发布开源生态加速完善
证券日报· 2026-02-04 00:41
行业动态:国产大模型密集发布与开源趋势 - 近期,百度、阶跃星辰、阿里、DeepSeek、Kimi等多家头部科技企业密集发布自研大模型,覆盖OCR识别、多模态理解、具身智能、推理能力等多个前沿领域,且绝大多数选择了开源路径 [1] - 业内普遍认为,中国AI开源生态正从“可用”迈向“好用”乃至“引领”的关键阶段,国内开源生态的逐步扩大与完善将加快人工智能领域的发展速度 [1] 头部企业具体进展 - **阶跃星辰**:于2月2日推出Step3.5Flash模型,采用稀疏混合专家架构,总参数量高达1960亿,但每Token仅激活约110亿参数,在确保强大推理能力的同时大幅提高运行效率,尤其适用于复杂Agent工作流场景 [2] - **智谱AI**:于2月3日正式开源GLM-OCR模型,这是一款仅0.9B参数的小型模型,支持vLLM、SGLang和Ollama等主流推理框架,显著降低了部署门槛 [2] - **百度**:于1月29日发布文档解析模型PaddleOCR-VL-1.5,该模型以仅0.9B参数的轻量架构,在文档解析评测榜单OmniDocBenchV1.5中取得全球综合性能第一的成绩,整体精度达到94.5% [2] - **优必选**:近日发布自研的“具身大脑”Thinker模型,以“小参数、高性能、全开源”为特色 [2] - **多模态领域**:DeepSeek发布新的OCR2模型,月之暗面发布KimiK2.5模型等 [2] 发布特点与驱动因素 - 模型集中在2026年1月份至2月初密集发布,覆盖文本、图像、语音、具身控制及多模态融合等多个维度,且多数模型强调在特定场景下的性能优化,如文档解析、工业机器人响应、Agent协同等 [3] - 经过三年的技术积累,国产大模型在架构设计、训练方法、工程优化等方面已形成较为成熟的技术体系,具备了规模化输出高质量模型的能力 [3] - 应用场景愈发明确,从工业机器人到智能办公,从金融风控到教育医疗,下游需求促使模型向专业化、轻量化、高效化发展 [3] - 当前正处于全球AI竞争的关键时期,国产大模型不仅是技术产品,更是国家战略科技力量的重要组成部分,通过密集发布高水准模型,中国企业正积极争夺技术话语权与生态主导权 [3] 开源成为主流战略 - 智谱的GLM-OCR、阶跃星辰的Step3.5Flash、KimiK2.5以及DeepSeek-OCR2等均选择发布即开源策略,标志着中国AI产业正从“闭源竞赛”转向“开源协同” [4] - 开源有助于快速验证模型能力、扩大影响力,在模型性能日益相近的当下,谁能率先获得开发者和企业的广泛应用,谁就更有可能成为事实标准 [4] - 通过开源,企业可借助社区力量进行压力测试、场景适配与漏洞修复,形成“发布—反馈—迭代”的高效闭环 [4] - 开源是构建国产AI生态的必经之路,过去中国AI产业高度依赖国外基础模型与框架,如今以Qwen、智谱、Kimi、DeepSeek等为代表的国产开源模型矩阵日益完善,覆盖语言、视觉、语音、具身智能等多个模态,初步形成了从基座模型到工具链、从训练到推理的全栈能力 [4] - “自主可控+开放协作”的模式,既保障了技术主权,又避免了重复建设,有效降低了中小企业和科研机构的创新门槛 [4] 开源生态的反哺效应 - 开源生态的繁荣反过来反哺模型本身,由社区贡献的评测数据、优化方案、插件工具等,成为了模型持续进化的“养分” [5] - 以阿里千问为例,AI开源社区HuggingFace的最新数据显示,阿里千问的衍生模型数量已突破20万个,全球开发者基于千问开发的衍生模型每天新增超过200个,涵盖机器人控制、代码生成、漫画后期制作、多语种翻译等多个方向 [6] - 从密集发布到全面开源,国产大模型正走出一条兼具技术创新与生态共建的发展路径,这不仅是中国AI产业迈向成熟的重要标志,也为全球人工智能的多元化发展增添了新的动力 [6] - 在开源浪潮的推动下,一个更为开放、协同、高效的国产AI生态正在加速形成 [6]
阶跃星辰发布新开源Agent基座模型,软件板块持续走强!顺网科技涨超14%,软件ETF汇添富(159590)涨超2%,盘中再“吸金”!
搜狐财经· 2026-02-03 15:11
市场表现 - 2026年2月3日,AI应用与软件板块走强,软件ETF汇添富(159590)大涨超2%,已连续第4日获得资金净流入[1] - 该ETF标的指数热门成分股多数上涨,其中顺网科技涨幅达13.59%,深信服与中科星图涨幅超3%,同花顺涨幅超2%,科大讯飞与三六零涨幅超1%[2][5] - 从成交额看,成分股中科大讯飞成交额达39.88亿元,顺网科技成交29.63亿元,同花顺成交27.26亿元,显示市场关注度较高[2] 行业动态 - 阶跃星辰于2月2日至3日公布AI模型研发进展,启动新一代模型Step4训练,并开源最新基座模型Step3.5Flash,双线推进Agent基础模型技术升级[3] - 开源模型Step3.5Flash采用稀疏混合专家架构,总参数量达1960亿,通过设计实现单Token仅激活约110亿参数,在单请求代码类任务上推理速度最高可达每秒350个token[3] - 多家芯片厂商已完成对Step3.5Flash的适配,实现了模型与国产算力芯片的生态协同,该公司目前已发布超30款模型,聚焦语言大模型、多模态及端云结合方向[3] 产业趋势与机构观点 - 海外推理和训练算力需求旺盛,亚马逊云和谷歌云双双宣布涨价,亚马逊云上调其面向大模型训练的EC2机器学习容量块价格,平均涨幅约为15%[4] - 谷歌云宣布自2026年5月1日起上调数据传输服务价格,其中北美地区单价从每GB 0.04美元翻倍至0.08美元,欧洲和亚洲地区价格也有不同幅度上调[4] - 本轮云服务调价直接源于以Agent为代表的AI应用大规模落地引发的算力需求爆发式增长,以及云厂商在数据中心、网络设施等基建端的高投入带来的成本压力[4] - 上游GPU、存储、CPU等核心部件已陆续启动涨价,成本传导机制正加速向下游延伸,预示AI“云-边-端”协同趋势进一步强化[4] - 2026年有望成为Agent元年,商业化或将全面加速,随着RL训练范式变革、记忆能力增强以及关键协议不断完善,Agent将从单点辅助向全流程大规模渗透,商业化潜力全面爆发[6] - 软件ETF汇添富(159590)标的指数的“AI应用”含量为35.22%,“智能体”含量为39.3%,该ETF跟踪中证全指软件指数,覆盖基础软件、应用软件、软件服务全产业链[6]
阶跃星辰发布开源基座模型 Step 3.5 Flash
证券日报网· 2026-02-02 16:11
公司动态 - 阶跃星辰发布新一代开源Agent基座模型Step3.5Flash,该模型面向实时Agent工作流场景,兼顾推理速度、智能水平与使用成本 [1] - Step3.5Flash在单请求代码类任务上,最高推理速度可达每秒350个token [1] - Step3.5Flash采用稀疏MoE架构,每个token仅激活约110亿个参数,模型总参数为1960亿 [1] - 多家芯片厂商,包括华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥,已率先完成对Step3.5Flash的适配 [1] - 阶跃星辰于2025年7月联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”,旨在打通芯片、模型与平台之间的技术壁垒 [2] 行业趋势 - 模型与算力的协同发展,有效降低推理成本,降低企业和开发者在应用大模型时的综合门槛,加快大模型在实际应用场景中的落地 [1] - 业内认为,随着推理模型成为主流,模型与算力的深度协同将成为推动大模型规模化应用的重要路径 [2]
阶跃星辰开源Step 3.5 Flash,华为昇腾等芯片完成适配
凤凰网· 2026-02-02 14:44
公司动态 - 阶跃星辰发布新一代开源Agent基座模型Step3.5Flash 该模型面向实时Agent工作流场景 采用稀疏MoE架构 总参数量为1960亿 每个token激活约110亿参数 旨在兼顾推理速度与使用成本 [1] - 在单请求代码类任务中 Step3.5Flash的推理速度最高可达每秒350个token [1] - 阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起"模芯生态创新联盟" 此次模型发布被视为其在模型与算力协同方向的进一步实践 [1] 行业生态 - 包括华为昇腾 沐曦股份 壁仞科技 燧原科技 天数智芯 阿里平头哥在内的多家芯片厂商已完成对Step3.5Flash模型的适配 [1] - "模芯生态创新联盟"旨在通过联合优化提升算力效率 推动大模型在应用场景中的落地 [1]
阶跃星辰发布开源基座模型Step 3.5 Flash,多家头部芯片厂商完成适配
凤凰网· 2026-02-02 14:32
公司动态 - 阶跃星辰发布新一代开源Agent基座模型Step3.5Flash,该模型面向实时Agent工作流场景,采用稀疏MoE架构 [1] - Step3.5Flash模型总参数量为1960亿,每个token激活约110亿参数,旨在兼顾推理速度与使用成本 [1] - 在单请求代码类任务中,Step3.5Flash的推理速度最高可达每秒350个token [1] - 包括华为昇腾、沐曦股份、壁仞科技、燧原科技等在内的多家芯片厂商已完成对该模型的适配 [1] 行业合作与生态 - 阶跃星辰曾于2025年7月联合多家芯片及基础设施厂商发起“模芯生态创新联盟”,旨在通过联合优化提升算力效率,推动大模型在应用场景中的落地 [1] - 此次模型发布被视为公司在模型与算力协同方向的进一步实践 [1]