大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新
量子位·2025-12-27 15:08

文章核心观点 - 在年底国产大模型公司密集发布新模型和推进IPO的背景下,阶跃星辰一度显得相对安静,但近期通过开源其最新的图像生成模型NextStep-1.1,重新展示了技术进展 [1][2][3] - 大模型行业的竞争格局正在发生变化,技术竞争焦点转向编程、智能体和多模态,开源成为主要策略,同时资本层面进入新阶段,领先公司寻求IPO以获得更大发展杠杆 [43][44][45] - 坚持自研通用大模型的创业公司已从“六小龙”缩减至智谱、MiniMax、Kimi和阶跃星辰四家,它们将直接与巨头竞争,未来的核心挑战在于持续的自研能力、充足的资金以及可行的商业模式 [46][47][48][50] 阶跃星辰的最新动态与NextStep-1.1模型 - 阶跃星辰近期开源了其最新的图像生成模型NextStep-1.1,旨在解决前代模型NextStep-1中存在的可视化失败问题 [3][6] - NextStep-1.1通过扩展训练和基于流的强化学习后训练范式,显著提升了图像质量,并大幅减少了视觉伪影 [7][23] - 该版本解决了自回归流匹配模型在强化学习过程中固有的数值不稳定性问题,从而提升了技术稳定性 [24][37] - NextStep-1.1已率先在GitHub和Hugging Face平台开源,但其技术报告尚未发布 [25] - 阶跃星辰近期并非“静悄悄”,自11月底以来,公司还密集开源了面向安卓端本地部署的GELab-Zero、在数学方面超越GPT-5的8B推理模型PaCoRe,并推出了深化智能终端布局的Step-GUI系列产品 [38][39][40] 大模型行业竞争格局 - 近期,多家国产大模型公司动作频频:Kimi通过K2推理模型重获关注并接入微软Azure和亚马逊Bedrock;智谱和MiniMax在发布新模型GLM-4.7和MiniMax M2.1的同时,已相继通过聆讯,冲刺IPO [2][41][42] - 行业竞争焦点已集中在编程、智能体和多模态技术领域,开源生态成为各公司的主要竞争策略 [44] - 资本层面进入新阶段,智谱和MiniMax的IPO进程意味着在第一轮“百模大战”后,胜出者开始寻求更大的资本杠杆以进行下一轮竞速 [45] - 坚持预训练、自研通用大模型路线的创业公司已从“六小龙”缩减至四家:智谱、MiniMax、Kimi和阶跃星辰 [46][47] - 这些剩余的创业公司将与科技巨头直接竞争,未来面临的核心问题是:是否依然有能力自研基础大模型、是否粮草充足、以及是否可以构建可持续的商业模式 [48][50] NextStep-1系列模型技术解析 - NextStep-1系列模型采用自回归流匹配架构,旨在取代传统的“自回归+重型扩散模型”混合架构,通过逐图像块自回归生成,仅依赖一个轻量级流匹配头,从而避免了对计算密集型扩散模型的依赖 [28] - NextStep-1是一个拥有140亿参数的自回归模型,其核心架构包括Transformer骨干网络、标准语言建模头、轻量级流匹配头以及一个图像分词器 [29] - 在训练阶段,流匹配头基于隐藏状态预测从噪声到目标图像块的连续流;在推理阶段,模型通过迭代引导噪声逐步生成完整图像 [32][33] - 该模型在文生图任务中展示了接近传统扩散模型的生成质量,并在图像编辑方面表现优异 [34] - 然而,NextStep-1在高维连续潜在空间运行时存在数值不稳定性,可能导致输出图像出现块状或网格状伪影,而NextStep-1.1正是针对此问题进行了优化 [35][37]

大模型第一股热闹正酣,“局外人”阶跃星辰发了一个小更新 - Reportify