Workflow
终端Agent
icon
搜索文档
“多模态卷王”收缩C端业务!大模型“六小虎”战略聚焦谋出路
证券时报网· 2025-06-04 19:14
阶跃星辰业务调整 - 阶跃星辰收缩C端业务,停运角色扮演类智能体产品"冒泡鸭",重心转向终端Agent(智能体)[1] - "冒泡鸭"从2023年12月起已停止大范围投流,团队合并至"阶跃AI"产品团队[1] - 公司C端业务调整是大模型创业企业在DeepSeek和互联网大厂竞争下重新定位的缩影[1] 阶跃星辰公司背景 - 阶跃星辰成立于2023年4月,创始人兼CEO是微软前全球副总裁姜大昕[2] - 公司2024年3月首次公开亮相,发布万亿参数大语言模型Step-2[2] - 专注于多模态领域,已发布22款自研基座模型,涵盖文字、图像、视频、语音、音乐和推理等领域[2] - 被业内称为"多模态卷王",与智谱AI并称基座大模型的"南北双雄"[2] 阶跃星辰业务转型 - 此前采用"模型+应用"两条腿走路策略,推出C端应用"跃问"和"冒泡鸭"[3] - 受DeepSeek影响,重新思考增长路径,认为投流逻辑在AI时代不完全成立[4] - 将资源重心从C端转向多模态大模型研发和终端Agent方向[4] - 2024年2月宣布与吉利汽车集团、OPPO、智元机器人等头部企业合作,推动AI在手机、汽车、具身智能等终端应用[5] 大模型行业竞争格局 - "六小虎"包括智谱AI、MiniMax、月之暗面、阶跃星辰、百川智能和零一万物[6] - 2024年下半年以来,除智谱AI和阶跃星辰外,其余几家无新融资消息[6] - 零一万物和百川智能已放弃基座大模型训练,分别押注AI行业落地和AI医疗[6] - MiniMax专注C端视频生成海外市场,智谱AI布局政企合作并启动IPO,月之暗面Kimi在C端竞争中逐渐落后[6] 行业发展趋势 - 大厂进入和DeepSeek冲击促使大模型创业公司重新定位[7] - 行业面临模型迭代快、C端用户忠诚度低、B端盈利难等挑战[7] - 融资环境趋紧,创业公司需在有限时间内争取更大生存空间[7]
图像编辑开源新SOTA,来自多模态卷王阶跃!大模型行业正步入「多模态时间」
量子位· 2025-04-28 11:43
全球AI大模型进入多模态时代 - 行业正围绕多模态技术展开密集创新,多模态能力成为AI应用落地的核心要素[1][2] - 阶跃星辰作为代表性玩家,过去1个月发布3款多模态模型(图生视频、多模态推理、图像编辑),其中2款已开源[5][7] - 公司已发布21款基座模型,多模态占比达70%,覆盖语言、语音、图像、视频、推理五大方向[61][70] 阶跃星辰多模态技术突破 Step1X-Edit图像编辑模型 - 采用19B参数创新架构(7B MLLM+12B DiT),首次实现理解与生成模块解耦[8][9] - 在GEdit-Bench基准测试中,语义一致性(7.183)、图像质量(7.229)、综合得分(7.161)全面领先开源模型,媲美GPT-4o[12][13] - 实测显示具备精准语义解析(大象转身)、身份一致性保持(马斯克秃头)、区域级控制(海水调色)三大核心能力[19][23][27] Step-R1-V-Mini多模态推理模型 - 采用PPO强化学习策略,通过多模态合成数据解决训练跷跷板问题[41][43] - 在MathVision视觉推理榜单以56.6分位列国内第一,超越Claude 3.5(37.99)和Gemini 2.0 Flash(41.3)[40] - 展示出复杂场景推理能力(精确定位北京长安街)、烹饪方法分析(川香藤椒鸡步骤分解)等应用潜力[45][51] Step-Video-TI2V图生视频模型 - 基于30B参数Step-Video-T2V优化,支持生成5秒540P视频,具备运动幅度/镜头运动双控制[56][57] - 通过引入图像条件提升一致性,动态性参数可调(2-20数值范围对应不同运动强度)[58] - 填补开源图生视频领域空白,与闭源Sora形成差异化竞争[55] 终端Agent商业化布局 - 2025年重点发力四大场景:智能汽车(吉利)、手机终端(OPPO)、具身智能(智元机器人)、IoT(TCL)[65][66][67] - 采用深度绑定策略,与各领域头部企业建立全价值链合作,例如为OPPO提供「一键问屏」多模态技术支持[66][69] - 形成「数据-场景-模型」三角闭环,2年内完成21款模型研发,成为国内基座模型种类最全的公司之一[63][73] 行业竞争格局 - 全球科技巨头(OpenAI GPT-4o、谷歌Gemini)与阶跃等企业正围绕多模态展开新一轮竞赛[75] - 多模态技术决定AI模型天花板,阶跃通过「技术奇袭+终端破局」双轮驱动实现后来居上[72][73] - 行业进入新旧范式交替期,非多模态AI模型面临淘汰风险[76]