阶跃星辰姜大昕：多模态目前还没有出现GPT-4时刻

公司概况 - 阶跃星辰由前微软全球副总裁姜大昕创立于2023年核心团队包括首席科学家张祥雨和系统负责人朱亦博形成技术研发与AI基础设施建设的铁三角架构 [5][7] - 公司员工规模达400余人其中80%为技术研发人员采用扁平化管理模式员工可通过私信直接与CEO沟通内部设有技术协同会和见闻分享群 [5][6] - 商业模式聚焦ToB服务和开发者API接口 2024年下半年多模态API调用量增长超45倍 2024年12月完成B轮数亿美元融资 [5][7] 技术战略 - 核心主张"理解生成一体化架构" 将原生成小组和理解小组整合为统一团队认为这是实现多模态突破的关键路径 [2][3][4] - 建立Step系列通用大模型矩阵覆盖语言模型和原生多模态模型是国内少数坚持预训练路线的公司之一 [14][15] - 2025年1月发布推理模型Step R1-V-Mini 性能超越OpenAI早期版本计划未来三个月推出满血版Step-R1 [17] 行业趋势判断 - 模型演进遵循三阶段路径：模拟世界（模仿训练）→探索世界（强化学习）→归纳世界（自主发现规律）与OpenAI的AGI五级划分逻辑一致 [9][12] - 当前竞争焦点转向"智能上限" OpenAI等五大厂商半年内发布超8款新品国内月之暗面等公司同步发力 [7][9] - 多模态领域尚未出现"GPT-4时刻" 核心卡点在于缺乏可扩展的理解生成一体化架构需突破predict next frame技术难题 [2][28] 产品应用 - 推出Step 1X-Edit图片编辑模型实现初级理解生成一体化对原图忠实度达90%以上正在开发更先进版本 [31] - 布局智能终端Agent生态与手机/汽车/机器人领域头部企业合作提供云端Agent构建平台和运行环境 [36] - 落地巡店等商业场景通过规则Prompt实现操作规范检测准确率超90% 显著提升连锁门店管理效率 [19] 发展路线 - 短期聚焦强化学习在预训练模型的应用提升长思维链推理能力解决奖励函数定义等工业界难题 [17] - 中期突破视觉领域理解生成一体化构建可扩展架构以处理高维连续空间最终实现世界模型 [24][28] - 长期通过"超级模型+超级应用"双轮驱动形成从云到端的Agent生态体系重点布局智能硬件场景 [33][36]