Step系列基座大模型矩阵

搜索文档
对话阶跃星辰CEO姜大昕:两年发布16款多模态模型,DeepSeek证明投流模式不成立|钛媒体AGI
钛媒体APP· 2025-05-08 16:33
公司动态 - 阶跃星辰将于7-8月发布满血版推理模型Step R1,并计划推出更先进的Step图片编辑模型 [2] - 公司成立于2023年4月,已发布22款自研基座模型,其中16款为多模态模型,占比超70% [5] - 2024年12月完成B轮融资,金额达数亿美元,投资方包括上海国资、腾讯投资、五源资本等 [5] - 2024年1月发布首款推理模型Step R-mini,2月开源文生视频/图生视频模型 [7] - 5月与ACE Studio联合开源3.5B版本音乐大模型ACE-Step,并与灿星文化战略合作 [7] 技术路线 - 公司坚持"多模理解生成一体化"技术路径,认为这是建立世界模型的最佳方式 [2] - 视觉领域"理解生成一体化"是计算机视觉需要突破的关键堡垒 [3] - 多模态能力是实现AGI的必经之路,对标人类多元化智能 [8] - 公司聚焦三大技术方向:预训练基础模型+强化学习、视觉理解生成一体化、智能体应用 [12] - 智能终端Agent是重点发力领域,包括汽车、手机、具身智能、IoT等场景 [11] 行业观点 - 认为AI时代产品流量增长逻辑不同于传统互联网,不认同投流模式 [2] - 2024年多模态和慢思考能力取得突破性进展,为AI Agent爆发奠定基础 [3] - 汽车辅助驾驶目前是简单预测模型,尚未实现真正推理能力 [11] - 看好AI眼镜发展,认为人形机器人泛化能力仍需长期发展 [11] - 国内AI产品更强调理解领先性,而公司注重基础模型+应用代际发展 [13] 商业模式 - 模型突破优先于商业化,应用与模型相辅相成 [2][11] - 通过端侧AI Agent服务实现C端盈利,最终服务于消费者 [11] - 已与吉利汽车、千里科技、OPPO、智元机器人、TCL等企业展开合作 [7] - 形成从模型到Agent、从云上到端侧的生态体系 [13]