原生多模态大模型

搜索文档
姜大昕走“窄门”
36氪· 2025-06-12 18:11
公司动态 - 阶跃星辰Tech Fellow段楠离职并加入京东探索研究院担任视觉与多模态实验室负责人 [1] - 公司于2023年4月成立 被称为"多模态卷王" Step系列基座模型研发速度快 [5] - 2024年7月发布Step-2万亿参数语言大模型正式版 Step-1.5V多模态模型 Step-1X图像生成大模型 [5] - 2025年1月一周内发布6款模型 包括推理模型 [5] - 2025年4月30日发布Step-1o-Vision-32k (highres)视觉大模型 [11] 产品调整 - 2024年12月停止大范围投入角色扮演类Agent产品"冒泡鸭" 团队合并至对话产品"跃问"(现更名为"阶跃AI") [1] - 产品策略从早期探索转向聚焦Agent方向 计划在汽车 手机 具身智能 IoT等场景布局 [17] - 与OPPO合作提供"一键全能搜" "一键问屏"服务 与吉利汽车探索"AI+车"场景 与智元机器人合作探索AI+具身机器人 [17][18] 技术路线 - 选择开发端到端的原生多模态大模型 不同于OpenAI式的逐步添加模态的路径 [15] - 认为多模态是实现AGI的必经之路 坚持原生多模理念 [5][21] - 批评Sora技术路线 认为大模型发展主线应是理解生成一体化 [15] - 视觉大模型Step-1o-Vision-32k在chatBot Arena细分榜单排名21位 [11] 市场表现 - 阶跃AI未进入月活TOP15的AI原生APP榜 推测月活不足300万 [6] - 在chatBot Arena总榜未上榜 在六小龙中落后于DeepSeek 零一万物 智谱 [9][10] - 市场投入谨慎 相比Kimi MiniMax等公司投流力度较小 [8] - 开发者认知度较低 被视为大模型调用备选项 [14] 融资与竞争 - 融资规模在AI六小龙中不是最多 单轮融资额也不是最高 [13] - 面临来自科技巨头(腾讯 阿里 字节)和其他创企(Kimi MiniMax 智谱)的激烈竞争 [25] - 2025年国内大模型融资几乎停滞 需要向投资人证明技术路线可行性 [26][28] 团队与挑战 - 创始人姜大昕曾任微软全球副总裁 主导过Bing Azure Microsoft 365等产品的自然语言理解系统 [13] - 视频模型团队部分核心成员跟随段楠加入京东 [1] - 技术路线激进但难度大 需要突破原生多模态模型的技术瓶颈 [15][17] - 缺乏独特市场标签 相比竞品存在感较弱 [4][22]
承认百度仍在AI第一梯队没那么难
雷峰网· 2025-03-17 12:05
而 Deepseek 一出,风云变幻、谁与争锋——原本,文心 4.0 在国内也算数得上号的大模型,在 Deepseek 面前,也不得不甘拜下风。 于是,巨大的压力给到了百度: " 不下牌桌,就还有机会。 " 作者丨董子博 编辑丨林觉民 2025 年,百度的"天"变了。 "前 Deepseek 时代",圈里不少人还悲观地认为,中国没有模型能跟上 GPT 的脚步,对百度来说,模型 不掉队,应用生态做起来,就能够留在牌桌上; 发新模型,必然面临质疑,要被拿去在显微镜下和 Deepseek 作比较,在冷眼下遭遇批判; 不发新模型,百度的技术实力更没了展现的机会,无端的猜测又会甚嚣尘上,客户的信心也会被损伤。 进退维谷,百度的选择,是亮出宝剑,非要试一试自己的成色——即使面临批评和贬损,百度也决心放下 面子,把自己最新的模型成果展示出来。 放下面子,拼了老命,也死活不下牌桌,百度是怎么想的? 01 文心 4.5 和 X1,百度"死磕" 谈战略之前,先聊点实着的——百度新发的文心 4.5 和 X1 好用吗? 作为百度新一代的原生多模态大模型,文心 4.5 首先是在多模态的能力上进一步升级。 今天的文心 4.5, 不仅可以 ...