每周一问大模型 | 基模“五强”谁最水，谁最强？

中国基础大模型五强竞争格局 - 字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek被列为国产基础大模型领域的核心力量，形成"基模五强"竞争格局 [1] 阿里巴巴 - 综合实力最强，通义千问模型在MMLU、CMMLU等权威评测中排名靠前，Qwen-72B能与GPT-4正面抗衡 [47][53] - 开源生态领先，Qwen系列在Hugging Face上持续维护，下载量超3亿次，社区活跃度高 [47][64] - 商业化能力突出，通过阿里云"百炼平台"服务超29万家企业，API调用量高 [61] - 资金投入巨大，近三年AI战略投入达3800亿元人民币，未来三年计划继续投入3800亿元 [39][61] - 技术布局全面，覆盖文本、图像、视频、语音等多模态领域 [64] 字节跳动 - 生态整合能力强，依托抖音、今日头条等平台，将AI嵌入内容推荐、协同办公等场景 [61] - C端落地领先，豆包APP日活跃用户数高，月活超1亿，产品交互体验优于竞品 [50][61] - 资金投入充足，2025年拨出超1500亿元战略支出，张一鸣亲自推动AI战略 [39][61] - 多模态能力覆盖电商、医疗、教育等场景，视频生成工具"即梦"在电商直播、虚拟偶像场景落地 [9][61] - 技术团队强大，整合光年之外、零一万物等团队，吸纳吴永辉等技术大牛 [39][61] DeepSeek - 技术突破显著，DeepSeek-R1在代码能力上超过Gemini 2.5，推理性能接近甚至超越其他模型 [39] - 极致性价比，训练成本仅为行业头部1/10，API定价低至OpenAI的1/30 [24][61] - 工程创新突出，通过降秩KV矩阵、混合专家架构优化计算效率 [24] - 开源策略获得开发者青睐，DeepSeek-Coder等模型性能极强，在GitHub社区影响力迅速上升 [39][47] - 在LMSYS Org榜单中数学、代码生成任务排名第一 [24] 阶跃星辰 - 多模态技术领先，发布22款基座模型，其中16款为多模态模型，覆盖文本、图像、视频、语音、音乐等 [11][24][39] - 视频生成技术突出，Step-Video-T2V为全球参数量最大、性能最优的开源视频生成模型 [61] - 商业化增长迅速，2024年多模态API调用量增长45倍，聚焦智能体与终端结合 [13] - 获得头部客户，在智能终端领域与OPPO、吉利、智元机器人等合作 [13][24] - 融资顺利，B轮融资数亿美元，有上海国有资本等强力支持 [39] 智谱AI - 政企市场优势明显，中标32个政府及企业项目，金额达1.29亿元，覆盖金融、医疗、政务等20余行业 [14][24] - 学术背景深厚，背靠清华大学，GLM系列模型在中文问答、代码生成等领域表现优异 [14][21] - 商业化收入增长显著，年增长超100%，是首个启动IPO的大模型公司 [14] - 技术布局全面，构建基座模型、推理模型、多模态模型全栈产品体系 [24] - 开源策略启动较晚，计划2025年启动，生态建设落后于阿里巴巴 [12] 未来竞争焦点 - 智能上限竞争，聚焦模型推理能力、长链思维链突破，如DeepSeek的RL机制、阶跃的多模态融合 [15][23] - 多模态与智能体落地，多模态能力是AGI基础，智能体落地将决定技术溢出价值 [23] - 商业化路径验证，需要持续验证开源生态、垂类场景、性价比策略的市场接受度 [23] - 成本控制关键，DeepSeek的工程优化、阿里的算力基建将是规模化决胜关键 [15] - 技术架构突破，阶跃星辰需要解决多模态理解与生成一体化架构难题 [11][13] 行业竞争排名 - 综合实力排名：阿里巴巴最强，字节跳动次之，DeepSeek和阶跃星辰最具潜力，智谱AI相对短板 [15][44][64] - 技术专长排名：DeepSeek在数理推理领域领先，阶跃星辰在多模态技术突出，阿里巴巴在开源生态领先 [20][33][44] - 商业化能力排名：阿里巴巴和字节跳动商业化成熟度最高，智谱AI在政企市场有优势，DeepSeek商业化路径待验证 [15][22][61]