Workflow
每周一问大模型 | 基模“五强”谁最水,谁最强?
搜狐财经·2025-05-19 15:26

中国基础大模型五强竞争格局 - 字节跳动、阿里巴巴、阶跃星辰、智谱AI和DeepSeek被列为国产基础大模型领域的核心力量,形成"基模五强"竞争格局 [1] 阿里巴巴 - 综合实力最强,通义千问模型在MMLU、CMMLU等权威评测中排名靠前,Qwen-72B能与GPT-4正面抗衡 [47][53] - 开源生态领先,Qwen系列在Hugging Face上持续维护,下载量超3亿次,社区活跃度高 [47][64] - 商业化能力突出,通过阿里云"百炼平台"服务超29万家企业,API调用量高 [61] - 资金投入巨大,近三年AI战略投入达3800亿元人民币,未来三年计划继续投入3800亿元 [39][61] - 技术布局全面,覆盖文本、图像、视频、语音等多模态领域 [64] 字节跳动 - 生态整合能力强,依托抖音、今日头条等平台,将AI嵌入内容推荐、协同办公等场景 [61] - C端落地领先,豆包APP日活跃用户数高,月活超1亿,产品交互体验优于竞品 [50][61] - 资金投入充足,2025年拨出超1500亿元战略支出,张一鸣亲自推动AI战略 [39][61] - 多模态能力覆盖电商、医疗、教育等场景,视频生成工具"即梦"在电商直播、虚拟偶像场景落地 [9][61] - 技术团队强大,整合光年之外、零一万物等团队,吸纳吴永辉等技术大牛 [39][61] DeepSeek - 技术突破显著,DeepSeek-R1在代码能力上超过Gemini 2.5,推理性能接近甚至超越其他模型 [39] - 极致性价比,训练成本仅为行业头部1/10,API定价低至OpenAI的1/30 [24][61] - 工程创新突出,通过降秩KV矩阵、混合专家架构优化计算效率 [24] - 开源策略获得开发者青睐,DeepSeek-Coder等模型性能极强,在GitHub社区影响力迅速上升 [39][47] - 在LMSYS Org榜单中数学、代码生成任务排名第一 [24] 阶跃星辰 - 多模态技术领先,发布22款基座模型,其中16款为多模态模型,覆盖文本、图像、视频、语音、音乐等 [11][24][39] - 视频生成技术突出,Step-Video-T2V为全球参数量最大、性能最优的开源视频生成模型 [61] - 商业化增长迅速,2024年多模态API调用量增长45倍,聚焦智能体与终端结合 [13] - 获得头部客户,在智能终端领域与OPPO、吉利、智元机器人等合作 [13][24] - 融资顺利,B轮融资数亿美元,有上海国有资本等强力支持 [39] 智谱AI - 政企市场优势明显,中标32个政府及企业项目,金额达1.29亿元,覆盖金融、医疗、政务等20余行业 [14][24] - 学术背景深厚,背靠清华大学,GLM系列模型在中文问答、代码生成等领域表现优异 [14][21] - 商业化收入增长显著,年增长超100%,是首个启动IPO的大模型公司 [14] - 技术布局全面,构建基座模型、推理模型、多模态模型全栈产品体系 [24] - 开源策略启动较晚,计划2025年启动,生态建设落后于阿里巴巴 [12] 未来竞争焦点 - 智能上限竞争,聚焦模型推理能力、长链思维链突破,如DeepSeek的RL机制、阶跃的多模态融合 [15][23] - 多模态与智能体落地,多模态能力是AGI基础,智能体落地将决定技术溢出价值 [23] - 商业化路径验证,需要持续验证开源生态、垂类场景、性价比策略的市场接受度 [23] - 成本控制关键,DeepSeek的工程优化、阿里的算力基建将是规模化决胜关键 [15] - 技术架构突破,阶跃星辰需要解决多模态理解与生成一体化架构难题 [11][13] 行业竞争排名 - 综合实力排名:阿里巴巴最强,字节跳动次之,DeepSeek和阶跃星辰最具潜力,智谱AI相对短板 [15][44][64] - 技术专长排名:DeepSeek在数理推理领域领先,阶跃星辰在多模态技术突出,阿里巴巴在开源生态领先 [20][33][44] - 商业化能力排名:阿里巴巴和字节跳动商业化成熟度最高,智谱AI在政企市场有优势,DeepSeek商业化路径待验证 [15][22][61]