Workflow
大模型发展情况及展望:海内外大模型梳理
2025-07-30 10:32

行业与公司关键要点总结 人工智能行业整体发展 - 人工智能投资经历三轮浪潮 当前浪潮持续时间更长 上涨力度更强 资本开支投入力度和商业化回报潜力更高[1][4] - 人工智能发展三阶段:符号主义 专家系统 深度学习 当前处于深度学习阶段 核心技术为深度神经网络[5] - 模型智能水平提升三规律:算力增长 效率提升(训练成本逐年下降) 范式转变(如强化学习引入)[23] - 推理算力需求爆发式增长 占当前算力使用80%-90% 谷歌Gemini流量TOKEN达480T(2025年4月) 两个月后翻倍至900T[25][32] 大模型技术进展 - 深度学习应用:Transformer架构通过思维树增强逻辑能力 提升问答速度和问题解决表现[1][6] - 强化学习突破:进入post-training scaling law阶段 少量反馈数据即可提升逻辑推理能力 减少对外部语料依赖[8][9] - 训练范式演变:未来重点为延长强化学习时间 增加算力投入 引入MID training阶段(专家标注高质量数据)[13][17] - 成本趋势:训练成本逐年下降 GPT-4训练成本前年较高 2024年下降 2025年进一步降低[22] 海外大模型动态 - OpenAI:GPT-4.5发布延迟 GPT-5预计在逻辑思维 动态处理 图形界面操作跨代提升 O3模型文本/视觉推理突出[10][11] - GROX系列:GROX4强化学习算力与预训练相当 表现惊人 提供未来训练范式参考(算力与时间大幅增加)[13] - 谷歌Gemini:均衡性强 性价比 推理速度 绝对能力突出 API调用市场份额45%[14][30] - GOROCK4:使用20万块H100训练 性能强劲 测试成绩刷新 与头部模型差异小[12] - Isotropic Cloud 4:编程优化模型 推理速度快 价格低 第三方调用量巨大 估值攀升[15] 国内大模型进展 - 技术差距:中美模型差距约3-6个月 无显著技术壁垒 国内模型可能在下一次迭代后冲击SOTA[18][33] - 代表模型: - 豆包1.6:支持深度推理 多模态理解(图片 视频)及界面操作[19] - Kimi K2:DPC V3架构 总参数量1万亿 非推理领域领先[19] - 千问三:具备长短COT能力 混合推理 quarter版本编程性价比超Claude 4[19] - 编程领域:国内模型能力接近海外顶尖(如Claude 4) 性价比更高 此前被低估[20] - 算力需求:国内模型需更多算力支持 短期悲观但基座表现优异 三季度或有大版本发布[21] 商业化与市场表现 - 谷歌AI Overview:覆盖全球后 每月激活频次1470亿次(占搜索35%-50%) 月度吞吐量290T TOKEN[26] - API市场格局:谷歌45% Sora(编程能力强)第二 Deepseek第三 OpenAI份额低[30] - AGI进展:技术无显著障碍 强化学习与合成数据解决数据短缺 应用闭环(搜索 编程 多模态生成)[31] - 投资机会:关注计算资源与应用标的 强化学习迭代推动性能跃升 类比AlphaGo股价效应[33] 潜在风险与挑战 - 深度推理模型:简单问题反应过慢 混合推理为发展方向(如Claude 3.7动态激活深度推理)[16] - 算力波动:短期事件冲击(如DeepSick影响英伟达股价)但非长期趋势[24] - 商业化渗透率:AI搜索主导 虚拟试衣等新应用渗透率低 增长空间大[27][28] (注:部分文档内容重复或交叉引用 已合并关键数据与观点)