智谱创始人唐杰隔空对话马斯克：赶超Claude Fable 5不用等到2027年

中美大模型技术差距与追赶时间表 - 技术圈KOL评估，智谱AI的GLM-5.2模型当前水平约相当于Claude Opus 4.7-4.8，中美模型之间存在约7个月的时间差[6] - 根据Mythos系列模型的时间线推测，中国若要推出能力对标Mythos完整版的模型，时间点可能在2026年11月至12月之间[6] - 马斯克认为中国模型达到对标水平的时间可能更晚，预计在2027年第一季度[8] - 智谱AI创始人唐杰回应称“不会那么久”，暗示以智谱为代表的国内大模型有望在2026年内实现跨越[8] 智谱AI模型性能与进展 - GLM-5.2在Harvey法律Agent专业基准测试中取得显著进步，任务通过率达到7.08% ± 2.00%，排名第三，仅次于Claude Fable 5 (11.25%)和Claude Opus 4.8 (9.58%)[10][11] - 相比前代GLM-5.1在该测试中得分为0.00%，GLM-5.2实现了从无到有的突破并进入前列[11] - 公司近期推出GLM-5.2模型，以51分登顶所有开源权重模型排行榜，大幅领先MiniMax-M3 (44分)、DeepSeek V4 Pro (44分)和Kimi K2.6 (43分)，并采用MIT协议全量开源[18] - 创始人唐杰已预告原生多模态模型将在数月内上线，公司全球化负责人也转发推文预告“大事即将发生”，意味着大版本升级临近[25] 行业竞争格局与公司定位 - 智谱AI被市场对标为“中国版Anthropic”，两者均具有极强的学院派/研究派创立基因，注重底层创新和长期价值[14][15] - 在商业化路径上，与Anthropic类似，智谱AI在B端业务表现亮眼，通过占领专业用户心智打造增长曲线[15] - 多模态能力成为头部模型拉开差距的关键维度，Kimi K2.5、阿里Qwen3.5-Omni、GPT-4o等竞争对手已先后实现原生多模态架构落地[25] - 唐杰指出，多模态感知是完成长任务的基础，是Agent真正落地的前提，而不仅是功能附加[25] 市场表现与未来挑战 - 智谱AI股价近期呈现爆发式上涨，近五个工作日累计上涨幅度高达99.81%，接近翻倍[23] - 实现追赶Fable 5级别模型的目标，挑战不仅在于预训练阶段将模型参数推向万亿级，更在于后训练阶段让模型能够部分跑通自我训练和自我迭代（递归式自我改进，RSI）[26] - Anthropic CEO达里奥在报告中预测，到2028年1月，中国最好的模型可能仅相当于美国2027年1月的水平，即存在至少一整年的差距[27][30] - 报告呼吁美国通过堵住芯片走私、海外数据中心接入和蒸馏攻击等漏洞，试图将领先优势锁定在12到24个月之间[29] - 当前行业观察认为，除非美国有神速推进，否则中美之间的技术代差很有可能进一步缩小[31] 关于模型评估的行业观点 - 对于GLM-5.2的进步，市场存在不同声音：兴奋派认为其迭代速度快，年底的GLM-6值得期待；冷静派则指出该模型目前尚缺乏跨对话记忆等实用能力[9][11] - 马斯克认同Benchmark（基准测试）分数并非唯一标准，指出真正的实用性衡量更为重要，即使第一季度能达到对标水平也已非常了不起[12] - 马斯克强调，Anthropic专注于最大化“有用的智能”，这虽不体现在Benchmark分数里，但一定会体现在收入上[13]