智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年
AI前线·2026-06-19 09:21

中美大模型技术差距与追赶时间表 - 技术圈KOL评估,智谱AI的GLM-5.2模型当前水平约相当于Claude Opus 4.7-4.8,中美模型之间存在约7个月的时间差[6] - 根据Mythos系列模型的时间线推测,中国若要推出能力对标Mythos完整版的模型,时间点可能在2026年11月至12月之间[6] - 马斯克认为中国模型达到对标水平的时间可能更晚,预计在2027年第一季度[8] - 智谱AI创始人唐杰回应称“不会那么久”,暗示以智谱为代表的国内大模型有望在2026年内实现跨越[8] 智谱AI模型性能与进展 - GLM-5.2在Harvey法律Agent专业基准测试中取得显著进步,任务通过率达到7.08% ± 2.00%,排名第三,仅次于Claude Fable 5 (11.25%)和Claude Opus 4.8 (9.58%)[10][11] - 相比前代GLM-5.1在该测试中得分为0.00%,GLM-5.2实现了从无到有的突破并进入前列[11] - 公司近期推出GLM-5.2模型,以51分登顶所有开源权重模型排行榜,大幅领先MiniMax-M3 (44分)、DeepSeek V4 Pro (44分)和Kimi K2.6 (43分),并采用MIT协议全量开源[18] - 创始人唐杰已预告原生多模态模型将在数月内上线,公司全球化负责人也转发推文预告“大事即将发生”,意味着大版本升级临近[25] 行业竞争格局与公司定位 - 智谱AI被市场对标为“中国版Anthropic”,两者均具有极强的学院派/研究派创立基因,注重底层创新和长期价值[14][15] - 在商业化路径上,与Anthropic类似,智谱AI在B端业务表现亮眼,通过占领专业用户心智打造增长曲线[15] - 多模态能力成为头部模型拉开差距的关键维度,Kimi K2.5、阿里Qwen3.5-Omni、GPT-4o等竞争对手已先后实现原生多模态架构落地[25] - 唐杰指出,多模态感知是完成长任务的基础,是Agent真正落地的前提,而不仅是功能附加[25] 市场表现与未来挑战 - 智谱AI股价近期呈现爆发式上涨,近五个工作日累计上涨幅度高达99.81%,接近翻倍[23] - 实现追赶Fable 5级别模型的目标,挑战不仅在于预训练阶段将模型参数推向万亿级,更在于后训练阶段让模型能够部分跑通自我训练和自我迭代(递归式自我改进,RSI)[26] - Anthropic CEO达里奥在报告中预测,到2028年1月,中国最好的模型可能仅相当于美国2027年1月的水平,即存在至少一整年的差距[27][30] - 报告呼吁美国通过堵住芯片走私、海外数据中心接入和蒸馏攻击等漏洞,试图将领先优势锁定在12到24个月之间[29] - 当前行业观察认为,除非美国有神速推进,否则中美之间的技术代差很有可能进一步缩小[31] 关于模型评估的行业观点 - 对于GLM-5.2的进步,市场存在不同声音:兴奋派认为其迭代速度快,年底的GLM-6值得期待;冷静派则指出该模型目前尚缺乏跨对话记忆等实用能力[9][11] - 马斯克认同Benchmark(基准测试)分数并非唯一标准,指出真正的实用性衡量更为重要,即使第一季度能达到对标水平也已非常了不起[12] - 马斯克强调,Anthropic专注于最大化“有用的智能”,这虽不体现在Benchmark分数里,但一定会体现在收入上[13]

智谱创始人唐杰隔空对话马斯克:赶超Claude Fable 5不用等到2027年 - Reportify