模型迭代催化密集,行业景气度持续

报告行业投资评级 - 报告未明确给出针对“中国互联网(海外)”行业的整体投资评级 [1] 报告核心观点 - AI行业模型迭代催化密集,行业景气度持续,为下游应用生态提供源源不断的动力 [1] - 智谱GLM-5.1的发布是近期最具分量的事件,实现了AI从“回答问题”到“完成项目”的质变,大幅提升了AI Agent在长程任务应用中的可行性 [2] - DeepSeek V4系列发布在即,信号密集,预计将推出多款侧重不同的大模型,并全部基于国产AI芯片构建算力底座 [4] - 谷歌Gemma 4的发布为开源生态注入强劲动能,将闭源旗舰的核心能力下放到了开源模型上,为开发者提供了低成本、高性能的本地部署选择 [5] 主要模型迭代与性能总结 - 智谱GLM-5.1性能突破: - 在8小时内独立构建了一个完整的Linux桌面系统,执行超过1200个步骤,相当于四名开发人员一周的工作量 [2] - 在CUDA Kernel优化任务中,通过14小时自主迭代将加速比从2.6倍提升至35.7倍,而人类资深工程师完成同样任务需要数月 [2] - 在SWE-Bench Pro、Terminal-Bench 2.0、NL2Repo三项代码评测基准综合平均分中,取得全球模型第三、国产模型第一、开源模型第一的成绩 [2] - 智谱GLM-5.1定价与市场认可: - 模型聚合平台OpenRouter显示,GLM再度提价10%,调价后在Coding场景的缓存命中Token价格已接近Anthropic旗下Claude Sonnet 4.6水平 [3] - 这是国产大模型首次在核心场景实现与海外头部厂商的价格对齐 [3] - 自今年2月GLM-5发布后已三次涨价(2月涨30%起,3月涨20%,4月涨10%),客户接受涨价并持续选择服务,表明其模型能力具备领先优势 [3] - DeepSeek V4系列前瞻: - 网页版和App中已低调上线分层模式界面,包括“快速模式”、“专家模式”和正在灰度测试的“视觉模式” [4] - 快速模式主打即时响应,专家模式针对复杂推理,视觉模式标志着多模态能力的深度集成,可直接处理图像与视频分析任务 [4] - 新系列可能命名为DeepSeek V4 Lite(快速版)、DeepSeek V4(专家版)以及DeepSeek V4 Vision(视觉版) [4] - 谷歌Gemma 4开源模型: - 推出E2B、E4B、26B-A4B、31B四款型号,参数从20亿到310亿全覆盖,全部基于Gemini 3同源技术打造,并采用Apache 2.0开源协议 [5] - 310亿参数Dense版本在Arena AI文本排行榜上以Elo 1452高居开源第三,而排在其前的模型参数分别是它的20倍和30倍 [5] - 相比前代Gemma 3,各项能力大幅提升:数学能力从21.2%暴力拉升68个百分点至89.2%,编程能力从29.1%翻了两倍多至80%,智能体t2-bench从6.6%升至86.4%,多语言推理和知识问答全线飙升40%以上 [5]

模型迭代催化密集,行业景气度持续 - Reportify