报告行业投资评级 - 推荐(维持) [1] 报告的核心观点 - 得益于DeepSeek引发的鲶鱼效应,预计2025年大模型能力将明显提升,互联网厂商在AI领域竞争由“技术之争”转为“生态之争”“应用之争”,港股互联网将迎来重估值 [2][3][64] 根据相关目录分别进行总结 一、DeepSeek之前:2024H2大模型上新动力放缓 - 海外大模型进展缓慢,OpenAI或保密o1 - pro模型训练o3,Anthropic用Claude 3.5 Opus改进Claude 3.5 Sonnet [9] - 模型训练分预训练和后训练,预训练消耗资源远超后训练,如DeepSeek - V3预训练花费约532.8万美元,后训练仅1万美元 [10] - 大模型预训练能力提升依赖训练算力与数据,2024H2能力提升放缓因算力未“质变”,数据中心建设慢,算力提升瓶颈在于集群,成本高、耗时长 [11][12][14] - 部分跟随者退出大模型训练,零一万物不再追求训练超级大模型,Character AI放弃通用模型竞争 [14] 二、DeepSeek的意义:指明了模型能力提升的第二条路 - 2024年9月OpenAI推出ChatGPT - o1,发现后训练用强化学习能提升模型推理性能,但o1闭源复现难 [16] - 2025年1月DeepSeek - R1发布,排名Chatbot Arena第三,开源“强化学习”与推理模型R1,实现“技术平权” [19] - DeepSeek - R1 - Zero抛开监督微调,展现强大推理能力但有可读性等问题,DeepSeek对其微调发布R1;采用GRPO评价方式,训练高效稳定 [27] - 后训练“强化学习”是性价比高的模型能力提升路径,微调成本通常小于原始训练成本1%,能显著增强模型能力 [29] - Kimi证明强化学习可行性,在多个基准和模式上达先进推理性能 [33] - DeepSeek - V3通过工程、算法优化降低训练和推理成本,采用MoE架构,验证FP8训练可行性,引入创新方法提炼推理能力 [36][37][38] 三、DeepSeek到来的一些思考 思考一:大模型差距大幅度缩短,模型能力将迎来一轮新爆发 - DeepSeek - R1开源缩短国内外大模型差距,预计2025年更多高性能大模型发布,大模型更新频率和能力提升幅度将显著飞跃 [39] - 新兴范式下,预训练不是“All in AI”唯一解,AI后发者增加强化学习投入性价比更高,头部大厂将兼顾“预训练”与“强化学习” [39][40] 思考二:“入口之争”将是头部互联网厂商的重中之重 - OpenAI 2024H2注重打磨产品,日活提升近一倍,年化收入约70亿美元,ChatGPT贡献约40亿美元 [42] - 推理模型崛起使Chatbot成为“效率工具”和个人AI助理雏形,使用频率和用户规模将大幅提升,成为重要入口 [45] - 头部互联网大厂重视Chatbot入口,Meta、Google、OpenAI有各自目标,腾讯在“入口”布局值得关注 [46][48] 思考三:推理成本下降与模型能力提升带来的应用端共振 - 推理模型早期因价格高昂难以普及,如ChatGPT - o1定价高,DeepSeek - R1 API服务定价低,输出API价格仅为GPT - o1的3.3% [49] - 因DeepSeek鲶鱼效应,OpenAI和谷歌推出性价比高的新模型 [51] - 模型能力提升,推理模型春节破圈,让用户认识到其能力进步,价格与能力共振将打开AI应用市场空间,预计2025年AI应用爆发 [53][55] 思考四:推理模型赋能端侧AI - 以DeepSeek - R1为代表,通过模型蒸馏技术可将大模型推理范式迁移至小模型,提升小模型推理性能,为端侧AI规模化应用奠定基础 [56] - 智能终端争先接入DeepSeek模型,语音助手和系统层均有接入,DeepSeek弥补手机厂商模型能力缺陷,提高手机系统生态价值 [58] - 感知数据是AI手机胜负手,小米“人车家生态”带来感知数据优势,手机系统AI化将成智能手机迭代核心变量,预计今年或现换机潮 [58][59][63] 四、投资建议 - 看好具有生态优势的互联网平台如腾讯、阿里巴巴、小米、Meta,Agent生态厂商ServiceNow、Salesforce,端侧网络安全厂商Cloudflare,关注受益于推理需求提高的数据中心、云厂商如亚马逊、甲骨文、世纪互联 [3][7][64]
大模型深度:DeepSeek带来互联网新格局
兴业证券·2025-02-17 11:47