AI 系列跟踪(80):Kimi K2 Thinking、GPT-5 Codex-Mini 相继发布,高性价比模型表现亮眼
长江证券·2025-11-12 19:26

投资评级 - 行业投资评级为“看好”,并予以维持 [7] 核心观点 - 近期AI模型发布密集,高性价比模型表现亮眼,看好AI交互、互联网大厂、垂直赛道及AI+游戏等细分领域的投资机会 [2][5] 模型发布与性能分析 - Kimi K2 Thinking模型发布:于11月6日发布并开源,通过多轮工具调用和多步思考,显著提升Agent能力与推理能力 [2][5][10] - Agent能力突出:能够持续进行200-300次工具调用,在²-Bench Telecom智能体工具使用基准测试中得分达93%,优于CPT-5 Codex的87%和Kimi K2 Instruct的73% [10] - 推理能力卓越:在“人类最后的考试”评测中取得SOTA成绩 [10] - 训练成本创新低:采用INT4量化等技术,训练成本仅为460万美元,显著低于DeepSeek-V3及OpenAI系列模型,模型定价为每百万Token输入4元、输出16元 [10] - GPT-5 Codex-Mini模型上线:于11月8日由OpenAI发布,为轻量级模型,具备更高性价比,适用于简单软件工程任务 [2][5][10] - 模型性能对比:在SWE-bench Verified测试中,GPT-5-Codex得分为74.5%,GPT-5-Codex-Mini得分为71.3%,性能差距较小,但后者可为用户提供标准版约4倍的调用量 [10] 看好的AI细分赛道 - AI交互赛道:看好AI玩具、工具等交互领域 [2] - 互联网大厂:看好具备流量、模型及数据优势的互联网大厂,如腾讯控股,聚焦to C AI Agent打造商业闭环 [2][10] - 垂直赛道复制:看好海外已跑通商业模式,国内有望复制的广告、电商、教育等垂直赛道 [2][10] - AI+游戏厂商:看好AI布局积极的游戏厂商,如巨人网络、恺英网络等 [2][10] - IP与工具型公司:优质IP或受益于AI提升创作效率和变现价值,关注工具型实力领先且AI能力持续迭代的公司,如快手 [10]