Workflow
o系列模型
icon
搜索文档
深度|OpenAI 多智能体负责人:许多人正在构建的产品并未真正遵循Scaling Law,最终都会被所取代
Z Potentials· 2025-07-20 10:48
多智能体与游戏AI研究 - OpenAI开发的Cicero系统在《Diplomacy》游戏中达到人类玩家前10%水平,并通过AI反哺训练使开发者Noam Brown成为2025年世界冠军[3][4] - Cicero采用27亿参数的小型语言模型,开发过程中发现更大模型能显著提升性能[8] - 多智能体研究不仅关注博弈策略,更探索如何扩展模型推理时间至数小时甚至数天以解决复杂问题[55] AI推理范式演进 - 测试时计算成为下一代AI核心能力,模型思考时间从15分钟向更长周期扩展带来数量级性能提升[32][34] - 系统一(直觉)与系统二(推理)能力需协同发展,模型规模扩大后推理性能呈现涌现特性[15][16] - OpenAI通过o系列模型验证推理范式,o3已具备网页浏览和深度研究能力,性能持续迭代[11][26] 数据效率与算法改进 - 当前AI数据效率显著低于人类,算法改进是提高数据利用率的关键方向[38][39] - 强化学习微调(RFT)可针对性优化模型,收集的数据对未来模型迭代仍具价值[30] - 预训练模型需结合中训练和后训练才能实用化,纯预训练模型表现欠佳[88][90] 行业竞争与技术路线 - 自对弈在两人零和游戏(如围棋)中有效,但在多人非零和场景面临目标函数设计挑战[66][69] - 模型路由等辅助结构可能被扩展范式取代,开发者需警惕技术快速迭代带来的架构淘汰风险[26][28] - OpenAI采用集中资源进行大规模实验的策略,区别于传统实验室的小型分散研究模式[40][41] 应用场景与商业化 - Codex编程助手可独立完成代码提交,未来将覆盖从问题提出到PR审核的全流程[43][51] - 虚拟助手成为继软件开发后的重点应用领域,AI对齐需求使其可能超越人类表现[52] - 生成式媒体(Sora)与推理模型形成技术矩阵,推动商业订阅增长[71] 前沿研究方向 - 显式建模其他智能体的必要性存疑,大规模模型可能自发形成心理理论能力[64] - 万智牌等超复杂不完美信息游戏暴露现有AI方法的局限性,状态空间爆炸问题待解[99][100] - 生物模拟器开发被视为突破药物研发瓶颈的关键路径,需跨学科协作[86]
AI展望:NewScaling,NewParadigm,NewTAM
华泰证券· 2025-06-10 09:43
报告核心观点 - 全球AI发展呈现模型端新架构探索、算力端需求上行与硬件设计进入新范式、应用端商业模式变革的趋势,持续看好AI产业投资主线,全球AI应用将进入业绩收获期 [1] 模型:预训练Scaling Law有望开启新起点 - 大模型技术路线从预训练到后训练发展,2018 - 2024年9月为预训练阶段,2024年9月后进入后训练阶段 [13][15] - 腾讯混元Turbo - S通过创新架构实现性能与效率平衡,Google Gemini Diffusion在文本生成上有突破,大厂在预训练参数量和数据量扩大上有尝试,大规模算力集群支持预训练探索,模型架构改进或使预训练Scaling Law开启新起点 [23][24][25] 算力:训练推理两条主线共同推动算力需求持续上行 训练端 - 后训练阶段Scaling Law成大厂共识,新Scaling路径不断涌现,新架构探索有望重启预训练阶段算力需求叙事 [33][34] - 以“星际之门”为代表的大规模算力集群进展顺利,中东版“星际之门”落地,主权AI逐步落地,台积电新产能规划预示算力需求乐观 [38][41][42] 推理端 - Agent需求增长或使推理算力提升几十至上百倍,大量工具调用和信息交互使tokens消耗量大幅提升,产品用户数量增长带动算力需求提升 [43][46][52] 算力硬件新范式 - 大模型对系统综合能力要求提高,NVLink Fusion强化英伟达硬件生态优势,国产算力加速迭代,华为云推出新服务器,高密度机架方案为性能追赶提供路径 [57][58][60] 应用:Agent进展提速,看好AI应用进入业绩收获期 Agent发展情况 - Agent可能是AI应用终极形态,目前雏形初具,但完成复杂长期任务能力有限,“任务长度”是关键衡量指标且提升速度快 [68][73][74] - MCP统一了Agent工具调用生态,促进其快速构建和发展 [79] 海外AI应用 - AI Coding是重要垂类赛道,细分垂类商业化效果好,25Q1业绩大部分超预期,头部2B软件AI产品存量客户渗透率接近10%,全年收入有望加速增长 [82][84][85] 国内AI应用 - 加速从简单环节到复杂环节产品升级,25Q1利润指标率先改善,AI商业化24年初步验证,25年有望加速复制推广,MCP有望加速产业节奏 [88][90][94] 落地节奏展望:商业模式变革有望成为共识,看好细分领域率先放量 商业模式变革 - Agent应用从交付工具转变为交付结果,按效果付费新范式有望成行业共识 [99] 细分场景放量 - 数据复杂度低、幻觉容忍度高的场景率先实现规模化商业落地,2C场景商业化进展领先,2B应用分场景和行业来看,数据复杂度和预算影响落地节奏 [103][104][110] AI + 营销/销售 - 数据丰富、可量化ROI和流程标准化驱动AI快速商业化,企业需求从单一工具向全链路智能中枢升级,市场格局分散,AI有望重塑格局 [113][114][119] 重点公司推荐 - 推荐金山办公、福昕软件、泛微网络等多家公司,均给予“买入”评级 [7]
金山云(KC):持续看好公司盈利能力改善和AI业务增长
国元证券· 2025-05-16 15:25
报告公司投资评级 - 买入,目标价17.6美元,对应2025财年的PS约3.5倍,预计升幅27.8% [1][3][6] 报告的核心观点 - 金山云作为小米及金山集团发展AI生态的直接受益者,在营业收入、盈利能力等方面未来均有较大增长潜力,战略转型已初见成效,看好其未来收入增长潜力 [6][12] 根据相关目录分别进行总结 重要数据 - 2025年5月14日收盘价13.77美元,总股本2.74亿份ADS,总市值37.86亿美元,净资产11.47亿美元,总资产22.33亿美元,52周高低为2.02/22.26美元,每ADS净资产2.83美元 [2] - 主要股东包括金山软件(37.40%)、纽约梅隆银行(15.97%)、小米集团(10.89%)、摩根大通(5.36%)、摩根大通证券(5.05%) [2] 投资要点 - AI相关服务收入快速,盈利能力显著提升:2024年总营业收入77.85亿元,同比增长10.5%,净亏损19.67亿元,亏损同比减少9.4%;第四季度营业收入22.32亿元,同比增长29.6%,环比增长18.4%,调整后EBITDA为3.60亿元,利润率为16.1%,调整后经营利润为0.24亿元,首次扭亏为盈;2024年AI相关业务收入13.22亿元,占总收入17%,第四季度AI业务收入4.74亿元,占公有云收入34%,同比增长近500% [3][8] - 完成基于国产芯片适配,助力国产模型充分发挥性能优势:已完成基于国产芯片的DeepSeek适配,星流训推平台完成DeepSeek部署,支持多机部署实现分布式推理,全面接入智谱GLM系列推理模型,部署流程简化,能助力AI模型发挥性能优势,提升公司AI服务能力 [4][9] - 全面接入推理大模型,挖掘潜在算力增长需求:全面接入Xiaomi MiMo系列模型及Qwen3系列模型,已广泛覆盖头部AI大模型公司,能提升平台模型服务广度,为行业应用提供新思路,未来推理算力需求有望增长 [5][11] - 看好公司持续受益于金山及小米生态AI升级,维持买入评级:公司作为受益者,未来AI相关业务爆发式增长将推动公有云收入提升,成本结构优化和项目实施提效使毛利率和调整后经营利润持续改善,给予17.6美元目标价,维持买入评级 [6][12] 财务报表摘要 |项目|2023A|2024A|2025E|2026E|2027E| |----|----|----|----|----|----| |收入(百万元)|7,047|7,785|9,880|11,952|14,022| |同比增长| -13.8%|10.5%|26.9%|21.0%|17.3%| |净利润(百万元)| -2,184| -1,979| -439| -54|426| |毛利率(%)|12.1|17.2|20.5|24.7|27.5| |EBITDA率(%)| -3.8|8.2|13.2|13.6|14.6| |净利率(%)| -31.0| -25.4| -4.4| -0.5|3.0| |ROE| -31.7%| -38.3%| -8.9%| -1.1%|7.3%| |费用/收入(%)|32.7|27.7|23.0|23.0|22.0| |实际税率(%)| -0.8|0.1|10.0|10.0|10.0| |应收账款天数|78|68|68|68|68| |应付账款天数|105|105|90|83|77| |负债/权益|0.85|1.32|1.58|1.75|1.80| |收入/总资产|0.69|0.60|0.75|0.88|0.95| |总资产/权益|1.48|2.51|2.65|2.66|2.53| [14]
港股周报(2025.04.28-2025.05.02):阿里云发布Qwen3系列模型,小米发布MiMo系列模型-20250507
天风证券· 2025-05-07 13:39
报告行业投资评级 未提及 报告的核心观点 - 本周港股三大指数上涨,恒生科技指数处于估值相对低位,26E PE为14倍,建议关注后续重要模型产品迭代发布对中国AI及中国资产的全球投资预期及估值提升 [1] - 建议关注阿里巴巴、小米集团、美团、腾讯控股、泡泡玛特、禾赛科技等公司 [4] 根据相关目录分别进行总结 公司财报与新闻 - 阿里云通义Qwen3模型开源,发布8款混合推理模型,数据集显著扩展,旗舰模型Qwen3 - 235B - A22B在多项基准测试表现有竞争力 [7] - 阿里云通义灵码全面支持Qwen3模型,PAI上线Qwen3云上一键部署教程,为企业和开发者提供更多使用渠道 [8] - 小米开源首个推理大模型MiMo - 7B,面向数学与代码领域,在多项测试中超越更大规模模型,推理能力由预训练与后训练协同驱动 [9] 港股市场综述 香港市场 - 本周(2025年4月28日至2025年5月2日)恒生指数收盘21980.74点,上涨约2.74% [10] 南向资金 - 本周港股通5个交易日共净买入11.85亿元,年初至今净买入5687.47亿元,相当于2024年全年净买入7440.31亿元的76.44% [1] - 南向资金重点加仓美团(49.49亿)、阿里巴巴(13.55亿)、康方生物(7.53亿)、建设银行(5.21亿)等 [1] 各行业动态 AI行业 - 阿里云发布通义Qwen3系列,旗舰模型Qwen3 - 235B表现领先;DeepSeek发布Prover - V2,数学推理能力大幅提升;小米开源MiMo - 7B,数学推理和代码能力超越o1 - mini [2] 智能驾驶行业 - 短期政策收紧低阶智驾宣传,未来高阶智驾或有政策引导和激励,新车发布周期有望驱动市场预期升温,持续看好头部主机厂、激光雷达和芯片提供商 [2] OTA行业 - 携程“五一”首日数据显示国内游热度高,入出境游增速亮眼,飞猪旅游AI应用“问一问”反响火热,AI Agent有望在垂类场景落地,建议关注携程、同程 [3] 跨境电商行业 - 美国终止对中国小额包裹免征关税政策,TEMU及Shein等终端网站价格涨幅大,预计全托管占比下降,建议关注政策落实情况及前期美区收入占比较低或to B错杀标的 [3] 新股行业 - 本周赛力斯、鸣鸣很忙递交招股书,赛力斯专注新能源汽车,鸣鸣很忙是中国最大连锁零售商,采用量贩模式 [4]