Workflow
Qwen3 系列
icon
搜索文档
DeepSeek、GPT-5带头转向混合推理,一个token也不能浪费
机器之心· 2025-08-30 18:06
混合推理模式行业趋势 - AI行业面临过度思考导致的算力浪费问题 推动自适应计算技术发展 [2][3] - 2024年多家头部公司推出混合推理方案 通过动态调整计算资源实现50-80%的token节省 [3][7][10] - 混合推理成为大模型领域新常态 成本与性能平衡成为核心竞争力新基准 [11][48] 技术实现路径对比 - 路由方案:OpenAI的GPT-5采用多模型路由系统 根据问题复杂度自动选择gpt-5-main或gpt-5-thinking等模型 [36][37] - 单模型双模式:DeepSeek v3.1通过</think>/<think>标记实现思考模式切换 在基准测试中减少25-50% token消耗 [3][10][46] - 显式控制方案:阿里Qwen3采用/think和/no_think标记 谷歌Gemini 2.5 Flash支持0-24576 token的思考预算调节 [19][23] 头部公司技术布局 - Anthropic的Claude 3.7 Sonnet首创混合推理 支持API端精细控制思考时长 [18] - 腾讯Hunyuan-A13B采用双模式思维链框架 通过后训练统一优化快慢思考两种模式 [34] - 智谱GLM-4.5通过专家训练+自蒸馏技术整合推理能力 实现反思与即时响应模式切换 [35] - 字节Seed 1.6采用Adaptive CoT技术 通过强化学习实现帕累托最优的推理链触发机制 [31][32] - 快手KwaiCoder-AutoThink采用两步式训练 增加pre-think阶段预判问题难度 [27][28] 性能与成本数据 - GPT-5思考模式比前代减少50-80%输出token [7] - DeepSeek v3.1在AIME 2025等测试中保持性能同时减少25-50% token消耗 [10] - Gemini 2.5 Flash启用推理功能后输出成本相差6倍 [23] - 当前20分钟深度研究调用成本约1美元 预计2027年单用户单日Agent调用成本达72美元 [14][15] 技术挑战与演进方向 - 阿里Qwen3混合推理因基准测试表现不佳暂停 转向分模型训练方案 [21] - OpenAI路由方案遭遇专业用户质疑 存在路由不透明和低质量模型分配问题 [38] - 研究领域聚焦无需训练(提示词/路由/解码操纵)和基于训练(微调/强化学习)两大技术路径 [50][51] - 多模态领域出现R-4B等自适应思考模型 自动化程度持续提升 [52] 商业模式创新 - 路由模式使OpenAI可从免费用户提问中识别商业意图 导向高算力模型并实现成交抽成 [43] - 企业级应用更关注成本精确控制 Gemini 2.5 Pro的思考预算机制支持像调节水龙头一样调节AI思考成本 [24] - 深度研究等长任务模式导致token消耗每6个月翻倍 订阅费上涨压力持续存在 [14][16] 未来发展方向 - 行业竞争重点从"是否能思考"转向"能否以最低代价在恰当时刻思考" [56][57] - 技术目标聚焦更智能的自我调节 减少对人类指示的依赖 [57] - 开源模型如DeepSeek v3.1提供高性价比选择 企业级部署成本控制需求持续强化 [46][24]
阿里巴巴-W(09988):核心业务表现良好,发放特别现金股息
光大证券· 2025-05-16 15:42
报告公司投资评级 - 维持“买入”评级 [4] 报告的核心观点 - 阿里巴巴-W 2025 财年年报显示营收和净利润同比增长,4QFY2025 营收同增 6.6%,归属于普通股股东净利润同增 278.7% [1] - 虽 4QFY2025 整体收入略逊预期,但核心业务表现亮眼,淘天集团客户管理收入同比增 11.8%,云智能集团收入增速加速,AI 产品需求强劲 [2] - 公司在 FY2025 进行股份回购,普通股净减少比例达 5.1%,并宣布发放股息和特别股息提升股东回报 [3] - 考虑公司持续投入业务,下调 FY2026/FY2027 非公认会计准则净利润预测 5%/1%,新增 FY2028 年预测,维持“买入”评级 [4] 相关目录总结 财务数据 - FY2025 营业收入 9963.47 亿元,同比增长 5.9%,归属于普通股股东净利润 1294.70 亿元,同比增长 62.4%,非公认会计准则净利润 1581.22 亿元,同比增长 0.4% [1] - 4QFY2025 营业收入 2364.54 亿元,同比增长 6.6%,归属于普通股股东净利润 123.82 亿元,同比增长 278.7%,非公认会计准则净利润 298.47 亿元,同比增长 22.2% [1] 核心业务表现 - 淘天集团 4QFY2025 客户管理收入同比增长 11.8%,受益于 Take rate 提升和平台核心客群增长,88VIP 会员达超 5000 万人 [2] - 云智能集团 4QFY2025 收入同比增长 17.7%至 301.27 亿元,外部客户收入同比增长 17%,AI 产品收入连续七个季度三位数同比增长 [2] 股东回报 - FY2025 以 119 亿美元回购 11.97 亿股普通股,普通股净减少比例 5.1% [3] - 宣布发放每股 ADS 1.05 美元的 FY2025 年度股息以及每股 ADS 0.95 美元的一次性现金特别股息 [3] 盈利预测调整 - 下调 FY2026/FY2027 非公认会计准则净利润预测 5%/1%至 1698.13/1853.18 亿元,新增 FY2028 年预测 1979.20 亿元 [4] 公司盈利预测与估值简表 |指标(元)|FY2024|FY2025|FY2026E|FY2027E|FY2028E| |----|----|----|----|----|----| |营业收入(百万元)|9,412|9,963|11,115|11,861|12,488| |营业收入增长率(%)|8.34%|5.86%|11.56%|6.71%|5.29%| |归属普通股股东净利润(百万)|79,741|129,470|135,647|145,763|150,565| |归属普通股股东净利润增速(%)|9.93%|62.62%|4.26%|7.46%|3.29%| |非公认会计准则净利润(百万)|157,479|158,122|169,813|185,318|197,920| |非公认会计准则净利润增速(%)|11.39%|0.41%|7.39%|9.13%|6.80%| [5] 4QFY2025 业绩与预期对照表 - 总收入 236,454 百万元,较预测 -0.61%,归属普通股股东净利润 12,382 百万元,较预测 -45.32% [9] - 各业务板块收入有不同表现,如淘天集团收入 101,369 百万元,较预测 3.62%,云智能集团收入 30,127 百万元,较预测 0.76% [9] 财务报表与盈利预测 - 利润表显示各财年收入、成本、利润等指标变化,如营业收入从 FY2024 的 9412 亿元增长到 FY2028E 的 12488 亿元 [10] - 现金流量表展示经营、投资、融资活动现金流情况,净现金流从 FY2024 的 569 亿元到 FY2028E 的 804 亿元 [10] - 资产负债表呈现资产、负债、股东权益等状况,总资产从 FY2024 的 17648 亿元增长到 FY2028E 的 24723 亿元 [11] 盈利能力、偿债能力、费用率及每股指标 |指标|FY2024|FY2025|FY2026E|FY2027E|FY2028E| |----|----|----|----|----|----| |毛利率(%)|36.72|37.70|40.20|40.20|40.20| |EBITA 率(%)|16.97|18.48|19.50|19.70|19.98| |税前净利润率(%)|10.27|10.79|17.26|17.34|17.27| |归母净利润率(%)|8.38|8.50|13.80|13.79|13.69| |ROA(%)|4.21|4.53|7.47|7.17|6.80| |ROE(摊薄)(%)|7.33|8.08|12.26|11.53|10.74| |资产负债率(%)|37|40|38|36|35| |流动比率|1.79|1.55|1.45|1.57|1.71| |速动比率|1.21|0.86|0.90|1.03|1.17| |销售及营销开支(%)|12.23|14.45|15.20|15.10|15.00| |研发开支(%)|3.80|4.44|4.44|4.29|3.60| |一般及行政开支(%)|5.55|5.74|6.10|6.00|5.90| |每股经营现金流(元)|9.0|8.6|11.9|11.1|11.6| |每股净资产(元)|14.0|8.4|9.3|9.8|10.7| |EPS(元)|3.91|6.70|7.11|7.64|7.89| [12][13]