AI Search

搜索文档
Token推动计算Compute需求:非线形增长
华泰证券· 2025-07-17 18:46
报告行业投资评级 - 科技行业评级为增持(维持),计算机行业评级为增持(维持) [6] 报告的核心观点 - 未来算力需求中存在Token调用量随推理扩展倍数增长、算力需求随Token增长倍数增长两个倍数关系,共同决定推理端未来算力需求广阔,目前市场存在较大预期差,长期看好算力需求持续快速增长 [89][90] 根据相关目录分别进行总结 New Scaling:不止于预训练,三条Scaling推动算力需求增长 - 市场认为预训练Scaling law可能见顶,但考虑后训练Scaling和推理Scaling,AI对算力需求仍有大量空间 [10] 从三条Scaling law的差异看为什么算力需求将继续增长 - 预训练和后训练Scaling属训练阶段,推理Scaling属推理阶段 [11] - 预训练Scaling性能和数据、参数量相关,后训练Scaling利用微调等技术提高模型能力和领域特异性,推理Scaling性能与推理时间相关 [13] 推理Scaling的必要性和算力消耗量化 - 推理Scaling能大幅提高模型回答困难问题能力,是通往Agentic AI的重要路径 [15] - 预训练受训练数据约束,推理Scaling能提高模型性能,特别是困难问题方面 [15] - 推理模型的Token消耗可能是传统模型的10倍左右 [18] Grok系列模型的发展对应了三条Scaling曲线 - Grok系列模型发展历程对应三条Scaling曲线,Grok 3对应预训练阶段的Scaling law,Grok 4对应后训练与推理过程的Scaling law [19] - Grok 4在HLE测评集上的突破证明了推理Scaling的有效性 [22] 从Deep Research看Agentic对Token量的影响 - Deep Research是“Agentic化”的AI Search,以其为研究Agentic AI的抓手,分析Token量变化并拓展到广泛Agentic AI场景进行量化 [28] - Agentic AI与狭义AI Agent存在差异,前者涉及多流程多工具调用,任务更复杂 [32] Deep Research是研究Agentic AI的重要抓手之一 - AI Search成为Token消耗的重要组成,Google Token量增长可能源于搜索业务 [34] - Deep Research产品是AI Search的Agent路径拓展,被多家厂商竞相推出 [37] Deep Research的Token多在哪?基于底层系统设计视角的分析 - 以Anthropic的Deep Research系统设计为例,其将任务分配给多个Agent,带来成倍Token消耗 [41] - 搜索过程是迭代式的,Token量进一步增加 [44] 从Search到Research,量化Agentic的Token影响 - Anthropic Deep Research的Token消耗达到聊天的15倍 [46] - Google/OpenAI Deep Research的Token消耗量可能接近聊天的50倍 [50] - Agent使用和多工具调用能进一步提升Grok 4在HLE测试中的结果 [55] Deep Research在Agentic AI中并不复杂,真实Token量会更高 - Deep Research任务相对简单,普遍的Agentic AI会有更高Token消耗量,未来Token量增长可能是指数增长 [57][58] Token量的增长会带来算力需求的非线性增长 - 算力需求增长远高于Token量的增长,Token量增长10倍,所需算力量可能增长百倍 [60] 延迟和吞吐量是推理过程中两个重要指标 - 延迟和吞吐量是推理过程的关键指标,相互关联,分别决定用户使用体验和厂商总任务处理量 [61] 为什么延迟和吞吐量互相制约?中间变量——批处理 - 为提升吞吐量需进行批处理,延迟随批量大小线性增长,吞吐量随批量增长先增后缓,两者相互制约 [68] 模型厂商的帕累托最优需要追求“量价”的平衡 - 模型/AI应用厂商需追求用户使用量与AI服务质量之间的平衡,实现收益最大化 [74] 增加硬件是实现模型最优收益边界前移的重要方式 - 增加硬件可减少模型服务延迟,实现模型最优收益边界前移,算力需求增长与Token增长呈倍数关系 [81][82] 总结:两个倍数关系决定未来推理算力需求空间广阔 - 未来算力需求中Token调用量随推理扩展倍数增长,算力需求随Token增长倍数增长,决定推理端未来算力需求广阔 [89] 产业链相关公司 - 海外算力链涉及PCB、铜互联、光模块光器件光芯片相关公司,国内算力链涉及中芯国际、寒武纪等公司 [92]
百度 2025 分析:聚焦人工智能搜索变革
2025-06-02 23:44
纪要涉及的公司 百度(Baidu, Inc.),是中国领先的互联网公司,主要提供搜索和在线新闻服务,通过广告实现盈利,还拥有领先的长视频平台(爱奇艺),是云计算和自动驾驶领域的主要参与者,并在人工智能、半导体等业务有多项投资 [10]。 纪要提到的核心观点和论据 搜索业务 - **核心观点**:加速AI驱动的搜索转型,提升AI搜索渗透率,探索创新广告形式,虽短期有营收压力但长期有望改善 [2]。 - **论据**:管理层目标是到年底将AI搜索渗透率从4月的35%提高到70 - 80%;搜索产品正从传统基于链接的结果转向多模态内容格式,包括视频、富文本和AI代理;AI代理通过增强用户互动提高了广告商ROI,目前贡献核心广告收入的9%,且在各垂直领域有深化服务能力和货币化的潜力;预计AI搜索转型带来的营收压力在2Q和3Q持续,4Q可能缓解 [2]。 云计算业务 - **核心观点**:保持强劲增长势头,未来营收增长和运营利润率有望保持良好水平 [3]。 - **论据**:2025年1Q百度云营收实现42%的同比增长,主要得益于AI训练/推理需求强劲时计算芯片可用性的提高;基于订阅的收入占云收入的绝大部分,支持更可持续的增长;1Q的增长部分受公共服务、金融、医疗等垂直领域对私有部署项目需求激增的推动;管理层有信心未来几个季度云收入增长保持强劲,运营利润率保持在低两位数水平 [3]。 自动驾驶出租车业务 - **核心观点**:加速车队扩张,拓展全球市场,具有盈利潜力 [4]。 - **论据**:目标是到年底将自动驾驶出租车车队规模从目前的约1000辆扩大到3000辆;积极在迪拜和阿布扎比等海外市场推出服务,已开始公共道路测试,年底可能进入其他新市场;RT6具有全球领先的自动驾驶汽车成本优势和完全无人驾驶运营能力,管理层认为UE模式已得到验证,海外市场的货币化潜力在结构上更高;还在探索轻资产模式,宣布与神州租车(CAR Inc.)达成国内合作 [4]。 估值与评级 - **核心观点**:维持买入评级,目标价不变 [5]。 - **论据**:目标价反映了搜索和信息流广告2025E市盈率的4倍、云计算2025E市销率的2倍,以及现金和主要股权投资;美股目标价为107美元,港股目标价为104港元 [5]。 其他重要但是可能被忽略的内容 财务数据 - 给出了2022 - 2029年的营收、EBIT、净利润、每股收益、每股股息、净债务/现金等财务指标的历史数据和预测数据 [6]。 - 2025年5月28日股价为83.19美元,52周股价范围为76.86 - 115.13美元,市值为287亿美元,流通股数为3.44亿股,自由流通股比例为72%,平均日交易量为451.6万股,平均日交易额为4.042亿美元,2025E普通股股东权益为2790亿元人民币,2025E市净率为0.7倍,2025E净债务与EBITDA比率为NM [7]。 - 预测价格涨幅为28.6%,预测股息收益率为0.0%,预测股票回报率为28.6%,市场回报率假设为11.0%,预测超额回报率为17.6% [9]。 风险因素 - 关键风险包括竞争格局演变和加剧、新业务执行、投资公司和业务的整合、流量获取成本上升、内容和品牌推广成本上升、维护和升级IT系统、知识产权侵权、国际市场扩张、关键管理层离职和监管风险 [12]。 评级相关 - 12个月评级为买入,短期评级无催化剂 [14]。 - 对行业结构、监管环境、股票近期表现、EPS更新与共识预期对比、下一次财报结果风险等问题的评级均为3,即无明显变化 [14]。 全球各地区分发说明 - 详细说明了报告在全球不同国家和地区的分发对象、监管情况、适用法律等信息,如在中国、美国、英国、澳大利亚、巴西等国家和地区的分发要求和限制 [63][64][88][89][90][91]。
Raymond James Invests in Service Excellence with Proprietary Generative AI Search
Newsfilter· 2025-04-17 22:10
文章核心观点 公司推出专有AI Search技术持续投资人工智能提高服务水平,该技术能为金融顾问和员工提供精准信息,公司围绕AI创新有战略框架并注重可靠性和透明度,还与金融顾问紧密合作改进技术 [1][3][5] 新技术情况 - 公司推出由生成式人工智能驱动的专有AI Search技术,金融顾问和员工可向公司内部知识库提自然语言问题并获精准信息 [1] - AI Search将扫描搜索结果的时间减少为一站式问答体验,能让用户首次尝试就获取正确信息或专业联系人,且集成到顾问熟悉的知识中心 [2] AI创新战略框架 - 公司围绕AI创新的战略框架聚焦数据驱动洞察、增强服务模型和系统、安全可靠且可扩展的应用三个关键支柱 [3] - AI Search通过实时投票系统不断获取结果质量反馈以确保可靠性 [3] - 公司在开发、实施和维护过程中设置人工检查点减少AI模型出错可能,且内部构建AI Search保证应用的透明度和灵活性 [4] 技术投入与合作 - 公司与金融顾问紧密合作设计技术,为顾问和客户提供支持顾问 - 客户关系的数字工具平台 [5] - 公司每年投资9.75亿美元持续改进顾问和客户的技术 [5] 公司概况 - 公司是领先的多元化金融服务公司,提供私人客户集团、资本市场、资产管理、银行等服务,客户总资产达1.58万亿美元,1983年上市,在纽交所代码为RJF [6]