豆包 1.5

搜索文档
全球算力景气度再验证
国盛证券· 2025-06-02 12:25
报告行业投资评级 - 增持(维持) [7] 报告的核心观点 - 英伟达 FY26Q1 业绩超预期和 Coreweave 股价快速上涨,表明推理端对高性能计算需求快速释放,AI 算力景气度持续验证 [1] - 云大厂能力全面升级,加速 AI 应用落地 [2] - 算力是 Agent 爆发的前提,支撑中长期成长,从模型训练到服务推理,从应对高并发访问到保障服务稳定性,算力已成为支撑 Agent 发展的关键基础设施和核心瓶颈 [3] 根据相关目录分别进行总结 英伟达 FY26Q1 业绩超预期,验证 AI 算力长期景气度 - 2026 财年第一季度英伟达实现收入 441 亿美元,较上一季度增长 12%,较去年同期增长 69%,数据中心同比+73%,Blackwell 芯片贡献数据中心收入的 70% [1][12] - AI 推理的 token 生成量在短短一年内激增十倍,随着 AI 智能体成为主流,业界对 AI 算力的需求将加速增长 [13] - 游戏和 AI PC 第一季度收入达 38 亿美元,较上一季度增长 48%,较去年同期增长 42%;专业视觉收入为 5.09 亿美元,与上一季度持平,较去年同期增长 19%;汽车和机器人业务第一季度收入为 5.67 亿美元,较上一季度下降 1%,较去年同期增长 72% [14][15] - 英伟达对 2026 财年第二季度收入预计达 450 亿美元,上下浮动 2%;GAAP 和非 GAAP 毛利率预计分别为 71.8%和 72.0%,上下浮动 50 个基准点;GAAP 和非 GAAP 运营费用预计分别约为 57 亿美元和 40 亿美元 [17] - AI 基础设施服务商 CoreWeave 自上市以来持续上涨,英伟达持股占比 3.86%,它有 32 个数据中心,超 25 万个 NVIDIA GPU,获超 260MW 电力支持 [1][18] 云大厂能力全面升级,加速 AI 应用落地 - 字节:5 月 13 日火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包 1.5·视觉深度思考模型,升级豆包·音乐模型;Data Agent 正式亮相、Trae 接入豆包深度思考模型并升级;6 月 11 - 12 日将召开 2025 FORCE 原动力大会春季会议 [21] - 阿里云:4 月 9 日召开 AI 势能大会,算力上第九代 ECS 开启商业化,算力最高提升 20%、价格降 5%;存储上文件存储 CPFS 面向 AI 智算能力升级;运维上跨域网络 SLA 提升至 99.995%,网络智能服务 NIS 推出;管控上“灵骏”可主动发现故障并“自愈”;推理上人工智能平台 PAI 面向 MoE 架构及推理模型全面升级;上线业界首个全生命周期 MCP 服务,预告 AI Agent Store 愿景;启动“繁花计划” [2][27][35] - 华为云:4 月 10 日召开华为云生态大会 2025,推出 CloudMatrix 384 超节点;推动盘古大模型在行业场景落地;开发者规模超 1200 万 [2][36][38] 算力是 Agent 爆发的前提,支撑中长期成长 - Agent 需要处理长上下文和接入外部数据,增加了上下文长度和处理复杂度,加剧算力消耗 [40][42] - Agent 执行任务验证带来算力开销,如 Manus AI 的三重校验体系需额外计算资源 [43] - 多模态发展使 Agent 需处理整合多种类型数据,带来更大算力需求 [44] - 算力瓶颈影响 Agent 服务的用户体验,服务提供商需预留冗余算力应对用户流量波动 [45][46] - 算力需求不仅体现在用户端推理服务,也体现在模型训练阶段,如阿里 Qwen3 系列模型训练需海量算力 [47] 建议关注 - 算力:寒武纪、海光信息等 [4][50] - Agent:金山办公、泛微网络等 [4][50] - 垃圾发电:旺能环境、盈峰环境等 [4][50] - 互联网大厂 AI 链:寒武纪、恒玄科技等 [5][51] - 军工 AI:能科科技、品高股份等 [5][51]
大厂Capex加速增长
国盛证券· 2025-05-17 22:44
报告行业投资评级 - 增持(维持) [7] 报告的核心观点 - 推理端对高性能计算的需求快速释放,阿里、腾讯等大厂Capex持续扩张,云上游上行周期正式启动,看好由推理应用带来的云计算需求持续扩张 [1][12] - 云大厂能力全面升级,加速AI应用落地 [2] - 以LLM为核心驱动的Agent背后蕴含庞大的算力需求,算力已成为支撑Agent发展的关键基础设施和核心瓶颈 [3] 根据相关目录分别进行总结 阿里、腾讯Capex实质更乐观,AI基建正式启动 - 阿里资本开支承诺金额超预期,阿里云增速亮眼,2025Q1阿里资本开支为246.12亿元,同比增长120.68%;阿里云收入301.27亿元,同比增长17.71%,未来三年阿里将投入超3800亿元用于建设云和AI硬件基础设施 [13][16] - 腾讯资本开支符合预期,国内AI基建正式启动,2025Q1腾讯资本开支274.76亿,同比+91.35%,公司预计在2025年进一步增加Capex,预期Capex占收入的比例为低两位数百分比 [16] 云大厂能力全面升级,加速AI应用落地 - 字节:6月火山引擎2025 FORCE原动力大会召开在即,5月13日发布豆包·视频生成模型Seedance 1.0 lite、豆包1.5·视觉深度思考模型,升级豆包·音乐模型,Data Agent正式亮相并全新升级,6月11 - 12日大会有望迎来更多AI落地惊喜 [21] - 阿里云:4月9日召开AI势能大会,AI和云计算基础设施全面升级,算力上第九代ECS开启商业化,算力最高提升20%、价格较上一代再降5%;存储上文件存储CPFS面向AI智算能力再升级;运维上跨域网络SLA提升至99.995%,网络智能服务NIS已推出;管控上“灵骏”可主动发现故障并“自愈”,万卡集群有效训练时长占比超93%;推理上人工智能平台PAI面向MoE架构及推理模型全面升级;数据上瑶池数据库产品上新,支持In - DB AI、开箱即用;Agent上线业界首个全生命周期MCP服务,预告Agent Store愿景;生态上“繁花计划”启动,未来三年目标百万家客户、百亿元商机 [26][35] - 华为云:4月10日召开生态大会,创新算力架构,推出CloudMatrix 384超节点;沉淀行业Know - how,推动盘古大模型在行业场景落地;坚定投入生态建设,华为开发者规模超1200万 [36][39] 算力是Agent爆发的前提,支撑中长期成长 - Agent需要处理长上下文和接入外部数据,增加上下文长度和接入外部数据会导致算力需求增长 [42][44] - Agent执行任务验证带来算力开销,如Manus AI的三重校验体系保障输出可靠性,但需要额外计算资源 [45] - 多模态的发展会带来更大算力需求,Agent处理和整合多种类型数据需要大量计算资源 [46] - 算力瓶颈影响Agent服务的用户体验,为保证用户体验需留出冗余算力 [47][48] - 算力需求不仅体现在用户端的推理服务上,也体现在模型训练阶段,如阿里Qwen3系列模型训练需要海量算力 [50] 建议关注 - 算力:寒武纪、海光信息等多家公司 [4][53] - Agent:金山办公、泛微网络等多家公司 [4][53] - 垃圾发电:旺能环境、盈峰环境等公司 [4][53] - 互联网大厂AI链:寒武纪、恒玄科技等多家公司 [5][54] - 军工AI:能科科技、品高股份等公司 [5][54]
国内互联网云厂商业绩与大模型进展跟踪:预计Deepseek带动云收入加速、利润率提升,大模型追赶海外先进水平
国信证券· 2025-05-14 15:23
报告行业投资评级 - 优于大市(维持) [1] 报告的核心观点 - 预计Deepseek带动云收入加速、利润率提升,大模型追赶海外先进水平 [1] - 国内云厂商一季度预计在Deepseek热度带动下收入增速持续加速、AI云占比持续提升,有望拉动云业务大盘今年实现接近20%的同比增长 [4] - 建议关注云厂商AI领域进展和AI大模型进展 [17] 根据相关目录分别进行总结 云厂商业绩 - 收入端:预计一季度在Deepseek热度下AI云相关快速增长,驱动大部分云厂商收入环比增幅继续加速,阿里云加速至同比+23%YoY(环比+10pcts)、腾讯云加速至18%YoY(环比+5pcts、同比+3pcts)、百度云预计+26%YoY(同比+14%、环比持平),阿里AI云相关业务一季度营收同比翻倍以上增长,腾讯AI云业务一季度营收有50%以上同比增长 [8] - 利润端:需求放量带动GPU相关价格提升,云业务稳态利润率提升,阿里云利润率提升与资本开支折摊增长抵消,一季度腾讯云、字节云边际净利润率有所提升,阿里云预计一季度维持经调EBITA 9%+ [8] 资本开支与算力供给 - 投资端:2025年云厂商预计持续加大对AI的投入,一季度投资环比增加,字节、阿里投入领先,阿里25Q1 Capex预计延续四季度高投入,同比接近200%,腾讯Capex维持去年四季度高投入,实现近200%的同比增长,百度整体Capex稳健,一季度保持个位数同比增长 [9] - 算力供给:今年算力缺口风险较低,预计云厂不会演绎激烈价格战,对H20交付持中性偏乐观态度,主要因提前储备算力、通过算力租赁等渠道解决潜在缺口,云厂商积极采用国产芯片替代,后续算力供给情况取决于国产芯片交付节奏、良率和性能 [3][9] 云厂商大模型进展 - 国内大厂在大模型领域进展显著,与国际顶尖模型差距缩小,阿里通义千问Qwen3融合双思考模式,测评超过DeepSeek R1、OpenAI O1、Grok 3;腾讯成立相关模型部,混元广泛应用于内部业务场景;字节跳动豆包1.5性能优异,推出多款AI应用;百度聚焦模型性能提升与企业应用落地,文心大模型4.5 Turbo多模态与推理能力提升显著 [3] - 2025年各厂商大模型进展:1月22日字节跳动发布豆包大模型1.5Pro;1月24日Deepseek发布DeepSeek - R1模型;2月初阿里巴巴发布Qwen2.5 - Max;2月14日百度官宣将推出文心大模型4.5系列并于6月30日开源;3月阿里巴巴发布QwQ - 32B;3月16日百度发布文心大模型4.5和文心大模型X1;4月14日字节跳动公布智能推理模型Seed - Thinking - v1.5技术细节;4月17日字节跳动旗下火山引擎面向B端发布豆包1.5深度思考模型;4月18日阿里巴巴发布端到端多模态AI模型Qwen2.5 - Omni - 7B;4月21日腾讯混元大模型团队推出自研深度思考模型混元T1正式版;4月23日字节跳动推出多模态模型Vidi;4月25日百度发布文心大模型4.5 Turbo和文心大模型X1 Turbo;4月29日阿里巴巴发布Qwen3系列模型;4月30日小米开源首个专注推理能力的大模型Xiaomi MiMo;5月9日腾讯混元推出并开源全新多模态定制化视频生成工具Hunyuan Custom [14][16]
AI周度跟踪2025年第6期:阿里发布Qwen 3,国内大模型发布加速
东方证券· 2025-05-06 20:23
报告行业投资评级 - 看好(维持) [5] 报告的核心观点 - 看好AI新周期带动算力 - 算法 - 应用生态三端依次持续推进,建议增加港股互联网板块配置仓位,核心推荐阿里巴巴 - W、快手 - W、腾讯控股、百度集团 - SW [3][87] 根据相关目录分别进行总结 本期AI专题跟踪 阿里发布通义千问3.0系列模型 - 4月29日凌晨,阿里巴巴开源新一代通义千问模型Qwen 3系列,包含8款模型,Qwen 3 - 235B - A22B测评超DeepSeek R1等位列开源系列模型榜首 [13] - Qwen 3系列优势:有8种尺寸,适配各场景,各尺寸均为SOTA水平;Qwen 3 - 235B - A22B测评超第一梯队大模型,代码能力超Gemini 2.5 Pro;部署成本低,仅需4张H20即可部署满血版 [15] - 模型应用侧优化:国内首个混合推理模型,集成深度思考与快速回答功能,支持调整回答思考长度;agent调用性能好,接入MCP协议,可调用即梦生图功能;支持119种语言和方言,利于小语种国家AI应用开发和模型出海 [18] 百度召开AI开发者大会,发布多项AI重磅更新 - 4月25日,百度召开大会,发布文心4.5 turbo与推理模型X1 turbo,及AI模型、应用与生态的九大更新 [19] - 新一代大模型降本提质:文心4.5 turbo多模态能力升级,文本和多模态能力达行业第一梯队;X1 turbo思维链等能力升级,总体表现优;文心大模型4.5 Turbo价格降80%,仅为DeepSeek V3的40%,文心大模型X1 Turbo价格再降50%,仅为DeepSeek R1的25% [21] - 其他更新:算力侧点亮国内首个全自研3万卡集群,提升稳定性、芯片利用率并降低能耗;应用侧发布高说服力数字人,新增剧本生成和AI大脑功能,降低使用门槛;代码智能体包含文心快码comate与秒哒;通用AI agent心响可一站式解决复杂问题,接入MCP服务 [24][25][28] 本期AI动态跟踪 算力基建 - 4月25日中央政治局进行人工智能集体学习,凸显人工智能核心地位,习近平强调发挥举国体制优势,推动人工智能健康发展,明确技术、应用、政策端工作部署,预计未来有多重政策落地 [32][33] - 英伟达4月14日宣布与台积电、富士康等合作,未来四年在美国本土生产价值5000亿美元的AI基础设施 [35] AI大模型 - 2024年以来大模型发布提速,国内互联网大厂等加大AI投入,模型快速迭代升级,AI渗透率进入爬坡期 [36] - DeepSeek发布DeepSeek - prover - V2数学推理模型,在数学推理上表现领先 [39] - 4月30日小米发布首个推理模型Xiaomi MiMo,7B参数规模在数学和代码推理测评上超越部分模型,可在端侧部署 [41] - 4月17日字节发布豆包1.5深度思考模型与豆包文生图3.0模型,推理与文生图能力达全球第一梯队水平 [45] 算法技术 - 4月19日快手Kwaipilot团队发布创新强化学习算法SRPO,训练步数仅为DeepSeek的1/10,在数学和代码bench测试中超越DeepSeek - R1 - Zero - 32B,拓宽了强化学习算法能力边界 [51] AI应用 - 4月18日字节跳动新通用AI agent产品扣子空间开始内测,提供两种模式,强化解决工作任务能力,未来会随用户反馈迭代,国内AI agent处于快速迭代竞争阶段 [56] - 本周AI应用数据跟踪:4月14 - 20日,国内AI应用web端访问量前三为DeepSeek、夸克、豆包;全球前三为ChatGPT、Canva、DeepSeek。3月Web端访问量数据,各应用场景有不同Top3产品。3月国内AI应用app端MAU前三为夸克、豆包、DeepSeek;全球前三为ChatGPT、夸克、豆包。4月28日 - 5月4日,应用免费榜Top10中有豆包、DeepSeek、夸克 [61][64][70] 本周行情跟踪 - 本周恒生科技指数上涨5.24%至5244.06点,成分股涨幅前五为金蝶国际、金山软件、小米集团 - W、阿里健康、商汤 - W;跌幅前五为比亚迪电子、百度集团 - SW、小鹏汽车 - W、蔚来 - SW、腾讯控股 [79] - 本周传媒板块成分股涨幅前五为山东出版、冰川网络、上海电影、盛天网络、完美世界;跌幅前五为中广天择、*ST返利、芒果超媒、横店影视、生意宝 [81] - 互联网板块重点公司行情跟踪:截至5月2日,各公司有不同收盘价、周度涨跌幅、月度涨跌幅、年初至今涨跌幅及PE值 [86] 投资建议 - 看好AI新周期带动算力 - 算法 - 应用生态三端依次持续推进,建议增加港股互联网板块配置仓位,核心推荐阿里巴巴 - W、快手 - W、腾讯控股、百度集团 - SW [3][87]
AI应用催化不断,重点提示机会
江海证券· 2025-04-18 15:26
报告行业投资评级 - 行业评级为增持(维持) [1] 报告的核心观点 - 豆包大模型日均tokens调用量持续大幅攀升,利好数据要素和算力板块 [4] - 持续看好AI应用投资机会,提示重点关注汉得信息、创业黑马、合合信息等 [10] 根据相关目录分别进行总结 行业表现 - 近十二个月,行业1个月相对收益-6.58%、绝对收益-12.42%;3个月相对收益1.3%、绝对收益0.56%;12个月相对收益8.21%、绝对收益15.65% [2] 相关事件 - 2025年4月17日,火山引擎发布豆包1.5·深度思考模型,升级豆包·文生图模型3.0、豆包·视觉理解模型;面向Agent服务,发布OS Agent解决方案、GUI Agent大模型--豆包1.5·UI-TARS模型;面向大规模推理,发布AI云原生·ServingKit推理套件 [3] 豆包大模型调用量情况 - 截至2025年3月底,豆包大模型日均tokens调用量超12.7万亿,是2024年12月的3倍,是一年前发布时的106倍;2024年中国公有云大模型调用量激增,火山引擎以46.4%的市场份额位居中国市场第一 [4] 豆包1.5·深度思考模型 - 全新发布,采用MoE架构及双轨奖励机制;在数学、代码、科学等专业领域推理任务中表现出色,达到或接近全球第一梯队水平;在创意写作等非推理任务中,展示出优秀泛化能力;优化数据处理策略,融合处理可验证数据与创意性数据;采用创新双轨奖励机制,兼顾不同任务优化算法;总参数200B,激活参数仅20B,有训练和推理成本优势;提供行业极高并发承载能力,实现20毫秒极低延迟;豆包APP基于该模型定向训练可“边想边搜”,还具备视觉理解能力 [5][6] 豆包·文生图模型3.0 - 全新升级,能实现更好文字排版表现、实拍级图像生成效果和2K高清图片生成方式;可广泛应用于影视、海报等场景;在文生图领域权威榜单Artificial Analysis竞技场中,排名全球第一梯队 [7][8] 豆包·视觉理解模型 - 全新升级,具备更强视觉定位能力,支持多目标等定位及相关操作,可应用于线下门店巡检等场景;视频理解能力大幅提升,结合向量搜索可直接对视频进行语义搜索,适用于安防等商业化场景 [9] 火山引擎发布的其他内容 - 认为未来AI Agent将在应用Agent和OS Agent两个方向并行发展;发布OS Agent解决方案,通过veFaaS平台封装豆包大模型能力,便于企业和开发者构建轻量级应用;发布GUI Agent大模型——豆包1.5·UI-TARS模型,突破传统自动化工具依赖预设规则的局限;推出ServingKit推理套件,助力企业实现模型快速部署、推理优化及运维可观测,可在2分钟内完成671B DeepSeek R1的下载和预热,13秒内完成推理引擎加载 [10]
AI动态跟踪系列(六):OpenAIo3、豆包新品首发,关注原生Agent与多模态推理
平安证券· 2025-04-17 21:10
报告行业投资评级 - 强于大市(维持) [1] 报告的核心观点 - 近期新模型解题思路在思维链CoT基础上更重视模型原生Agent能力和多模态推理能力,全球大模型领域竞争激烈,看好AI主题投资机会 [3][34] - 当前Agent在企业端落地进度靠前,AI应用关注OA/ERP/编程/办公等领域,Agent拉动推理端及整体算力需求,看好国产AI算力产业链 [3][34] 根据相关目录分别进行总结 OpenAI o3、o4 - mini新增图像深度思考与Agent能力,Codex CLI智能体开源推动AI编程生态开放 - 4月17日OpenAI发布o3和o4 - mini,是其迄今最智能模型,核心突破在于图像深度思考和Agent能力 [3][4] - o3是强大推理模型,在多方面推动前沿发展,在多个基准设新SOTA,困难现实任务重大错误比o1少20% [5] - o4 - mini针对快速、经济高效推理优化,在数学、编码和视觉任务表现好,非STEM任务及数据科学领域优于o3 - mini [5] - 图像推理方面,o3和o4 - mini首次在思维链中用图像思考,实现高级推理与多工具无缝结合,o3提供多模态代理体验 [9] - Agent方面,o3和o4 - mini可访问ChatGPT工具及自定义工具,能推理解决问题并快速生成答案 [10] - o3和o4 - mini性价比高于前身,预计实际使用更智能、便宜 [12] - OpenAI发布轻量级编程智能体Codex CLI,支持零配置启动,运行安全,可让用户从命令行体验多模态推理 [15] 豆包1.5·深度思考模型对标全球推理模型第一梯队,视觉理解模型实现更强视觉定位能力 - 4月17日火山引擎发布豆包1.5·深度思考模型等新品,推理模型性能达或接近全球第一梯队,增加视觉理解能力,APP可“边想边搜” [3][17] - 多模态方面,豆包·文生图模型3.0在权威榜单排全球第一梯队,新版本豆包·视觉理解模型视觉定位和视频理解能力提升 [17][28] - 企业级服务方面,发布OS Agent、GUI Agent大模型(豆包1.5·UI - TARS)和AI云原生·ServingKit推理套件 [17] - 截至2025年3月底,豆包大模型日均tokens调用量超12.7万亿,是2024年12月的3倍、发布时的106倍,2024年火山引擎公有云大模型调用量市场份额46.4%居中国第一 [18] - 豆包1.5·深度思考模型采用MoE架构,总参数200B,激活参数20B,有高并发承载能力和20毫秒极低延迟 [21] - 豆包APP基于该模型定向训练实现“边想边搜”,如推荐露营装备经3轮搜索给出细致推荐 [24] - 该模型具备视觉理解能力,可用于国外餐厅点餐、分析航拍地貌、企业项目管理等 [27] - OS Agent解决方案可让企业和开发者构建轻量级应用,复杂应用可调用豆包1.5·UI - TARS模型,该模型已上线火山方舟平台 [32] - ServingKit推理套件可助企业快速部署模型、优化推理、运维可观测,能提高KV cache命中率和TPS吞吐量,降低GPU消耗 [33] 投资建议 - AI应用方面,AI + 企服建议关注泛微网络、致远互联等;AI + 办公推荐金山办公、福昕软件等,建议关注合合信息 [3][34] - AI算力方面,推荐海光信息、龙芯中科等,建议关注寒武纪、景嘉微等 [3][34]