报告行业投资评级 - 行业评级为“买入” [2] 报告的核心观点 - 核心观点:科技公司的分化正在从商业模式竞争向硬科技实力竞争方向倾斜,大模型的崛起意味着中国科技产业可能迎来了继移动互联网之后、十余年来又一次由技术本身主导竞争格局的关键时刻,竞争的重心正在从商业模式转向底层硬实力 [5][79] - 核心观点:火山引擎发布的豆包大模型在多模态理解与智能体执行力上与Qwen3比肩,其日均Tokens使用量快速增长,商业化路径逐渐清晰 [5] - 核心观点:阿里千问APP接入高德地图,使得AI助手获得了对物理世界的理解与行动能力,实现了从“理解用户意图”到“执行具体服务”的跨越,迈出了构建超级Agent的关键一步 [5][56][74] 根据相关目录分别进行总结 一、豆包大模型TOKENS持续增长,推理和应用驱动算力增长 - 截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较2025年9月的30万亿大幅增长,自发布以来增长417倍 [5][14] - 2025年9月至12月,豆包大模型Tokens使用量的月度平均增速为22%,与2025年5月至9月的月度平均增速21%基本持平 [14] - 豆包大模型1.8版本的Tokens调用价格与1.6版本持平,但通过Token效率优化、减少多轮重试与无效推理等方式降低了冗余算力消耗,在单位推理成本降低的趋势下,应用端算力成本消耗的增速或低于Tokens的增速 [5][15] - 豆包大模型采用超稀疏MoE架构,将单层级训练速度最高提升1.96倍,端到端效率平均提升1.71倍,并通过多模态联合训练、分阶段预训练+定向微调等方式降低训练阶段算力成本 [20] - 未来AI算力需求增长的驱动力将更多来自模型推理和应用落地,国产AI芯片(如寒武纪)和服务器(如浪潮信息、紫光股份)以及基础软件工具(如第四范式、星环科技)有望受益于推理侧算力占比的提升 [20][24] 二、豆包大模型性能提升较大,产品功能多维度增强 (一)豆包大模型1.8 - 豆包大模型1.8在工具调用、复杂指令遵循及OS智能体等关键维度均实现显著增强,在多模态理解与智能体执行力上与Qwen3比肩 [5][32] - 在基础数学与推理能力测试中,豆包模型分别以94.3对87.2、83.8对79.8的得分领先于Qwen3-235B-a22b-thinking模型 [27][29] - 其视觉能力升级至支持单次1280帧视频解析,并能通过低帧率模式处理超长视频 [28] - 在多模态评估中,豆包1.8在MMMU-Pro基准获73.2分,且在通用视觉问答、文档图表理解及动作感知等任务中保持领先于Qwen3-VL [28][30] (二)视频生成模型Seedance 1.5 Pro - Seedance 1.5 Pro基于原生音视频联合生成架构,实现音画同步精度达到毫秒级,口型高精度对齐 [33] - 其Draft样片功能可生成低分辨率预览视频,关键要素与成片高度一致,有望提升创作效率65%,减少约60%无效成本 [33] - 根据官方评测,Seedance 1.5 Pro在音频质量、同步性及表现力等全维度评估中,凭借“声画一体”的原生架构优于Kling 2.6与Veo 3.1 [5][37] (三)图像创作模型Seedream 4.5和语音识别模型2.0 - Seedream 4.5模型在主体一致性、指令遵循精准度、空间逻辑理解及美学表现力等方面实现迭代 [43] - 豆包语音识别模型2.0的上下文整体关键词召回率提升20%,并且支持多模态视觉识别,通过视觉信息输入让文字识别更精准 [43] (四)总结 - 截至2025年12月18日,豆包大模型日均tokens使用量已突破50万亿,而2024年12月该数据为4万亿 [47] - 目前已有超过100家企业在火山引擎上累计Tokens使用量超过一万亿 [47] - 豆包大模型迭代节奏快速,以数月级版本更新为常态,并通过与字节内部业务(如抖音、飞书)深度结合形成较强的迭代动力 [51] 三、千问APP接入高德,超级Agent从意图理解向现实世界服务执行跨越 - 千问APP公测后一周下载量破1000万,仅23天月活用户数突破3000万 [53] - 2025年12月18日,千问APP正式接入高德地图,基于高德的扫街榜、实时路况等能力,可为用户智能推荐餐厅、规划最优出行路线 [5][56] - 实测比较显示,在出行游玩规划、路线时长估计、餐厅推荐等生活场景中,千问APP因能直接调用高德服务,提供包含实时数据、可执行链接和结构化建议的答案,其可执行性和便利性优于豆包APP和DeepSeek APP [58][59][62][66][68][71] - 通过APP授权打通能力边界是构建超级Agent当前可行度较高、落地速度较快的整合路径,高德能力的快速上线验证了该路径的成熟度 [74] - 报告预期,随着千问APP持续迭代,淘宝、飞猪等阿里系核心应用可能陆续融入,形成以意图为中心调用服务的统一智能入口,这可能对现有APP的流量与角色分工带来结构性变化 [75]
计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态格局新基石
广发证券·2025-12-19 21:51