计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态
搜狐财经·2025-12-29 01:08

行业核心观点 - 生成式人工智能行业的竞争重心正从商业模式创新转向底层硬科技实力的竞争,头部企业凭借长期技术积累与生态整合推动行业发展 [2][3] - 大模型的发展愈发依赖基础研究积累、算力工程能力和算法创新,这些要素难以速成,标志着中国科技产业可能迎来了继移动互联网之后又一次由技术本身主导竞争格局的关键时刻 [3][11] 豆包大模型进展 - 性能与功能增强:2025年12月18日,火山引擎发布豆包大模型1.8,在工具调用、复杂指令遵循及OS智能体等关键维度实现显著增强,其多模态理解与智能体执行力已与Qwen3比肩,在数学推理、长视频解析及文档图表理解等核心场景表现突出 [2][11][32] - 视频生成模型升级:同期发布的视频生成模型Seedance 1.5 Pro凭借“声画一体”原生架构,在音频质量、同步性及表现力等全维度评估中优于Kling 2.6与Veo 3.1,其Draft样片功能可提升创作效率65% [2][11][38] - 模型家族扩充:火山引擎还发布了图像创作模型Seedream 4.5和语音识别模型2.0,后者上下文关键词召回率提升20%,并支持多模态视觉识别 [2][48] - 使用量与商业化:截至2025年12月18日,豆包大模型日均Tokens使用量已突破50万亿,较2025年9月的30万亿大幅增长,在单位推理成本降低的趋势下,商业化路径逐渐清晰 [2][11][20] - 技术优化与成本:豆包大模型1.8在价格与1.6版本持平的基础上,针对多模态Agent场景定向优化,减少多轮重试与无效推理以降低冗余算力消耗 [11][21] - 训练架构创新:模型采用计算-通信细粒度重叠的MoE训练架构,将单层级训练速度最高提升1.96倍,端到端效率平均提升1.71倍,并通过多模态联合训练、分阶段预训练等方式降低训练阶段算力成本 [26] 千问APP与高德整合 - 用户增长:千问APP公测后表现亮眼,上线23天月活用户即突破3000万,公测后一周下载量破1000万 [3][56] - 生态整合:2025年12月18日,阿里宣布千问APP正式接入高德地图,使得AI助手获得对物理世界的理解与行动能力,实现从“理解用户意图”到“执行具体服务”的跨越 [3][11][57] - 应用场景:借助高德的实时路况、扫街榜等数据,千问APP可智能规划出行路线、推荐餐厅,并支持多需求协同处理,实测显示其在出行游玩路线规划等场景能提供结构化答案、实时数据支撑及可直接执行的操作链接 [3][11][57] - 生态扩展潜力:这种通过APP授权整合服务的模式,为后续接入淘宝、飞猪等更多阿里系应用奠定了基础,有望构建覆盖多元场景的超级Agent生态 [3] 行业趋势与投资方向 - 算力需求变化:AI算力需求增长的驱动力将更多来自模型推理和应用落地,而非训练阶段 [26] - 国产算力受益:推理侧算力占比提升,使得对硬件性能要求较低的推理任务更有利于国产AI芯片和服务器(如寒武纪、浪潮信息、紫光股份)以及基础软件工具(如第四范式、星环科技)的发展 [30] - 超级Agent应用:随着超级AI Agent深度介入出行、本地生活、消费与支付场景,具备地图与交通数据、企业数字化与AI应用落地相关的公司(如聚水潭、光云科技、石基信息等)均有望受益 [11]

计算机行业GenAI系列(二十三):火山多模态和千问高德:硬核能力成生态 - Reportify