多模态技术 - 财报，业绩电话会，研报，新闻

多模态技术

搜索文档

2025年度AI十大趋势报告-量子位

搜狐财经· 2025-12-16 10:53

核心观点 2025年AI领域呈现“基建夯实、模型迭代、应用爆发、中国崛起”的格局[3] 技术从算力基建到产业落地发生全链条变革[1] 中国在开源生态与自主可控路线上崛起，成为全球AI格局的关键力量[1][3] 基础设施 - 全球科技巨头正投入史无前例的资金建设超大规模数据中心，例如谷歌“星际之门”计划投入超过1000亿美元，微软AI超级园区投入73亿美元，谷歌AI枢纽投入400亿美元[14] - 中国通过“东数西算”国家工程，将东部算力需求与西部可再生能源结合，推进国家级算力规划[16] - 资本开支从采购标准化服务器转向建设由数万块高端GPU组成的“超节点”和“超级群”，以训练和运行大型AI模型[19] - GPU因其强大的并行计算能力，仍是AI训练领域事实上的标准，但其稀缺性和高昂价格促使行业寻求新方案[23] - NPU已成为智能手机、PC和物联网等端侧设备的标配，以实现低功耗、低延迟的AI推理[24] - 中国正加速推进AI芯片国产替代，华为、寒武纪等企业研发高性能AI芯片，并通过与自研模型、SDK协同，已实现千亿级参数模型训练的自主可控[1][27] 模型进化 - 预训练架构创新成为关键，MoE混合专家模型凭借“大参数、小激活”特性平衡性能与成本，成为主流架构[1] - 国内主要模型如GLM-4.6（总参数355B，激活参数32B）、通义千问Qwen3（总参数235B，激活参数22B）、DeepSeek V3.2（总参数671B，激活参数37B）等均采用MoE架构并实现开源[1][32] - 研究者正探索线性注意力和稀疏注意力等超越Transformer的新架构，以突破其二次方计算复杂度O(n²)的瓶颈，提升长文档、视频理解等任务的计算效率[31] - 模型蒸馏技术将大模型知识“蒸馏”到更小模型中，对于将AI能力部署到手机、汽车等算力受限的边缘设备至关重要[33] - 人类反馈强化学习技术已成为训练ChatGPT等对话式AI模型的标准流程，用于提升模型在代码生成、摘要等复杂任务上的表现，并使其输出更符合人类价值观[35] - 2025年模型推理能力提升集中在三大方向：多模态深度推理、自适应推理以及硬件加速优化[39] - 具身智能成为热门赛道，人形机器人开始进入工业与家庭场景，VLA模型与世界模型成为技术主流[1] 应用版图 - Agentic互联网重塑流量入口，从“人找服务”转向“服务找人”，多Agent协作框架降低开发门槛，推动复杂任务闭环执行[2] - 多模态技术落地加速，视频、3D、代码生成依次释放生产力，成为影视、游戏、软件开发等行业的标准工具[2] - AI硬件全面爆发，AI PC、智能穿戴设备、AI玩具等百端齐放，端侧AI凭借低延迟、高隐私优势快速普及，重塑人机交互方式[2] - AI4S成为新增长点，在医疗诊断、材料研发、基因分析等领域实现突破，部分模型数理化能力达到博士水平[2] - 腾讯DeepGEM病理大模型提升肺癌诊疗精准度，自变量机器人在具身智能领域跻身全球第一梯队，零一万物通过产业大模型赋能物流等行业场景[2] 中国路线 - 开源AI进入“中国时间”，DeepSeek、Qwen等模型在全球开源社区下载量稳居前列，形成国际影响力[2] - 国家将AGI纳入顶层设计，科技巨头与初创企业从应用转向核心技术研发[2] - 中国构建“国产芯片+自研模型+自主SDK”的全栈生态，实现技术自主可控[1][2]