西安交大丁宁:大模型是“智能基建”,资本与技术融合重塑AI版图
21世纪经济报道·2025-11-11 07:12

行业宏观定位 - 当前处于以人工智能和大数据为代表的第四次工业革命,人工智能有望成为未来世界不可或缺的核心技术 [1] - 2022年底ChatGPT的出现标志着人工智能发展的转折点,开启了大模型的产业化竞争 [2] 大模型技术演进趋势 - 大模型发展从早期盲目追求参数量扩张回归理性,转向注重结构设计、训练方法和数据质量 [2] - 模型性能提升遵循“规模法则”,即参数量、算力和数据规模增加与性能提升呈幂律关系,但成本能耗等因素促使行业转向结构创新和精细训练 [2] - 模型正从单模态(仅文本)向图像、语音、代码等多模态融合演进,使AI能感知和生成来自不同世界的信息 [2][3] - 训练方式从“预训练+监督微调”向持续学习和参数高效微调演化,目标是用更少算力实现更快适配,推动AI从技术突破走向可负担的产业落地 [3] - 主流大模型仍以Transformer架构为基础 [3] 技术与资本互动关系 - 资本是技术的放大器,技术是资本的倍增器,大模型训练前期成本极高,需资本介入才能形成高质量基础模型 [1][4] - 没有技术洞见和研发积累,资本也难以真正驱动产业升级 [4] 全球竞争格局与中国现状 - 美国在头部企业、算力中心和生态层面仍领先 [4] - 中国在人工智能领域论文数量占全球41%,专利数全球占比达到69% [4] - 算力是制约中国AI发展的关键瓶颈,模型“幻觉”、表达精度不足、产业链协同难等问题仍待突破 [4] 未来发展方向 - 多模态融合,即文字、图像、语音、传感数据全面打通 [4] - 大规模与轻量化并行,在追求能力极限的同时推动端侧部署 [4] - 发展具身智能,使AI与物理世界交互,催生机器人新生态 [4][5] - 探索通用人工智能(AGI),使其具备通用认知和自学习能力,成为长期目标 [5] - 超级智能是更前瞻的概念,指超过最有天赋人类的系统,目前仍处于理论探讨阶段 [5]