工业大模型落地提速，垂类应用亟待打破“数据烟囱”

行业背景与政策驱动 - 全球经济下行与地缘政治复杂化背景下，工业行业面临利润率低、市场需求变化快的压力，通过数字化挖掘降本增效潜力、提升制造业柔性生产能力成为产业转型升级的迫切需求[1] - 2024年12月全国工业和信息化工作会议强调，2025年要推进信息化和工业化深度融合，实施“人工智能+制造”行动，加强通用大模型和行业大模型的研发布局与重点场景应用[1] - 2024年12月上海印发《关于人工智能“模塑申城”的实施方案》，提出推动基于行业语料库研发L1模型，挖掘共性超级场景向上下游规模化推广，并推动建设模型即服务平台，形成行业L2大模型池[5] 工业大模型应用面临的挑战 - 工业生产场景复杂且需求多元，需要将大模型能力与生产的实际需求相匹配[1] - 当前许多大模型，尤其是大语言模型，未能有效解决“幻觉”问题，导致其输出结果对企业而言缺乏精准性与可靠性[1] - 工业大模型的应用落地需要工业技术与信息化两方面专业能力的协同支撑，工业企业与数字化企业如何打破隔阂、针对不同工况和需求进行专门设计，直接决定最终的应用效果[9] 数据基础与“数据烟囱”问题 - 数据是工业数字化过程中最重要的资源，其重要性随AI大模型在工业领域的广泛落地而愈加凸显[3] - 工业垂类大模型训练对数据量要求高：应用于工业场景的视觉大模型，简单场景需至少数百张工业图像，复杂场景可能需要上千乃至上万张；工业场景的语言大模型一般也需要千个以上问答对语料数据[3] - 对于复杂前沿工业门类场景，可能需要多模态大模型支撑，通常需亿级以上规模的数据集，模型效果与数据量强相关，例如Meta的蛋白质预测模型ESMFold使用了1.25亿蛋白质分子结构数据进行训练[3] - 中国制造业前期信息化工作多基于阶段性外在需求叠加，缺乏内生的数字化长期规划，导致企业系统内部存在大量“数据烟囱”，不同系统、业务板块的数据割裂，无法形成实时的决策价值[4] - 提升工业大模型质量、赋能工业数字化的直接问题在于如何打通企业系统间的“数据烟囱”，提升工业数据的流通性和利用率[3] 市场机遇与增长预测 - 不断增长的降本增效需求与多变的市场环境为“AI+工业”带来广阔的市场空间，我国大部分工业行业仍处于劳动密集型发展阶段，较低的智能化渗透率带来误差率高、生产效率低、生产成本高等痛点[7] - 据德勤预测，2018-2025年中国制造业人工智能市场有望实现51%的复合年均增长率，并在2025年达到141亿元规模[7] 技术发展趋势与赋能路径 - 算法、语料和算力三项大模型要素在工业领域的应用中衍生出各自特征：算法方面，工业大模型与专用小模型成为工业AI发展的两条协同路径，通用基模、RAG、Agent将是大模型赋能工业的三种形态[7] - 语料方面，工业大数据将成为AI落地的关键，生成式AI将为工业知识沉淀和传承提供有力支持[7] - 算力方面，工业算力智能分配成为关键，云/端协同计算成为未来趋势[7] - 企业需首先建立对自身核心业务与数据的认识，做好数智化流程的工程设计，在此基础上引入大模型，才能最大程度发挥其降本增效作用，完成从“数据沉睡”到“数据燃料”的质变[4] 应用实践与效能提升 - 当前诸多工业垂类大模型已在生产制造中发挥效果，最直观的变化是工作效率的提升，例如在研发创新环节的图纸设计中，原先依靠工程师手动制图需实践两小时以上，接入大模型后，AI可在3分钟内完成中间具体做法，整个效能大大提升[8] - 未来的发展方向是，当AI数智驱动能力成长到一定阶段后，许多场景将以AI数智原生的角度进行设计，大部分甚至所有工作流程将不再依赖于人，进一步提升生产效率[8]