Workflow
以产业大脑为例:从大模型、智能体到复杂AI应用系统的构建
浙江大学·2025-03-25 14:12

报告行业投资评级 未提及 报告的核心观点 新一代大模型推理能力不断增强,基于高质量小数据集可训练专业领域高性能低成本推理模型,通过智能体可基于大模型实现复杂智能应用系统,“推理大模型 + 知识图谱(知识库) + 智能体”或成未来AI系统开发和应用范式 [146] 各部分总结 大模型推理能力快速提升 - 大模型由机器学习、神经网络以及Transformer模型等多种技术模型积累产生,ChatGPT是针对人类反馈信息学习的大规模预训练语言模型,其发布标志对话式AI进入大众应用阶段 [7][9][10] - AI从1.0时代的辨别式AI发展到2.0时代的生成式AI,大模型能力不断增长,参数量从百亿到万亿规模,在多任务上表现超人类水平 [13][18] - 早期大模型推理能力存在短板,易产生幻觉,在数学推理方面表现为简单数值比较错误、多步推理能力弱、推理不一致等 [19][23] - 2023 - 2024年,OpenAI o1/o3、DeepSeek - R1等模型推理能力取得突破性进展,o1在数学和代码问题上超越人类专家,DeepSeek - R1在MATH基准上准确率达87.2% [30][31] 推理模型和思维链 (CoT) - 推理大模型通过测试时拓展、强化学习、蒸馏等技术增强推理能力,如OpenAI o1专注复杂推理任务,o3能模拟推理反思思考过程,Claude3.7是混合推理模型等 [38][39] - 思维链是逐步分解复杂问题的思考过程,DeepSeek - R1是首个将思维链显式展示的开源模型 [40][47] - 通过在小规模数据集上微调并结合预算强制技术,或使用少量高质量样本,可低成本实现推理模型 [48][50] 智能体 (AI Agent) 是什么 - 智能体是大模型的眼和手,能让大模型运用工具与物理世界互动并拥有记忆能力,弥补大模型不足 [64][97] - 以撰写调研报告为例,智能体可通过任务拆解、调用工具等完成复杂任务,其五层基石理论包括Models、Prompt Templates、Chains、Agent、Multi - Agent [67][77][79] - HuggingGPT是大小模型协作的生成式智能体,大模型负责规划决策,小模型负责任务执行,在学术界、开源社区和工业界有较大影响力 [84][86][93] 四链融合产业大脑案例 - 产业认知决策面临国家战略需求,产业竞争从分段互补合作转为争夺主导权和卡脖子技术,精准识别“卡脖子”问题清单至关重要 [100][101][102] - 产业发展决策有广阔社会需求,战略产业和未来产业对产业信息智能分析需求增长,但各地各行业在产业布局中存在选择困难 [104][107][109] - AI推动“科技创新”和“产业创新”深度融合,产业经济面临机遇和挑战,产业网链大模型可解决部分问题 [110][112][116] - 产业网链大模型以通用中文大模型为基座,注入海量产业数据和知识图谱训练得到,具有多种能力,可提供专业产业知识服务 [114][127] - 四链融合知识计算引擎包括SupXmind基础平台和产业垂域大模型iChainGPT,为产业创新提供支持 [125][126] - 典型应用场景包括省级、市域、产业集群的四链融合决策应用实践,如浙江省产业一链通、宁波市产业链智能创新平台、中国视谷产业大脑等 [130][131][138]