Workflow
icon
搜索文档
以产业大脑为例:从大模型、智能体到复杂AI应用系统的构建
浙江大学· 2025-03-25 14:12
报告行业投资评级 未提及 报告的核心观点 新一代大模型推理能力不断增强,基于高质量小数据集可训练专业领域高性能低成本推理模型,通过智能体可基于大模型实现复杂智能应用系统,“推理大模型 + 知识图谱(知识库) + 智能体”或成未来AI系统开发和应用范式 [146] 各部分总结 大模型推理能力快速提升 - 大模型由机器学习、神经网络以及Transformer模型等多种技术模型积累产生,ChatGPT是针对人类反馈信息学习的大规模预训练语言模型,其发布标志对话式AI进入大众应用阶段 [7][9][10] - AI从1.0时代的辨别式AI发展到2.0时代的生成式AI,大模型能力不断增长,参数量从百亿到万亿规模,在多任务上表现超人类水平 [13][18] - 早期大模型推理能力存在短板,易产生幻觉,在数学推理方面表现为简单数值比较错误、多步推理能力弱、推理不一致等 [19][23] - 2023 - 2024年,OpenAI o1/o3、DeepSeek - R1等模型推理能力取得突破性进展,o1在数学和代码问题上超越人类专家,DeepSeek - R1在MATH基准上准确率达87.2% [30][31] 推理模型和思维链 (CoT) - 推理大模型通过测试时拓展、强化学习、蒸馏等技术增强推理能力,如OpenAI o1专注复杂推理任务,o3能模拟推理反思思考过程,Claude3.7是混合推理模型等 [38][39] - 思维链是逐步分解复杂问题的思考过程,DeepSeek - R1是首个将思维链显式展示的开源模型 [40][47] - 通过在小规模数据集上微调并结合预算强制技术,或使用少量高质量样本,可低成本实现推理模型 [48][50] 智能体 (AI Agent) 是什么 - 智能体是大模型的眼和手,能让大模型运用工具与物理世界互动并拥有记忆能力,弥补大模型不足 [64][97] - 以撰写调研报告为例,智能体可通过任务拆解、调用工具等完成复杂任务,其五层基石理论包括Models、Prompt Templates、Chains、Agent、Multi - Agent [67][77][79] - HuggingGPT是大小模型协作的生成式智能体,大模型负责规划决策,小模型负责任务执行,在学术界、开源社区和工业界有较大影响力 [84][86][93] 四链融合产业大脑案例 - 产业认知决策面临国家战略需求,产业竞争从分段互补合作转为争夺主导权和卡脖子技术,精准识别“卡脖子”问题清单至关重要 [100][101][102] - 产业发展决策有广阔社会需求,战略产业和未来产业对产业信息智能分析需求增长,但各地各行业在产业布局中存在选择困难 [104][107][109] - AI推动“科技创新”和“产业创新”深度融合,产业经济面临机遇和挑战,产业网链大模型可解决部分问题 [110][112][116] - 产业网链大模型以通用中文大模型为基座,注入海量产业数据和知识图谱训练得到,具有多种能力,可提供专业产业知识服务 [114][127] - 四链融合知识计算引擎包括SupXmind基础平台和产业垂域大模型iChainGPT,为产业创新提供支持 [125][126] - 典型应用场景包括省级、市域、产业集群的四链融合决策应用实践,如浙江省产业一链通、宁波市产业链智能创新平台、中国视谷产业大脑等 [130][131][138]
计算机行业DeepSeek:智能时代的全面到来和人机协作的新常态
浙江大学· 2025-03-13 11:04
表:主要数据集大小汇总,以GB为单位。公开的数据集以粗体表示, 确定的数据以斜体表示。Common Crawl数据集过滤之前为45T DeepSeek 智能时代的全面到来和人机协作的新常态 孙凌云 教 授 计算机科学与技术学院 2025年2月 一、智能演变 二、人机协作 三、产业现状 四、教育成长 到 2020 年的 GPT-3, 模型预训练数据量从 4.6GB 增加到了 45TB 45TB 相当于三千万本《西游记》 主要模型数据集包括: 来源: OpenAI团队,Language Models are Few-Shot ,2022年7月22日 | | 维基 百科 | 书籍 | 杂志 期刊 | Reddit 链接 | Common Crawl | 其他 数据 | 总计 | | --- | --- | --- | --- | --- | --- | --- | --- | | GPT-1 | | 4.6 | | | | | 4.6 | | GPT-2 | | | | 40 | | | 40 | | GPT-3 | 11.4 | 21 | 101 | 50 | 570 | | 753 | | The Pile v ...
2024基于机理与人工智能混合驱动的新型电力系统智能分析与调控策略研究报告
浙江大学· 2024-08-19 09:25
报告行业投资评级 无相关内容。[无] 报告的核心观点 1. 新型电力系统的主要特征包括高比例可再生能源并网、高比例电力电子设备化、大量储能设备接入、负荷侧响应资源以及电力市场新规则等。[5][7][8] 2. 新型电力系统运行的主要挑战包括电网运行的动态性、随机性和不确定性显著增强,给电网在线安全稳定性控制带来巨大挑战。[8] 3. 针对新型电力系统的挑战,需要快速准确的在线安全评估方法、有效的在线安全智能调度控制方法、以及基于有限经验与模型仿真的离线策略难以达到最优效果的问题。[8] 报告内容总结 应用1:多时间维度功率预测 1. 开发基于监督式学习的多时间、空间维度功率预测技术,包括负荷、电动车充电、光伏、风电等。[34][35] 2. 该技术可以实现15分钟前、1小时前、4小时前和24小时前的功率预测,并具有较高的预测准确率(97%-98.3%)。[37][39] 应用2:基于无监督式学习的负荷聚类分析 1. 开发基于人工智能的方法进行有效的负荷聚类、关键特征和成分识别。[40][41] 2. 该方法可以通过聚类分析有效识别出居民负荷、工商业负荷等不同类型的负荷特征。[41] 应用3:基于深度强化学习算法的自主安全控制 1. 开发基于深度强化学习的电网自主安全控制技术框架,可以实现电网状态估计、故障诊断、自主调控等功能。[50][54][55][56] 2. 该技术在江苏电网的应用中,可以有效解决电压越限问题,降低主干网络功率损耗,并且智能体的调控性能不断提升。[70][75][76] 应用4:基于强化学习的意志性模型自动调参 1. 开发基于强化学习的发电机和励磁模型关键参数自动校验技术,可以提高模型的准确性。[82][83][94][95] 2. 该技术可以通过训练智能体自动搜索高维模型参数空间,使得模型与实测数据更好匹配。[85][86] 应用5:基于深度强化学习的电网经济运行方式 1. 开发基于深度强化学习的电网经济运行方式优化技术,可以在满足电压约束条件下,最小化发电成本。[97][98][99][100][101][102][103][104][105][106][107] 2. 该技术可以训练DQN智能体搜索最优的电网运行点,并在IEEE 14节点系统上进行了验证。[102][103][104][105] 应用6:分布式资源管理与控制 1. 开发基于虚拟电厂的分布式资源管理与控制技术,可以实现用户侧光伏、储能等设备与电网的协同互动。[118][119][120] 2. 该技术在香港中华电力和浙江宁波的应用中,可以有效降低配网电压波动、削峰填谷,提高电网经济性和可靠性。[121][135][136][137][139][140]