学习

搜索文档
引新枝竞发 成蔚然之势
环球网· 2025-06-30 08:55
教育强国建设的系统性跃升 - 教育强国建设需要以局部的系统性跃升和质变为支撑,通过集聚政策、资金等资源构筑优越生态来实现[1] - 高校科技成果转化和教育数字化是近期教育部重点推动的两项工作,已取得显著进展[1] 高校科技成果转化 - 教育部在广州举行全国高校区域技术转移转化中心建设工作推进会,强调科技创新和产业创新融合需要大学、企业和资本三要素聚合[3] - 自2022年9月起,教育部推进区域中心建设,首个区域中心(江苏)已产生示范效应,一体推进人才培养、科学研究和技术转移三大任务[3] - 推进会提出要构建"需求同频、资源互通、价值共生"的融合生态,建立以创新贡献为导向的多维评价体系[3] 教育数字化 - 教育部举行数字赋能学习型社会建设主题活动,提出要构建面向未来的新型学习型社会,塑造终身学习新生态[4] - 终身学习新生态需要社会成员具有终身学习愿望,并能便捷获取学习资源和支持,获得正向回馈[4] - 教育数字化战略以"小步快跑、快速迭代"方式推进,在学习型社会建设等任务上取得显著进展[4] 教育改革启示 - 教育改革需要整合成功的个体案例,通过有效的机制设计形成可借鉴的规律性机制[5] - 研究非教育因素,形成高效制度和机制要素,构筑优越发展生态是重要工作方向[5]
市民文化夜校暑期课程上线 推动全民终身学习理念融入城市日常
镇江日报· 2025-06-30 07:33
市民文化夜校暑期班课程设置 - 暑期班共推出83门课程,其中27门为"零门槛・全免费"公益课堂 [1] - 课程采用"商圈+夜校""亲子+夜校""非遗+夜校"创新模式 [1] - 设立28个教学点,部分深入繁华商圈,方便市民在休闲娱乐时参与学习 [1] 课程内容特色 - "商圈+夜校"模式提供古琴入门、民谣吉他演奏等多样化课程 [1] - "亲子+夜校"推出小提琴亲子启蒙、古琴亲子课、少儿茶艺亲子课等艺术类课程 [1] - "非遗+夜校"开设吉祥纹样剪镂、中国结、捏塑入门等非遗传承体验课程 [1] 运营模式与服务 - 市民文化夜校是文化指导师志愿服务模式的深化拓展 [2] - 推动全民终身学习理念融入城市日常,吸引社会力量参与公共文化服务 [2] - 构建"线下体验+线上延展"立体学习网络,同步打造线上管理服务平台 [2] - 线上平台提供涵盖艺术、文化、生活等领域的慕课资源 [2]
感受“丹麦孔子”的教育理念(环球走笔)
人民日报· 2025-06-30 06:01
教育理念与历史背景 - 格伦特维提出"有教无类"的教育理念,倡导平民教育和终身教育,打破贵族阶层对教育的垄断 [1][2] - 19世纪初丹麦面临国家危机,精英阶层垄断教育导致国民素质低下,社会阶层固化严重 [2] - 格伦特维认为民众普遍接受教育才能国富民强,提出教育根本性改革,不设门槛为农民、工人等建立成人高校 [2] 教育实践与影响 - 1844年格伦特维在罗丁创办丹麦第一所成人高校,确立点亮人生、培养公民、学会学习三大任务 [3] - 成人高校采用开放性办学,学生根据兴趣选择课程,学习历史、人文及生存技能,没有考试 [3] - 成人高校启蒙推动丹麦农民提高农产品质量和生产效率,开展合作社运动,增强抵御风险能力 [3] 教育成果与现状 - 格伦特维思想推动丹麦成人高校快速发展,约70所成人高校成为国民教育体系重要组成部分 [3] - 丹麦教育水平全球领先,识字率高达99%,高等教育入学率达85% [3] - 丹麦教育体系在资源投入、教学质量、社会实用性等方面仍体现格伦特维教育思想 [3]
国家终身教育智慧教育平台上线半年——累计服务学习者九百六十三万人次
人民日报· 2025-06-30 05:54
国家智慧教育平台升级 - 国家智慧教育平台2 0智能版近日升级焕新 新增岗位胜任力专区和人工智能专区 促进职场能力提升和推进人工智能全学段教育 [1] - 终身教育智慧教育平台新增六大智能功能 包括智能客服 智能推荐 智能学伴 智能搜索 智能学习导航 智能课程摘要 [1] - 职业教育智慧教育平台升级"职教一问"智能教学助手 提供更智能化学习服务 [1] 平台运营数据 - 国家终身教育智慧教育平台上线半年来累计服务学习者963万人次 其中18—35岁学习者占比达78 [2] - 职场技能类课程在平台上很受欢迎 热门课程排行显示其受欢迎程度 [2] 未来发展规划 - 教育部计划进一步汇聚丰富的终身学习资源 推动学校教育 家庭教育和社会教育互促共进 [2] - 教育部部署开展数字化学习网络构建 高等教育资源数字化升级 自学考试数字化改造 学分银行数字化转型等工作 [2]
【焦点】香港中文大学(深圳) 赵俊华:大模型智能体在电力系统中的应用初探
搜狐财经· 2025-06-29 21:01
人工智能发展历程 - 决策式AI阶段(1950s~1980s):以逻辑程序和专家系统为主,1956年首次人工智能研讨会召开标志着领域诞生,1965年Logic Theorist程序实现数学证明推理[4] - 技术积淀阶段(1980s~2010年):1986年Backpropagation算法突破,1997年Deep Blue击败国际象棋冠军,2006年深度学习技术发明[4] - 快速发展阶段(2011-2016年):2011年IBM Watson在Jeopardy获胜,2014年GAN出现,2015年AlphaGo战胜围棋冠军[4] - 爆发阶段(2017年至今):2017年Transformer架构提出,2018年GPT/BERT发布,2022年ChatGPT推出,2024年Sora面世[4] 大语言模型技术架构 - 预训练三要素:大数据(无标注文本)、大模型(深度神经网络)、大算力(并行计算集群)[11][12][13] - 训练流程:预训练(月级/千级GPU)→有监督微调(天级/百级GPU)→强化学习(天级/百级GPU)[22] - 微调技术:LoRA方法仅需训练百万参数,效果媲美全参数微调,GPU需求降至3090*4级别[15][20] - 强化学习:通过RLHF量化人类喜好,训练打分模型优化最终输出[18][19] 智能体关键技术 - 工具使用:通过API调用、搜索引擎、代码执行等扩展能力[26][27] - 任务分解:实现复杂任务的子目标拆解与试错机制[28][30] - 长期记忆:存储经验、知识、技能,支持读写持久化[31][32][33] - 自主学习:结合权重微调、提示优化、自我反思等多路径提升[35][36][38] 电力系统应用场景 - 负荷预测:ITA-LF框架整合新闻文本,预测准确率达94.7%,显著优于LSTM(82.08%)和SARIMA(89.93%)[64][68][71] - 调度系统:构建70b参数调度大模型集群,支持检修单成票(94.46%准确率)、规程检索问答(RAG召回率58.7%)[77][91][94] - 市场仿真:多代理模型实现碳市场均衡分析,量化价格弹性系数(煤炭企业7,278吨/元)[113][115][120] - 机理研究:AI4S框架处理10万节点电网建模,年算例超10亿,推动动态建模与稳定性分析[125] 技术融合路径 - 模型融合:推理大模型+PINN+因果模型+符号模型,保留准确性同时提升计算速度[54][56][58] - 人机协同:必要场景引入人工反馈,作为最终决策质量判定者[56][59] - CPSSE仿真:结合真人、因果模型和大语言模型,构建数字孪生系统[62] - 范式演进:从参数学习(机器学习)→提示工程(大模型)→机制工程(智能体)的能力获取转变[40]
CVPR2025 WAD纯视觉端到端 | 冠军方案技术报告~
自动驾驶之心· 2025-06-29 19:33
技术方案 - 采用3B参数VLM模型解决视觉端到端自动驾驶长尾场景问题 [1] - 两阶段训练方法:阶段一预训练采用自监督方式,使用83小时CoVLA数据和11小时Waymo长尾数据集进行next-token prediction训练 [2] - 阶段二微调使用500段人工标注数据,采用GPRO强化学习方法增强模型鲁棒性 [2] 数据集 - 使用Qwen2.5-VL 72B Instruct模型自动标注WOD-E2E和CoVLA数据集,生成240.5K高质量caption [3] - CoVLA数据集包含10000张前视图片,30秒20Hz日本驾驶视频 [11] - WOD-E2E数据集提供4021段长尾驾驶场景,每段20秒10Hz,8个相机 [11] 模型训练 - 预训练采用Qwen-2.5-VL-3B-Instruct模型,CoVLA VLT训练24小时,WOD-E2E VLT训练10小时 [11] - RL后训练进行2000steps,8 rollouts per sample,耗时12小时 [11] - 推理阶段使用1e-6 temperature for CoT,Greedy decoding for trajectory prediction [11] 评估结果 - 在Waymo test set RFS评分达到7.99,排名第一 [2] - Poutine方案7.99分,Poutine-base 7.91分,RL提升效果不明显但解决头部困难问题 [13] - 验证集消融实验显示Poutine-base No CoVLA得分7.95,Poutine-base No Lang得分7.94 [15] 技术特点 - 将轨迹预测建模为四阶段COT推理序列问题 [9] - 预测5个waypoints后使用cubic-spiline插值生成密集轨迹 [9] - 评估采用RFS指标,通过三个专家打分构建信任区域计算 [11] 行业思考 - 基于VLM/LLM的轨迹预测方法在长尾场景表现优异,但对物理世界理解仍有限 [19] - 3B模型目前尚无法支持10Hz城区NOA,主要作为慢系统配合工作 [19] - VLM+Action model的VLA架构可能是更合理的解决方案 [19]
高频选股因子周报:高频因子上周表现分化,日内收益与尾盘占比因子强势。深度学习因子依然稳健, AI 增强组合上周表现有所分化。-20250629
国泰海通证券· 2025-06-29 19:24
量化因子与构建方式 1. **因子名称:日内高频偏度因子** - 构建思路:衡量股票日内收益分布的偏度特征[4] - 具体构建过程:参考专题报告《选股因子系列研究(十九)——高频因子之股票收益分布特征》,对常规因子进行正交化处理[10] 2. **因子名称:日内下行波动占比因子** - 构建思路:分解已实现波动中的下行波动部分占比[4] - 具体构建过程:参考《选股因子系列研究(二十五)——高频因子之已实现波动分解》[14] 3. **因子名称:开盘后买入意愿占比因子** - 构建思路:捕捉开盘后市场买入意愿的占比特征[4] - 具体构建过程:基于高频数据低频化方法,参考《选股因子系列研究(六十四)》[17] 4. **因子名称:开盘后买入意愿强度因子** - 构建思路:量化开盘后买入意愿的强度[4] - 具体构建过程:同开盘后买入意愿占比因子,但侧重强度计算[21] 5. **因子名称:开盘后大单净买入占比因子** - 构建思路:分析开盘后大单净买入的占比[4] - 具体构建过程:未披露详细公式,但需正交化处理[25] 6. **因子名称:改进反转因子** - 构建思路:优化传统反转因子的计算逻辑[4] - 具体构建过程:未披露具体公式[36] 7. **因子名称:尾盘成交占比因子** - 构建思路:衡量尾盘成交量在总成交中的占比[4] - 具体构建过程:未披露详细公式[37] 8. **因子名称:深度学习因子(改进GRU(50,2)+NN(10))** - 构建思路:结合GRU神经网络与全连接层预测收益[4] - 具体构建过程:使用GRU(50,2)提取时序特征,NN(10)输出预测值[52] 9. **因子名称:多颗粒度模型(5日标签)** - 构建思路:基于双向AGRU训练多时间颗粒度标签[57] - 具体构建过程:采用5日收益标签训练模型[60] 10. **因子名称:多颗粒度模型(10日标签)** - 构建思路:同5日标签模型,但标签周期延长至10日[60] 因子回测效果 1. **日内高频偏度因子** - 上周多空收益:-0.51% - 6月多空收益:1.48% - 2025年多空收益:14.73%[4] 2. **日内下行波动占比因子** - 上周多空收益:-0.04% - 6月多空收益:1.86% - 2025年多空收益:12.84%[4] 3. **开盘后买入意愿占比因子** - 上周多空收益:0.77% - 6月多空收益:1.85% - 2025年多空收益:11.44%[4] 4. **改进GRU(50,2)+NN(10)因子** - 上周多空收益:0.70% - 6月多空收益:3.58% - 2025年多空收益:19.78%[4] 5. **多颗粒度模型(5日标签)** - 上周多空收益:1.56% - 6月多空收益:5.97% - 2025年多空收益:35.45%[4] 量化模型与构建方式 1. **模型名称:中证500 AI增强宽约束组合** - 构建思路:基于多颗粒度模型因子,最大化预期收益[61] - 具体构建过程:目标函数为$$ \max \sum w_i \mu_i $$,其中$w_i$为权重,$\mu_i$为预期超额收益[67] - 约束条件:个股权重≤1%,行业偏离≤1%,市值暴露≤0.3[62] 2. **模型名称:中证1000 AI增强严约束组合** - 构建思路:同中证500模型,但约束更严格[61] - 具体构建过程:增加ROE、SUE等基本面约束[62] 模型回测效果 1. **中证500 AI增强宽约束组合** - 上周超额收益:-0.25% - 6月超额收益:-0.36% - 2025年超额收益:7.95%[10] 2. **中证1000 AI增强严约束组合** - 上周超额收益:-0.21% - 6月超额收益:0.60% - 2025年超额收益:12.99%[10]
港科大 | LiDAR端到端四足机器人全向避障系统 (宇树G1/Go2+PPO)
具身智能之心· 2025-06-29 17:51
核心观点 - 香港科技大学团队提出Omni-Perception框架,通过直接处理原始LiDAR点云数据,实现四足机器人全向避障能力,解决了传统方法在复杂三维环境中的局限性 [2][4] - 该框架结合PD-RiskNet感知网络、高保真LiDAR仿真工具和风险感知强化学习策略,形成端到端的闭环控制系统 [4][5] - 在动态障碍、空中障碍等复杂场景中表现优于传统方法,成功率显著提升 [24][27] 技术架构 Omni-Perception框架组成 - **PD-RiskNet感知网络**:分层处理近场和远场点云,近场采用最远点采样(FPS)和GRU提取局部动态特征,远场通过平均下采样和GRU捕捉全局路径特征 [8][18] - **高保真LiDAR仿真工具**:支持4096个并行环境,渲染速度比Isaac Sim提升300%,并模拟噪声和自遮挡效应 [19][21] - **风险感知强化学习策略**:将避障任务建模为马尔可夫决策过程,直接输出关节控制信号,跳过运动学逆解 [9][11] 强化学习设计 - **状态空间**:包含本体状态(关节位置、速度)、外感知状态(10帧LiDAR历史点云)和任务指令(目标速度) [10] - **奖励函数**:结合避障速度追踪奖励(36个扇区障碍检测)和距离最大化奖励(LiDAR射线优化),辅以稳定性惩罚项 [12][13][14] - **训练参数**:PPO算法,4096个并行环境,学习率1e-3,折扣因子γ=0.99 [19] 性能优势 计算效率 - 相比传统SLAM+规划流水线,减少中间处理环节,计算开销更低 [7] - LiDAR仿真工具在4096环境、32k射线场景下无内存溢出,速度达Isaac Sim的5-10倍 [21][22] 场景适应性 - **动态障碍**:成功率76.7%,碰撞率56.7%,显著优于FPS+MLP(33.3%)和FPS+GRU(30.0%) [23][24] - **空中障碍**:成功率70%(传统方法0%),静态障碍成功率100% [27] - **极端场景**:密集植被中成功率60%,细长障碍(直径<1cm)需进一步优化 [28] 实现细节 PD-RiskNet网络 - **近场路径**:输入垂直角度θ>阈值的点云,输出187维特征向量,监督信号为特权高度信息 [18] - **远场路径**:输入θ<阈值的点云,输出64维特征向量,关注全局路径规划 [18] - **动作网络**:4层全连接(1024→512→256→128),输出12维关节目标位置 [19] 域随机化策略 - **物理参数**:附加质量-1.0kg至5.0kg,质心位置偏移±0.2m,电机强度缩放0.8-1.2倍 [20] - **环境参数**:地面摩擦系数0.4-1.0,重力偏移±1.0m/s²,LiDAR噪声率10% [20] 验证结果 - **真实数据对比**:仿真复现了LiDAR非重复扫描模式和自遮挡效应,几何结构匹配度高 [21] - **多场景测试**:在动态障碍场景中,传统高程图方法成功率0%,而Omni-Perception有效应对 [24][27]
中科院自动化所最新综述!VLA模型后训练与类人运动学习的共性
具身智能之心· 2025-06-29 17:51
核心观点 - 文章从人类运动技能学习角度系统总结了VLA模型的后训练策略,提出环境、具身、任务三维分类框架,并探讨神经科学对机器人学习的启发[4][5][6] - VLA模型需通过后训练从通用预训练转向特定任务适配,类似人类从遗传能力到专项技能的转化过程[8][9] - 类脑视角下,后训练技术可划分为环境感知增强、具身认知优化、任务理解深化及多组件集成四大方向[10][12] VLA模型与后训练重要性 - VLA模型整合视觉、语言与动作生成模块,实现"看-听-动"闭环,但预训练模型在真实场景中需后训练提升精度与鲁棒性[8] - 后训练利用少量目标场景数据微调模型,使其适应机器人物理特性与任务需求,解决"开箱即用"性能不足的问题[9] 三维后训练策略 环境维度 - 引入可供性线索强化模型对环境交互可能性的理解,如物体功能暗示(门把手提示抓握)[12] - 优化视觉编码器与多模态感知融合,提升环境细节记忆与抗遗忘能力[12][13] 具身维度 - 建立机器人正向/逆向运动学模型,模拟人类前馈-反馈控制机制实现精准动作规划[14] - 借鉴小脑多内部模型协同机制,设计分层动作控制模块[14] 任务维度 - 通过人类示范数据注入专家知识,加速任务理解[14] - 采用层次化策略分解长程任务为可管理子步骤,对应人类分而治之的神经处理模式[14][17] 技术挑战与趋势 - 数据效率:需开发课程学习、主动采样等类人策略降低训练数据需求[22] - 多模态扩展:触觉/深度传感等新模态输入可提升环境交互真实性,但面临传感器融合难题[22] - 持续学习:当前离线微调易导致遗忘,需借鉴人类记忆机制开发终身学习框架[22] - 开放泛化:从实验室性能优化转向未知环境适应能力建设[22]
盘一盘,2017年Transformer之后,LLM领域的重要论文
机器之心· 2025-06-29 12:23
机器之心报道 机器之心编辑部 这两天 Andrej Karpathy 的最新演讲 在 AI 社区引发了热烈讨论,他提出了「软件 3.0」的概念,自然语言正在成为新的编程接口,而 AI 模型负责执行具 体任务。 Karpathy 深入探讨了这一变革对开发者、用户以及软件设计理念的深远影响。他认为,我们不只是在使用新工具,更是在构建一种全新的计算范式。 回顾 LLM 的发展历程:自 2017 年 Transformer 架构问世以来,我们见证了 GPT 系列的一路高歌猛进,以及多模态能力和端侧应用的全面开花。整个 领域正以前所未有的速度演进。 要深入理解这场变革的本质,我们需要回到技术的源头。那些奠定今天 AI 能力的关键论文,不仅记录着算法的演进轨迹,更揭示了从传统编程到自然语言 交互这一范式转变的内在逻辑。 此前我们通过 50 个核心问题回顾了 LLM 的基础概念 。今天,我们将梳理自 2017 年以来 LLM 领域的重要论文。本文从 X 用户 Pramod Goyal 的论文 盘点中精选了 22 篇进行详细介绍,其余论文将在文末列出供读者参考。 奠基理论 Attention Is All You Need ...