知识学习 - 财报，业绩电话会，研报，新闻

知识学习

搜索文档

新浪财经· 2026-01-22 03:35

文章核心观点 - 文章是一篇个人回忆性散文，通过描绘家乡的枞树林，讲述了作者的童年游戏、劳动学习经历以及精神成长，表达了作者对故乡和自然的深厚情感以及对过往岁月的怀念 [1][2][5][6] 根据相关目录分别进行总结冬季枞林游戏 - 冬季枞林被积雪覆盖，宛如一幅淡雅的水墨画，静谧得能听见雪落的声音 [1] - 作者与伙伴们在林中嬉戏，通过摇晃树木制造“雪崩”取乐，笑声在林中回荡 [1][2] 秋季枞林劳作与游戏 - 秋季在枞林边的青杠树上敲打并捡拾栗橡子，背到十几公里外的乡场供销社售卖以换取部分学费 [2] - 卖剩下的栗橡子被制成“陀螺”玩具，孩子们在石板上比赛谁的陀螺转得最久，笑声与鸟鸣交织 [2] 学习劳动技能 - 作者向身形瘦高、腿有残疾但动作利落的二爹学习“剔柴”绝技 [2][3] - 二爹能灵活地在两丈多高的枞树间攀爬穿梭，利用树枝间的连接在十几棵树之间移动，劳动效率极高 [3][4] - 作者初次尝试攀爬剔枝时动作笨拙狼狈，但经过尝试后成功模仿二爹在树间移动，感到喜悦和自豪 [4][5] 枞林作为学习场所 - 作者在自考求学期间，为躲避家中嘈杂，选择到静谧的枞林中学习 [5] - 在林中阳光、松针和松涛的环境中，学习效率显著提高，最终以全科一次通过的优异成绩完成学业 [5][6] 枞林的象征意义 - 枞树林是作者儿时的乐园、劳动的课堂和精神的栖息地 [6] - 枞林以沉默的方式教会了作者勇敢、坚持与热爱，成为其人生中最宝贵的财富 [6]

We-Math 2.0：全新多模态数学推理数据集 × 首个综合数学知识体系

机器之心· 2025-08-27 18:40

核心观点 - We-Math 2.0是一个针对多模态数学推理的系统通过构建结构化知识体系和双向数据扩展策略提升模型推理能力[9][14][17] - 系统包含5层级知识体系覆盖491知识点和1819知识原理并采用三维难度建模和动态调度训练增强泛化能力[9][20][26] - 实验显示MathBook-7B模型仅用10K数据量在多个测试集平均性能提升超5% 超越部分大规模数据集模型[31][32] 知识体系构建 - 知识体系按定义-定理-应用思想设计包含5层级491知识点1819知识原理确保概念层次清晰且相互独立[14] - 知识点覆盖小学至大学及竞赛数学例如三角形面积细分基本公式海伦公式三角函数法等原理[14] - 构建方法融合人类专家教材维基百科设计和GPT-4o开源数据聚类最终由专家修正形成高质量体系[14] 数据集设计 - MathBook-Standard采用一题多图和一图多题策略每题标注多层级知识点覆盖全部1819知识原理[9][17] - 一题多图通过视觉变式提升同一知识泛化一图多题基于同一图像设计多问题考察不同知识[17] - 全部数据手动用Geogebra专业软件渲染确保高精度和高质量[11] 训练策略 - 训练分三阶段：先用1000条SFT数据冷启动微调改变输出范式再通过均值奖励以知识原理单位奖惩最后用动态调度提升泛化[10][23][26] - 动态调度根据错误类型调整数据包含知识增量调度视觉复杂度增加辅助元素语境复杂度拓展情境[26][27][28] - 模态增量调度针对新增视觉或语境复杂度专门训练对应样本[29] 性能结果 - MathBook-7B基于Qwen2.5-VL-7B开发在MathVista测试集达48.7分 MathVision73.0分 We-Math48.4分 MathVerse45.2分[31] - 平均性能较Qwen2.5-VL-7B提升超5% 在MathVista和We-Math展现优异知识泛化能力[31][32] - 仅用10K数据量达到与大规模数据集模型同等效果凸显高质量数据和知识体系高效性[32] 技术优势 - 三维难度建模从知识点数量视觉复杂度场景复杂度扩展题目每种子题扩展7难度层级[20][21] - SFT采用自然语言CoT优于结构化推理链少量数据即可释放强化学习潜力[40] - 模型在代数题准确率超50% 但几何题表现较差反映空间推理不足[42]