课程采样强化学习策略 - 财报，业绩电话会，研报，新闻 - Reportify

课程采样强化学习策略

搜索文档

智谱GLM-4.1V-Thinking登顶HuggingFace Trending全球第一：同尺寸效果最好

IPO早知道· 2025-07-09 18:01

模型性能与突破 - GLM-4.1V-9B-Thinking凭借9B模型尺寸登顶HuggingFace Trending第一 [2] - 该模型在28项权威评测中23项达成10B级模型最佳成绩，其中18项持平或超越72B的Qwen-2.5-VL [4] - 采用"思维链推理机制"和"课程采样强化学习策略"，系统性提升跨模态因果推理能力与稳定性 [3] 多模态能力 - 支持视频理解，可解析最长两小时内容并分析时间、人物、事件和逻辑关系 [4] - 具备图像问答能力，能深入分析图像内容并解答，逻辑能力和世界知识较强 [4] - 支持学科解题，包括数学、物理、生物、化学等学科的看图解题并给出详细思考过程 [4] 应用场景 - 文字识别：准确抽取图片和视频中的文字及图表内容并结构化输出 [5] - 文档解读：对金融、政务、教育等领域文档进行原生理解、抽取、提炼和问答 [5] - GUI Agent：识别网页、电脑和手机屏幕的交互界面元素，支持点击、滑动等指令执行 [5] 技术特点 - 轻量版模型参数控制在10B级别，兼顾部署效率与性能突破 [4] - 融合丰富多模态能力，包括代码生成（基于图片文字内容自动编写前端代码） [5] - 支持Grounding功能，识别图片特定区域并抽取坐标位置 [5]

多模态输入

思维链推理机制

课程采样强化学习策略

GLM-4.1V-Thinking

GLM-4.1V-9B-Thinking

多模态输入

思维链推理机制

课程采样强化学习策略

GLM-4.1V-Thinking

GLM-4.1V-9B-Thinking