九天结构化数据大模型

搜索文档
驯服复杂表格:九天重磅开源,开启「人与表格对话」智能新时代
机器之心· 2025-08-01 12:23
中国移动九天结构化数据大模型开源 - 公司于WAIC 2025大会上宣布全面开源"数据-模型-测评"三位一体的结构化数据大模型体系,包括结构化数据体系、TReB测评框架及全流程模型,旨在降低行业技术门槛并推动协同创新生态[2] - 开源内容涵盖模型权重、微调/推理代码及技术报告,模型基于国产GPU集群训练,具备多表关联分析、交互式可视化等智能数据分析功能[15][16] - 模型已通过国家网信办算法备案,并在能源、交通、物流等行业实现应用,例如工业生产参数预测预警、物流仓储调度优化等场景[27][28] 结构化数据体系创新 - 首创千万级表格数据体系,覆盖6大能力34项子任务,整合39个公开数据集及互联网数据,涉及通信、金融、医疗等300+领域[4] - 针对现有数据集格式单一问题,通过自研方案扩增复杂推理能力,增加多步表格高级分析功能[4] - 数据收集来源包括Web of Science、GitHub等平台,采用多阶段清洗流程确保质量[4] TReB测评框架 - 测评基准包含26项表格推理任务,集成三种思维链推理模式,提供精准多维度评估[7][9] - 数据集已在HuggingFace/Modelscope开放,测评代码开源至GitHub/Gitee平台[8][9] - 框架结合公开数据集、真实网络表格及专有复杂数据,采用严格清洗流程保证数据质量[9] 模型技术突破 - 引入结构化数据感知机制和深度思考机制,模拟人类分析师递进式推理,提升多表关联分析准确性[18] - 提出交互闭环推理架构,通过沙箱环境动态反馈优化工作流,内置多智能体协作机制实现类专家协同分析[19] - 在TReB基准测试中,JT-DA-8B模型在26项任务上性能显著优于其他开源模型[23] 行业应用与生态建设 - 模型开源至HuggingFace/Modelscope社区,提供数据感知、查询、可视化等分析功能,可提升专业人员效率并赋能非专业人士[25] - 计划持续开展技术直播,解析基础大模型及开源资源,加速行业落地[31] - 未来将深化AI与行业融合,推动结构化数据智能技术规模化应用,助力数字化转型[30]