自动驾驶合成数据集 - 财报，业绩电话会，研报，新闻

自动驾驶合成数据集

搜索文档

中国信息通信研究院· 2026-05-28 19:48

报告行业投资评级未提及报告的核心观点人工智能模数共振体系是人工智能技术与产业应用深度融合的核心载体，其本质是以高质量数据集与高效能模型双向共振实现“以模引数、用数赋模”良性循环，为“人工智能 +”应用落地和各行业数字化转型提供全方位支撑；未来模数共振体系虽面临问题与挑战，但产学研各界合作能推进其技术创新与产业发展，为“人工智能 +”全面落地提供有力支撑[7][8] 根据相关目录分别进行总结模数共振定义与内涵 - 模数共振体系核心要义是实现高质量数据集、高效能模型、高价值应用三大要素协同共振与价值倍增，以数据要素为根基、模型能力为枢纽、场景赋能为导向，构建良性循环机制，打通全链条价值通路，是连接多领域的关键纽带和培育新质生产力的重要引擎[13] - 模数共振具体内涵是建立数据质量提升、模型优化与应用反馈的协同联动及闭环迭代机制，实现数据与模型动态适配，解决 AI 模型训练瓶颈，推动数据集从“被动供给”向“主动适配”转型，通过循环反馈机制提高闭环体系训练效率和准确度[14][15][16] - 模数共振必要性体现在技术层面实现人工智能从“静态训练范式”向“动态持续进化范式”转变，构建自动化闭环提升系统效率和精度；产业层面高质量数据集和迭代体系成为企业核心竞争力，推动人工智能与产业场景深度融合，未来将实现“数据即模型、模型即数据”的共生状态[19][20][21] 模数共振三大核心要素 - 高质量数据集是用于训练等的行业核心数据资源集合，具有高技术含量、高知识密度、高效益场景“三高”特征，如百度标注平台提升效率、Waymo 数据集融合多模态数据、美国 NIH 数据集提升诊断速度[24][26][27] - 高效能模型是具备深度行业适配等能力的 AI 大模型体系，具有高算效比、高泛化性、高鲁棒性特征，通过多种技术实现性能提升和场景适配，保障模型在复杂场景稳定运行[28][30][31] - 高价值应用是依托前两者融入行业全流程的人工智能落地场景集合，具有场景刚需化、价值可量化、产业深度化“三化”特征，解决行业痛点，推动产业转型升级[32][33][34] 模数共振五大能力支撑 - 数据集设计与构建需锚定模型数据诉求、构建多维度数据供给体系、标准化数据标注流程和建立全流程数据质量保障机制，如通用和专业领域数据集构建方式不同，数据处理有不同标准和质检机制[37][38][40] - 数据集质量评估体系对数据集多维度进行科学量化与综合评测，中国信通院发布的 2.0 体系覆盖评估标准、指标、工具和方案等核心维度，为人工智能发展提供数据支撑[41][42][43] - 模型微调与优化通过指令微调数据集设计、模型参数调整和适配效果测试，将预训练模型转变为适用于特定任务的模型，降低过拟合风险，为基准测试提供优化方案[45][47][48] - 模型性能基准测试是闭环体系的全面质检环节，中国信通院发布的“方升”体系 3.0 涵盖关键要素，未来大模型基准测试体系呈现评测数据集增加、构建先进方法、开发智能评测基座等趋势[49][50][53] - 数据增强与优化基于模型测试和场景反馈对数据集进行逆向重构与迭代，实施精准靶向优化策略、推动数据处理规则升级和构建长效保障机制，确保数据与模型和业务需求共振[55][56][57] 模数共振三大协同机制 - 建立模型 - 数据关联映射关系需从模型类型、任务场景、模型性能三个维度考虑，不同类型模型有不同数据映射侧重，场景化映射可提升模型效能，根据性能指标校准映射关系[60][62][63] - 创新模数闭环迭代能力机制包括基于规则迭代升级数据处理标准、基于技术迭代革新工具方法、基于机制迭代协同组织流程，如优必选、百度智能云、微软 Azure AI 等案例体现其作用[64][66][69] - 构建模型自适应性能测试系统具有场景自适应、指标自适应、反馈自适应特点，通过覆盖全维度测试空间、构建多维度评价体系、精准定位问题根源，全面暴露数据和模型问题[71][73][75] 模数共振落地发展建议 - 统筹推进行业数据集建设与模型优化，整合公域与私域数据，建设通识和专识数据集，训练行业大模型和研发特色智能体，构建行业智能化赋能体系[78] - 持续完善模型性能评测能力机制，构建评测数据集体系和分级分类评测标准，形成良性循环机制，推动评测体系演进[79][80] - 探索建立模数共振生态协同机制，选择建设运营主体打造“模数共振空间”，研发基础设施，制定管理机制，构建开放协同、安全可控的生态[81] - 加强模数共振关键要素保障，在技术创新、标准引领、生态培育、人才建设等方面夯实基础，为体系发展提供保障[82][83]