中国联通数据产业底座的核心能力 - 公司作为中国通信行业国家队,拥有海量通信数据资源,并在数据治理、安全流通与行业赋能方面形成特色道路 [1] - 软件研究院是公司自主研发主力,承担数字与智能创新中心职能,副院长赵亚晖负责业务、管理及大数据系统建设 [1] AI时代高质量数据集的战略布局 - 公司数据产业底座覆盖算力、算法、数据三大能力融合,重点建设高质量数据集,包括数据基础设施产品、行业特色数据集及场景化应用 [2] - 沉淀700PB企业数据资源,联合行业伙伴构建400TB以上通信领域及行业数据集,形成"三个一"体系框架(方法论+平台工具+数据集) [2] - 建成8个领域专业化数据集(网络运营、客户服务等),支撑27个大模型场景训练,信息通信数据集入选国资委首批央企高质量建设成果 [3] 数据治理与技术创新实践 - 建立数据集分级分类管理框架,实现全生命周期规范化运营,参与国家级标准制定 [3] - 自主研发全流程工具链,集成多模态数据处理算法与自动化标注引擎,获DataOps工具创新奖 [3] - 通过"数据采集-清洗-标注-质检-应用-评估"闭环处理链路,实现智能化端到端数据生产 [3] 行业赋能与场景化应用 - 对内构建上千个智能体覆盖七大领域(办公管理、市场营销等),涉及千余细分场景,超万人参与 [6] - 对外联合伙伴开发上百个行业应用(装备制造、医疗健康等),典型案例使数据报表制作时间从小时级缩短至分钟级 [6] - 通信数据具备实时性、准确性优势,已开放工业、金融等场景服务,强调数据与大模型场景结合是关键差异化点 [6] 数据安全与流通机制 - 内部部署数据分类分级平台、4A金库等工具,实现数据使用全程上链管控 [7] - 对外构建多重技术防护体系,开发安全态势监测等产品,参与国家可信数据空间建设,推动"可用不可见"流通模式 [7] - 开展隐私计算、区块链等技术探索,协同政府与行业完善数据确权、交易等配套机制 [7]
独家对话中国联通赵亚晖,AI时代的“数据燃料”是如何炼成的?