Workflow
联合实验室专家陈雷:希望大湾区成为数据安全使用典范
南方都市报·2025-09-16 10:49

生成式人工智能是引领新一代科技革命和产业革命的核心驱动力,是加快培育和发展新质生产力的重要 引擎,为经济高质量发展注入新动能,与此同时,各类难以预知的风险和挑战也伴生而来。 要通过联合实验室整合数据 南方都市报(以下简称南都):您是世界数据科学与分析领域的领军学者,能否结合数据领域深入研 究,谈谈对粤港澳大湾区生成式人工智能安全发展联合实验室发挥自身优势,更好服务人工智能安全发 展的期望? 陈雷:粤港澳大湾区制造业很强,要把人工智能运用到传统行业,数据非常重要。通过实验室联合大湾 区各类高校,汇聚所有数据,做成大数据平台,供大家使用,做相应大模型测试。或者由联合实验室推 出数据测试平台,让各类大模型通过平台测试性能,找出不足,加以改进。 南都:如何确保数据质量,联合实验室能做些什么? 陈雷:数据质量是全世界都想解决的问题,首要的问题是获取到的数据是不是有用?而且数据量要大, 量不大就没有所谓数据质量。 数据质量包括无监督、有监督。无监督的数据质量就是通过无监督的机器学习,发现一些质量偏差较远 的数据,或者叫异常数据分析。有监督的数据质量一般需要找专家或专业人士对数据打标签,然后用机 器学习的方法找出那些较差的 ...