AI大模型训练数据合理使用制度

搜索文档
最高法法官:在大模型训练数据输入端构建合理使用制度
南方都市报· 2025-07-01 17:23
大模型训练数据的法律规制 - 最高人民法院法官亓蕾提出"宽进严出"制度设计思路 即在数据输入端构建合理使用制度 在输出端采取严格规制以平衡技术发展与权利人保护 [1] - AI训练数据属于技术研发环节 单纯模型训练不直接影响权利人 风险主要来自后续应用环节 目前尚未出现规模性风险 [2] - 多数国家和地区对AI训练数据持宽容态度 严格输入端规制将导致高昂授权成本或法律风险 阻碍技术创新 [2] 合理使用制度的立法建议 - 建议通过立法将AI训练数据纳入著作权合理使用特定情形 因其具有底层技术支撑作用和公共利益属性 [3] - AI对作品的使用是"分子料理"式打散重塑 目的为学习语言规律生成新知识 非直接复制存储作品 [3] - 需同步赋予著作权人前端数据合法取得与后端侵权救济手段 如设置技术措施权利和AI服务商注意义务 [3] 美国司法实践案例 - 加州法院在Anthropic案裁决训练AI模型属合理使用 但要求数据采集来源合法 [4] - Meta案显示合理使用判定需考察作品市场价值影响 未经许可训练大模型在多情况下仍属违法 [4] - 中国业界建议个案考察作品市场价值影响 而非抽象判断合理使用 [4] 现行许可模式的局限性 - 传统版权许可模式成本高昂且流程繁杂 可能抑制创新并诱发灰色地带操作 [2] - 法定许可模式仍使大模型公司承担高成本 且版权管理组织需支付高额管理费 [2] - 授权许可与法定许可均面临交易成本过高问题 合理使用更具可行性 [2]