为什么一些公开数据不能拿来训练？AI 生成内容的版权到底归谁？

文章核心观点 - 数据是AIGC创业公司，特别是出海企业，必须严肃对待的关键风险点，而非简单的产品护城河[1][3] - AIGC公司在模型训练、内容生成及产品出海等环节面临复杂且多样的数据合规与知识产权风险，亟需将合规工作前置[2][3][4] - 针对AIGC领域的特定数据风险，行业需要专业的法律合规指导以规避高风险的诉讼与侵权争议[3][4] 活动背景与目的 - 活动由北京星也律师事务所的两位合伙人郑玮和孙奇敏主导，旨在为AIGC创业公司提供出海合规指导[4][10] - 活动形式为线上闭门研讨会，采用筛选制，面向特定受众，需付费报名[5][6][10] AIGC行业面临的核心数据合规议题 - 模型训练数据来源的合规性：需明确区分合成数据、版权内容、专有数据及用户行为数据等不同类型数据的可用性边界[8] - 不同类型数据的侵权风险：代码、人像、音视频等不同种类的数据在利用时需注意各自独特的侵权风险[2][8] - AI生成内容的权属界定：需要厘清AI生成内容的所有权归属，并针对ToB与ToC不同应用场景界定数据使用权与知识产权[8][10] - 产品出海的数据管理：出海企业需妥善处理数据跨境传输、本地存储与数据隔离等关键合规问题[8][10] 目标参与人群 - 图像、文本、视频等生成式AI产品的创始人或出海负责人[10] - AI陪伴/社交、AI Coding类产品的创始人或出海负责人[10]