
新规合规举措 - 公司宣布对所有AI生成内容添加显式“AI生成”标识以符合网信办《人工智能生成合成内容标识办法》第四条要求 [1][2] - 公司明确禁止用户恶意删除、篡改、隐匿标识或利用AI传播虚假信息 [2] - 公司通过开源平台公开发布模型权重、参数及推理工具代码,采用MIT协议供自由下载使用 [27][28] 模型技术架构 - DeepSeek-V3-0324模型参数总量达6850亿,通过梯度下降算法迭代优化 [15] - 模型训练分为预训练和优化训练两阶段:预训练掌握通用语言能力,优化训练(微调)通过SFT、RL等方法适应具体任务 [13][17][19] - 模型推理采用自回归生成方式,基于概率计算动态生成文本而非直接复制训练数据 [25][27] 训练数据管理 - 预训练数据来源包括互联网公开信息(网页、文档)及第三方合作授权数据,强调不主动使用个人信息 [20][21] - 数据治理通过自动过滤(剔除仇恨言论、色情、暴力内容)及算法+人工审核降低统计偏见 [21] - 优化训练数据由研究团队生成,部分基于用户输入但经加密、去标识化和匿名化处理 [22][23] 安全与透明度 - 公司通过安全数据对模型进行安全对齐训练,确保回复符合人类价值观 [24] - 全生命周期风险管理措施包括红队测试、增强透明度及赋予用户数据查询、拒绝训练和删除历史数据的权利 [37][38] - 技术报告和模型原理说明对外公开,促进社区研究和技术理解 [4][6][28] 局限性及应对 - AI存在生成错误或不符合事实内容的“幻觉”问题,行业普遍面临此挑战 [30][31] - 公司通过高质量数据、优化对齐策略和RAG技术降低幻觉率,但无法完全消除 [32] - 在医疗、法律、金融等专业领域,明确不提供建议并强调需寻求专业指导 [35][36]