Seek .-刚刚，DeepSeek最新发文，V3/R1训练细节全公开，信息量巨大

新规合规举措 - 公司宣布对所有AI生成内容添加显式“AI生成”标识以符合网信办《人工智能生成合成内容标识办法》第四条要求 [1][2] - 公司明确禁止用户恶意删除、篡改、隐匿标识或利用AI传播虚假信息 [2] - 公司通过开源平台公开发布模型权重、参数及推理工具代码，采用MIT协议供自由下载使用 [27][28] 模型技术架构 - DeepSeek-V3-0324模型参数总量达6850亿，通过梯度下降算法迭代优化 [15] - 模型训练分为预训练和优化训练两阶段：预训练掌握通用语言能力，优化训练（微调）通过SFT、RL等方法适应具体任务 [13][17][19] - 模型推理采用自回归生成方式，基于概率计算动态生成文本而非直接复制训练数据 [25][27] 训练数据管理 - 预训练数据来源包括互联网公开信息（网页、文档）及第三方合作授权数据，强调不主动使用个人信息 [20][21] - 数据治理通过自动过滤（剔除仇恨言论、色情、暴力内容）及算法+人工审核降低统计偏见 [21] - 优化训练数据由研究团队生成，部分基于用户输入但经加密、去标识化和匿名化处理 [22][23] 安全与透明度 - 公司通过安全数据对模型进行安全对齐训练，确保回复符合人类价值观 [24] - 全生命周期风险管理措施包括红队测试、增强透明度及赋予用户数据查询、拒绝训练和删除历史数据的权利 [37][38] - 技术报告和模型原理说明对外公开，促进社区研究和技术理解 [4][6][28] 局限性及应对 - AI存在生成错误或不符合事实内容的“幻觉”问题，行业普遍面临此挑战 [30][31] - 公司通过高质量数据、优化对齐策略和RAG技术降低幻觉率，但无法完全消除 [32] - 在医疗、法律、金融等专业领域，明确不提供建议并强调需寻求专业指导 [35][36]