Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek发布的这串符号,对国产芯片意味着什么
21世纪经济报道· 2025-09-02 23:36
文章核心观点 - 深度求索公司在新模型DeepSeek V3 1文档中提及的"UE8M0 FP8"参数格式 是针对下一代国产芯片设计的创新计算格式 通过牺牲局部精度换取全局稳定性和计算效率 旨在适配国产芯片硬件短板并构建自主算力生态 引发资本市场对国产芯片行业的高度关注 [2][5][6][9] 技术定义与特性 - "FP8"代表8位浮点计算格式 适用于深度学习等场景 其中"UE8M0"特指无符号 8位指数 0位尾数的参数格式 通过纯指数编码简化计算操作 [5] - UE8M0格式数据范围与FP32相当 但计算速度更快 数值范围优于E5M2等FP8变体 有利于模型训练稳定性 但需以精度牺牲为代价 [6] - 该格式特别适配Transformer架构的AI大模型 因其自注意力机制依赖浮点大量程 实现"牺牲局部精度换取全局稳定" [6] 国产芯片适配逻辑 - 国产芯片在先进制程 算力密度和功耗方面存在短板 UE8M0 FP8通过算法创新降低算力负荷 简化指数移位和加法操作 弥补硬件差距 [9] - 该格式有助于打破英伟达CUDA生态垄断 其开源特性可成为国产芯片重建自主生态体系的关键 [9] - 寒武纪思元590及未来690系列芯片原生支持FP8计算 沐曦 燧原等厂商也表态适配 但尚未明确使用UE8M0混合参数模型 [12] 应用场景与优势 - 除大语言模型外 UE8M0 FP8适用于明确定义的专用AI场景 如自动驾驶 人形机器人的多模态VLA模型 需大量程 高稳定性和高效率 [10] - 在工业质检 政务文档处理等低延迟 高准确率且成本敏感的场景中 该格式能发挥高效稳定特点 适配千行百业"AI+"需求 [10] 行业影响与竞争态势 - DeepSeek凭借行业地位向芯片厂商提出标准 推动国产芯片根据其生态系统定义设计 [12] - 国产芯片如寒武纪宣称新品在专用场景能力达英伟达H100的80% 但英伟达Blackwell系列采用FP4混合精度架构 国产芯片追赶仍需时间 [12] - 多数专家认为国产芯片需依靠性能竞争优势才能最终成功 [13]
DeepSeek的一串“符号”背后:对国产芯片意味着什么?
21世纪经济报道· 2025-09-02 21:44
UE8M0 FP8 技术解析 - UE8M0 FP8 是一种无符号、8位指数、0位尾数的浮点参数格式 专为下一代国产芯片设计 [1][3] - 该格式通过牺牲局部精度换取全局稳定 特别适用于Transformer架构的AI大模型训练 能提供与FP32相近的数据范围但计算速度更快 [3] - 相比海外厂商采用的E3M4或E5M2等标准FP8格式 UE8M0 FP8是中国市场定制化方案 可有效降低计算功耗并适配国产芯片规格限制 [4] 国产芯片适配优势 - UE8M0 FP8通过简化计算为指数移位和加法操作 大幅降低算力负荷 弥补国产芯片在7nm及以下先进制程的算力密度短板 [5] - 该格式打破英伟达CUDA生态垄断 为国产芯片提供开源、无厂商绑定的新生态构建机会 [5] - 寒武纪思元590及未来690系列芯片原生支持FP8计算 沐曦、燧原等国产AI芯片厂商均表态适配FP8 [8] 应用场景拓展 - 格式特别适用于多模态VLA模型 满足自动驾驶、人形机器人等场景对高效计算和大动态范围的需求 [6] - 在工业质检、政务文档处理等专用场景中 能实现低延迟、高准确率的AI推理 且对成本敏感 [6] - 深度求索通过本地化部署和语料后训练 推动UE8M0 FP8在企事业单位私有化AI应用中的落地 [5] 产业影响与竞争格局 - DeepSeek V3.1发布后 寒武纪8月股价涨幅达110% 引发资本市场对国产算力行业的高度关注 [8] - 深度求索凭借行业地位向芯片厂商输出标准 推动其根据自身生态系统定义芯片设计 [8] - 国产芯片(如寒武纪)在专用场景性能达英伟达H100的80% 但面对Blackwell系列FP4架构及特供中国B30a芯片 仍存在技术追赶空间 [8] 发展前景 - 国内芯片最终成功需依赖性能具备充分竞争优势 [9] - UE8M0 FP8配合混合参数精度 有望成为千行百业"AI+"的更优解决方案 [6]
B站、微信、抖音、DeepSeek等接连公告
南方都市报· 2025-09-02 18:47
此外,"抖音集团"账号发布消息,结合《人工智能生成合成内容标识办法》的要求,抖音已上线两项核 心功能:AI内容标识功能,协助创作者为AI内容添加提示标识,方便用户区分辨别;AI内容元数据标 识读写功能,可识别并写入AI内容的元数据信息,为内容溯源提供技术支撑。 在抖音注册的账号若制作、发布AI内容,需使用抖音提供的标识功能主动添加显式标识;同时,抖音 将核验、检测站内未主动标识的内容是否由AIGC技术生成,对疑似AI内容或元数据中已包含AI内容标 识的作品,补充添加显式标识。此外,对于在抖音发布的所有AI内容,抖音还将同步为其添加或更新 隐式标识,该标识包含内容传播要素等关键信息,进一步完善AI内容的全链路管理。 《人工智能生成合成内容标识办法》9月1日起正式施行,要求对人工智能生成合成内容进行显式标识和 隐式标识。 南都N视频记者注意到,DeepSeek、抖音、微信、B站等多个平台发布公告,明确落实该办法的具体举 措。 9月1日,DeepSeek发布公告,为贯彻落实《人工智能生成合成内容标识办法》及《网络安全技术 人工 智能生成合成内容标识方法》等相关要求,防止AI生成内容可能引发的公众混淆、误认以及信息失 ...
DeepSeek等大模型集体“打标”,从此告别AI造假?
虎嗅· 2025-09-02 17:12
"作品含AI内容"的标识成为一种标配,不知道有多少人松了一口气。 9月1日,DeepSeek在官方公众号发布公告,表示对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。 其他大模型厂商其实也早有动作,8月31日,腾讯元宝也在公众号发布了《关于AI内容标识的公告》。字节豆包、阿里通义、Kimi、智谱清言等也已纷纷 更新了用户协议中与AI标识相关的内容,表示已履行AI标识相关义务,包括但不限于显性标识和隐性标识。 在大模型厂商纷纷"打标"的背后,是9月1日起正式实施的《人工智能生成合成内容标识办法》。该《办法》由国家互联网信息办公室、工业和信息化部、 公安部、国家广播电视总局四部门联合发布,要求所有AI生成的内容都要"亮明身份"。 ·文本、图片、音频、视频、虚拟场景等,通通包括在内; ·AIGC技术服务者、平台、用户都得遵守。 首先,AIGC技术服务者需要在生成AI内容时,就埋好隐性标识,做好"出厂盖章"。 其次,平台识别并给AI内容添加显式标识和隐式标识,如在内容下方标明"作品含AI内容",做好"上架明牌"。 最后,用户在发布和传播相关内容的时候,不可以用任何方式删除、篡改、伪造或隐匿平台添加的AI ...
DeepSeek 等大模型集体“打标”,从此告别 AI 造假?
36氪· 2025-09-02 16:00
"作品含AI内容"的标识成为一种标配,不知道有多少人松了一口气。 9月1日,DeepSeek在官方公众号发布公告,表示对AI生成合成内容添加标识,并明确提醒用户相关内容由AI生成。 在大模型厂商纷纷"打标"的背后,是9月1日起正式实施的《人工智能生成合成内容标识办法》。该《办法》由国家互联网信息办公室、工业和信息化部、 公安部、国家广播电视总局四部门联合发布,要求所有AI生成的内容都要"亮明身份"。 ·文本、图片、音频、视频、虚拟场景等,通通包括在内; ·AIGC技术服务者、平台、用户都得遵守。 其他大模型厂商其实也早有动作,8月31日,腾讯元宝也在公众号发布了《关于AI内容标识的公告》。字节豆包、阿里通义、Kimi、智谱清言等也已纷纷 更新了用户协议中与AI标识相关的内容,表示已履行AI标识相关义务,包括但不限于显性标识和隐性标识。 首先,AIGC技术服务者需要在生成AI内容时,就埋好隐性标识,做好"出厂盖章"。 其次,平台识别并给AI内容添加显式标识和隐式标识,如在内容下方标明"作品含AI内容",做好"上架明牌"。 最后,用户在发布和传播相关内容的时候,不可以用任何方式删除、篡改、伪造或隐匿平台添加的AI ...
抖音微信B站DeepSeek等上线AI标识!部分严禁篡改
南方都市报· 2025-09-02 11:48
政策法规实施 - 《人工智能生成合成内容标识办法》于9月1日正式施行 要求对AI生成内容进行显式标识和隐式标识 [1] - 平台需防止AI生成内容引发公众混淆、误认及信息失实风险 用户不得恶意删除、篡改、伪造或隐匿标识 [4] 平台合规举措 - DeepSeek已在平台内对AI生成内容添加标识 并明确提醒用户相关内容由AI生成 [4] - 抖音上线AI内容标识功能 协助创作者添加提示标识 同时上线AI内容元数据标识读写功能以支持内容溯源 [4] - 抖音要求注册账号主动添加显式标识 平台将核验未标识内容并补充标识 同时为所有AI内容添加隐式标识 [5] - 微信平台对AI生成内容添加显式或隐式标识 并对疑似AI内容进行提示 [5] - B站推出AI生成内容标识功能 投稿侧提供标识选项供UP主自主声明 平台将对未声明内容按规则添加标识 [5] 行业乱象现状 - 调查曝光不法分子利用AI深度伪造快速起号后带货、卖课等乱象 [6] - 9月1日仍有部分合成视频未标注系AI创作 [6]
刚刚,DeepSeek最新发文,V3/R1训练细节全公开,信息量巨大
36氪· 2025-09-01 20:06
新规合规举措 - 公司宣布对所有AI生成内容添加显式“AI生成”标识以符合网信办《人工智能生成合成内容标识办法》第四条要求 [1][2] - 公司明确禁止用户恶意删除、篡改、隐匿标识或利用AI传播虚假信息 [2] - 公司通过开源平台公开发布模型权重、参数及推理工具代码,采用MIT协议供自由下载使用 [27][28] 模型技术架构 - DeepSeek-V3-0324模型参数总量达6850亿,通过梯度下降算法迭代优化 [15] - 模型训练分为预训练和优化训练两阶段:预训练掌握通用语言能力,优化训练(微调)通过SFT、RL等方法适应具体任务 [13][17][19] - 模型推理采用自回归生成方式,基于概率计算动态生成文本而非直接复制训练数据 [25][27] 训练数据管理 - 预训练数据来源包括互联网公开信息(网页、文档)及第三方合作授权数据,强调不主动使用个人信息 [20][21] - 数据治理通过自动过滤(剔除仇恨言论、色情、暴力内容)及算法+人工审核降低统计偏见 [21] - 优化训练数据由研究团队生成,部分基于用户输入但经加密、去标识化和匿名化处理 [22][23] 安全与透明度 - 公司通过安全数据对模型进行安全对齐训练,确保回复符合人类价值观 [24] - 全生命周期风险管理措施包括红队测试、增强透明度及赋予用户数据查询、拒绝训练和删除历史数据的权利 [37][38] - 技术报告和模型原理说明对外公开,促进社区研究和技术理解 [4][6][28] 局限性及应对 - AI存在生成错误或不符合事实内容的“幻觉”问题,行业普遍面临此挑战 [30][31] - 公司通过高质量数据、优化对齐策略和RAG技术降低幻觉率,但无法完全消除 [32] - 在医疗、法律、金融等专业领域,明确不提供建议并强调需寻求专业指导 [35][36]
DeepSeek-V3.1适配下一代国产芯片引爆市场,大模型这次和哪些国产芯一起“自主可控”?
36氪· 2025-09-01 19:37
产品发布与市场反应 - DeepSeek于8月21日正式发布DeepSeek-V3.1模型 主要升级包括混合推理架构、更高思考效率及更强Agent能力 [1] - 新模型采用UE8M0 FP8参数精度 专为下一代国产芯片设计 [1] - 发布次日FP8概念股大幅上涨 寒武纪、和而泰、佳都科技均涨停 [1] FP8技术解析 - FP8为8位浮点数格式 通过拆分符号位、指数位和尾数位平衡数值范围与精度 [4][5][6] - UE8M0 FP8为无符号格式 指数位8位、尾数位0位 以牺牲精度换取极大动态范围 [7][8] - 该格式需依赖算法与硬件设计弥补精度问题 与国产芯片特性高度适配 [8] 低精度计算演进背景 - FP32为早期AI训练标准格式 但显存占用高 AlexNet训练需消耗约1.5TB显存 [11][12] - FP16将存储需求减半 计算速度提升2倍以上 但存在梯度溢出问题 [14] - BF16指数位扩展至8位 动态范围与FP32相当 成为GPT-3等大模型训练首选 [14] - 英伟达2022年Hopper架构首次原生支持FP8 吞吐量翻倍且显存占用减半 [15] 国产芯片协同设计意义 - 主流FP8多采用英伟达E4M3/E5M2格式 国产GPU因电路与指令集差异无法直接兼容 [18][21] - UE8M0格式优先考虑动态范围 可提升国产芯片数值稳定性 避免梯度爆炸 [21] - 软硬件协同设计减少非英伟达架构移植阻力 加速国产AI基础设施投产 [22] - 该合作被视为应对美国AI芯片出口限制、实现技术自给自足的关键举措 [22] 国产生态适配进展 - 中国信通院自2025年2月开展DeepSeek适配测试 30余家企业参与 首批8家通过认证 [23][25] - 适配系统在语言理解与逻辑推理任务精度上与国外系统持平 单机8卡可推理671B模型 [25] - 华为、寒武纪、海光等企业硬件产品均通过适配 涵盖芯片、服务器与云服务关键环节 [25] 行业竞争态势 - 英伟达于2025年6月推出NVFP4格式 4位精度可实现16位训练精度 技术迭代加速 [26][27] - 国产模型与芯片厂商仍需持续追赶技术差距 但已通过协同设计建立初步生态基础 [27]
DeepSeek公告:强化AI内容标识,防止信息误导
新浪科技· 2025-09-01 17:45
9月1日,DeepSeek发布了《DeepSeek关于 AI 生成合成内容标识的公告》。 公告宣布,为贯彻落实《人工智能生成合成内容标识办法》(2025 年 9 月 1 日起施行)及《网络安全 技术 人工智能生成合成内容标识方法》等国家标准的相关要求,防止 AI 生成内容可能引发的公众混 淆、误认以及信息失实的风险,DeepSeek 已在平台内对 AI 生成合成内容添加标识,并明确提醒用户相 关内容由 AI 生成。用户不得恶意删除、篡改、伪造、隐匿此类生成内容标识,不得利用 AI 制作、传 播虚假信息、侵权信息以及从事任何违法违规活动。 此外,DeepSeek发布了《模型原理与训练方法说明》,为用户提供AI技术的详细信息,以保障其知情 权和控制权,并防范使用不当带来的风险。未来,DeepSeek将继续优化标识机制,提升用户体验,致 力于为用户提供更可靠、更安全的 AI 服务。 责任编辑:李昂 ...
中国企业大模型日均调用量破10万亿Tokens,通义豆包DeepSeek领跑市场
搜狐财经· 2025-09-01 17:05
沙利文此次调研覆盖了金融、制造、互联网、消费电子、汽车等多个关键行业,共调研了国内700家企 业,这些企业的营收规模和AI投入各不相同,从而确保了调研结果的全面性和代表性。调研结果显 示,与2024年下半年相比,2025年上半年的日均大模型调用量激增了363%,总量突破了10万亿Tokens 大关。在这一快速增长的市场中,阿里通义、字节豆包和DeepSeek三大平台占据了领先地位,它们的 市场份额分别为17.7%、14.1%和10.3%,三者合计占据了超过40%的市场份额。 开源模型在中国企业级大模型市场中的地位日益凸显,成为推动市场新一轮增长的关键力量。随着千问 Qwen、DeepSeek等国产模型在2025年的持续开源,开源模型与国际顶级闭源模型之间的性能差距已经 大幅缩小。开源模型不仅尺寸多样、类别丰富,而且企业可以完全掌握自主权,根据自身业务特点定制 模型及应用。沙利文预测,未来超过80%的企业将采用开源大模型,这预示着开源模型将在企业级应用 中占据主导性增长地位。 近期,国际知名市场研究机构沙利文(Frost&Sullivan)正式揭晓了《中国GenAI市场洞察报告》,该报 告聚焦于2025年中国企 ...