UE8M0 FP8

搜索文档
Deepseek发布V3.1 为何火的却是官方留言?
环球网资讯· 2025-08-23 13:26
DeepSeek-V3.1技术升级 - 公司正式推出DeepSeek-V3.1 在混合推理架构、思考效率和Agent能力方面全面升级 [1] - 官方补充说明UE8M0 FP8技术针对下一代国产芯片设计 [1] 资本市场反应 - DeepSeek官方留言引发连锁反应 寒武纪和海光信息等企业股价短期内上涨 [3] - 市场普遍认为FP8技术优化将推动国产芯片在AI训练和推理场景下的性能提升并扩大市场份额 [3] FP8技术特性 - FP8是8位浮点数格式 能在几乎不损失模型精度情况下大幅提升计算速度并降低功耗 [3] - 该格式尤其适用于大规模神经网络训练和推理场景 [3] 国内芯片产业现状 - 目前国内仅极少数GPU厂商支持FP8 如摩尔线程旗舰产品MTT S5000是国内首批原生支持FP8并大规模量产的GPU [3] - 摩尔线程MUSA架构原生支持硬件FP8张量加速计算 相对传统FP16计算可实现两倍浮点算力提升 [3] UE8M0 FP8技术价值 - 该技术通过对FP8格式深度优化 为下一代国产芯片提供底层支持 [4] - 通过减少数据存储和传输耗损 显著提升芯片吞吐量和能效比 [4] - 进一步强化国产AI芯片在国内外市场的竞争力 [4] 行业技术趋势 - 英伟达和AMD等国际巨头纷纷布局FP8 该格式有望成为下一代AI训练和推理的通用标准 [5] - DeepSeek此时推出UE8M0 FP8技术意味着中国企业在标准制定阶段已深度参与 可能影响全球技术路线走向 [5] 软硬件协同发展 - 公司从AI算法向芯片技术延伸体现软件定义硬件趋势 [5] - 优秀软件栈和算法优化能力正成为提升硬件性能的关键因素 [5]
国产芯片迎来DeepSeek时刻
财联社· 2025-08-23 11:00
市场动态与板块表现 - DeepSeek在推送留言区称UE8M0 FP8是针对即将发布的下一代国产芯片设计 这一消息点燃电子和半导体板块 [3] - 电子板块A股市值达到11.54万亿元 创历史新高 超过银行业 位居第一 [4] - 寒武纪股价突破1100元和1200元关口 20CM涨停封板 收盘价达1243.20元 总市值站上5200亿元 位列A股第24 单日市值飙升近1000亿元 超过东方财富 中信银行 中信证券 兴业银行 五粮液 [4] - 今年以来寒武纪已涨近九成 [4] - 海光信息市值较前一个交易日暴涨超700亿元 最新市值4325亿元 位居A股第30 单日超越国泰海通 百济神州 中国人保 中国太保 浦发银行 恒瑞医药 [6] - 科创50指数涨8.59% 创近三年多以来新高 [7] - 科创板总市值前三席位被半导体板块的寒武纪 海光信息 中芯国际包揽 [7] 个股表现与股东变动 - 寒武纪前十大股东中 牛散章建平去年年末新进公司前十大股东 持股数533.88万股 今年一季度加仓14%至超600万股 [4] - 仅靠去年年报中的533.88万股 章建平已盈利30亿元左右 [4] - A股高价股TOP 10中 一半是科创板公司 包括寒武纪 茂莱光学 百利天恒 金山办公与国盾量子 [6] - 寒武纪股价与贵州茅台仅差220元 [6] 行业趋势与技术发展 - DeepSeek表示新精度格式UE8M0 FP8针对即将发布的下一代国产芯片设计 表明未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片 助力国产算力生态加速建设 [9] - 腾讯业绩会表示推理芯片的供应渠道侧具备多种选择 国际供应链波动背景下国产推理算力芯片有望提供助力 [9] - 国产AI软硬件生态正进一步走向协同融合 [9]
华尔街见闻早餐FM-Radio | 2025年8月23日
华尔街见闻· 2025-08-23 07:09
华见早安之声 请各位听众升级为见闻最新版APP,以便成功收听以下音频。 市场概述 鲍威尔鸽派转向引爆市场,暗示政策立场调整可能"迫在眉睫",9月降息预期急速升温。道指创历史新高,美股小盘股领涨,美债、黄金、原油和加密货币 也同步飙升,美元重挫。 尽管科技七巨头大幅反弹,但本周仍累计收跌。英特尔收涨超5%,美国政府将获得公司10%股权。 美债收益率普跌,2年期收益率跌7.44基点。美元较日高一度暴跌超1.3%、创下4月以来最大单日跌幅。美元疲软下,黄金上涨1%。以太坊暴涨14%,时隔 四年再创历史新高。 原油震荡上行,美油收涨超0.5%。内盘期货夜市几乎全线收涨,焦煤涨6.18%。 亚洲时段,沪指大爆发,站上3800点,A股成交连续8日超2万亿破纪录,科创50暴涨超8%,寒武纪20CM涨停。 要闻 国常会:听取实施大规模设备更新和消费品以旧换新政策情况汇报,研究释放体育消费潜力。 鲍威尔放鸽!强调就业风险,为降息敞开大门,预计关税一次性推升价格,但需时间体现影响。鲍威尔宣布美联储货币政策框架调整,淘汰容忍 高通胀政策,承诺力保长期通胀预期锚定。 特朗普威胁罢免美联储理事库克,盟友央行大会现场质问库克、被驱离会场 ...
DeepSeek昨天悄悄扔的炸弹,今天爆了
虎嗅APP· 2025-08-22 21:24
文章核心观点 - DeepSeek发布V3 1并补充UE8M0 FP8技术细节 引发资本市场强烈反应 算力与芯片板块大涨 反映国产芯片在算力赛道切入国际前沿的可能性 [5][6][15] - UE8M0 FP8格式通过创新数据压缩与动态范围管理 显著提升国产芯片在AI大模型训练与推理中的性能 降低对显存带宽的依赖 并减少75%带宽开销 [8][11][12] - 该技术突破被视为国产算力产业链的共振时刻 标志软硬件协同成果显现 为国产芯片生态提供差异化竞争力 并逐步减少对英伟达的依赖 [6][13][15] 技术解析:UE8M0 FP8 - FP8是一种8位浮点格式 用于压缩数据以减少AI大模型对显存带宽的压力 但国产芯片此前仅少数支持FP8 多数支持FP16导致性能折损一半 [8] - UE8M0是MX格式中的关键缩放因子 采用无符号8位指数表示法 无尾数设计 实现"只调档位不调微刻度"的高效数据管理 动态范围达2⁻¹²⁷至2¹²⁸ [10][11] - 该格式硬件执行简单 仅需整数次幂运算 避免复杂浮点操作 提升能效并几乎消除数值溢出或信息损失问题 错误率大幅降低 [11] - 相较于传统32位FP32缩放因子 UE8M0仅追加8位即可管理32个FP8数据 带宽开销降低75% 对HBM带宽受限的国产芯片至关重要 [12] 产业影响与市场反应 - DeepSeek官方表态触发A股市场超2800只个股上涨 算力股全线爆发 云天励飞等多股涨停 芯片股寒武纪涨停创历史新高 中芯国际大涨14% 海光信息涨停 [6] - 技术突破被视为国产芯片与国际前沿接轨的信号 头部国产芯片公司如摩尔线程 寒武纪等均已支持FP8 思元590及690系列均兼容 [13][14] - 摩尔线程MUSA架构原生支持硬件FP8张量加速 结合UE8M0 FP8 Scale可实现相对于FP16两倍的浮点算力提升 带宽效率及存储容量利用率优化 [14] - DeepSeek主动推动国产芯片生态发展 通过编译器优化 训练框架适配等全栈打通 实现渐进式对英伟达的生态解绑 [13][15]
DeepSeek一行字,引爆国产AI芯片
半导体芯闻· 2025-08-22 19:28
文章核心观点 - DeepSeek发布采用UE8M0 FP8数据格式的DeepSeek-V3.1模型 该格式针对下一代国产芯片设计 可能推动国产AI芯片生态发展 [1] - UE8M0 FP8格式通过仅使用指数位存储尺度信息 显著减少内存与带宽使用 模型推理和训练内存需求降低多达75% 并兼容MXFP8硬件规范 提升算力利用效率 [3] - 消息发布后国内芯片概念股爆发 寒武纪股价飙升至约1170–1180元 市值一度逼近人民币5000亿元 昆仑芯中标运营商10亿级大单 国产芯片在运营商采购实现突破 [5] - 中国监管层劝阻国内企业购买NVIDIA H20 在存在替代品背景下 DeepSeek动作为国产芯片生态赋能 提升国内企业使用国产芯片平台积极性 [5] UE8M0 FP8技术特点 - UE8M0 FP8为特殊8位浮点格式 仅使用指数位不含尾数 用于存储尺度信息 在保证数值稳定性前提下大幅压缩内存与带宽使用 [3] - 该格式使模型推理和训练内存减少多达75% 显著提高算力利用率与效率 [3] - 格式与MXFP8硬件规范兼容 训练和推理数值体系与未来硬件一致 避免复杂数值转换 为国产AI加速器平台提供数值兼容路径 [3] 国内AI芯片市场影响 - 消息引发国内芯片概念股全线爆发 寒武纪股价盘中飙升至约1170–1180元 市值一度逼近人民币5000亿元 引领芯片板块整体上涨 [5] - 昆仑芯中标运营商领域10亿级大单 在中国移动算力芯片集采三个标包中均位列第一 中标金额超过10亿元 实现国产芯片在运营商核心采购重大突破 [5] - 国内AI芯片企业如中海光 摩尔线程 MetaX 燧原 天数智芯 中昊芯英等受到不同程度关注和期待 [5] 国产芯片生态发展 - DeepSeek模型适配动作成为国产芯片需求催化剂 提升国内企业使用国产芯片基础平台积极性 [5] - UE8M0 FP8格式为研发中的国产AI加速器平台提供数值兼容路径 是软硬协同生态构建的关键环节 [3]
DeepSeek V3.1 专为国产芯片设计的 UE8M0 FP8 到底是什么?
Founder Park· 2025-08-22 19:15
DeepSeek V3.1发布及UE8M0 FP8技术影响 - DeepSeek V3.1发布提及"新的架构、下一代国产芯片",引发市场广泛关注 [2] - 国产芯片企业股价显著上涨,寒武纪早盘大涨近14%,总市值跃居科创板首位 [4] - 半导体ETF在半天内大涨5.89% [4] UE8M0 FP8技术解析 - UE8M0 FP8是MXFP8格式中的缩放因子,MXFP8由Open Compute Project在2023年定义,是一种8位微缩块格式 [7] - MXFP8将张量切分为固定长度的块,每个块单独指定2的整数次幂作为缩放因子,扩展动态范围数十倍 [8] - UE8M0表示无符号、8位指数位、0位尾数位,动态范围覆盖2^(−127)到2^128 [11][15] - 该格式无需浮点乘法或规格化逻辑,缩短时钟关键路径,减少信息损失 [15] - 相比传统FP32缩放,UE8M0 FP8节省75%流量 [18] 国产芯片厂商适配及市场反应 - 寒武纪MLU370-S4、思元590及690系列芯片支持FP8计算,架构设计和低精度优化领先 [22] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU、摩尔线程MTT S5000均支持FP8精度 [26] - 华为昇腾路线图显示2025Q4支持原生FP8,下一代芯片可能于2026年推出 [23] - 国产芯片概念集体高开,科创50大涨3%创近三年半新高 [24] 行业影响及生态协同 - UE8M0 FP8提升国产芯片性价比,同等硬件可运行更大模型,减少对英伟达、AMD等国外算力依赖 [27] - DeepSeek通过精度格式改动主动贴合国产芯片性能点,推动软硬协同生态建设 [28] - 这种模式类似"Wintel联盟",通过技术绑定构建生态护城河 [28]
算力股、芯片股都疯了!DeepSeek一句话让国产芯片集体暴涨!
是说芯语· 2025-08-22 15:49
DeepSeek V3.1发布及UE8M0 FP8技术影响 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场广泛关注[1][31] - 官方透露新架构及下一代国产芯片信息 信息量巨大但表述简短[1][32] 国产芯片股价表现 - 寒武纪股价收盘上涨20% 总市值跃居科创板头名[2][24] - 半导体ETF全天大涨10% 代码512480 SH收报1 311元 单日上涨0 110元[3] - 芯片产业链集体走强 科创50指数大涨3%创近三年半新高[26] - 多只半导体成分股显著上涨 包括海光信息+20% 中芯国际+14 19% 澜起科技+8 70% 兆易创新+10%[3][4] UE8M0 FP8技术解析 - UE8M0 FP8为MXFP8格式的缩放因子配置 由Open Compute Project在2023年定义[7][8] - UE8M0中U代表无符号 E8M0表示8bit全部分配给指数位 无尾数和符号位[13][14] - 该格式优势包括 处理器复原数据时只需移动指数位 无需浮点乘法或舍入逻辑 缩短时钟关键路径[16] - 动态范围覆盖2^−127至2^128 解决单尺度FP8无法兼顾大小值的问题 减少信息损失[17] - 块级缩放使32个FP8数据仅追加8bit缩放因子 相比FP32缩放节省75%流量[21] 国产芯片厂商适配进展 - 寒武纪MLU370 S4 思元590及690系列芯片均支持FP8计算 架构设计领先[24] - 摩尔线程MTT S5000 GPU 芯原VIP9000 NPU等2025H2新品支持原生FP8或Block FP8[20] - 华为昇腾910B/C暂不支持原生FP8 但官方路线图显示2025Q4将支持[25] - 海光深算三号DCU 沐曦曦云C600 中昊芯英刹那TPU均支持FP8精度计算[30] - 首批通过DeepSeek大模型适配测试的厂商包括中国电信 华为 寒武纪 昆仑芯 海光 沐瞳 中昊芯英 中科加禾[23] 行业生态与竞争影响 - UE8M0 FP8提升国产芯片性价比 同等硬件可运行更大模型 减少对英伟达 AMD等国外算力依赖[27][28] - DeepSeek通过精度格式改动主动贴合国产芯片性能点 推动软硬协同生态建设[29] - 技术优化方向与国产芯片带宽限制(HBM LPPDDR)形成互补 成为下一代架构重要优化路径[21] - 市场解读为国产AI进入软硬协同阶段 国产芯片厂商竞争力提升[27][29]
DeepSeek一句话让国产芯片集体暴涨!背后的UE8M0 FP8到底是个啥
量子位· 2025-08-22 13:51
文章核心观点 - DeepSeek V3.1发布采用UE8M0 FP8参数精度 引发市场对国产芯片技术升级和生态协同的高度关注 带动相关企业股价显著上涨 [1][3][4] - UE8M0 FP8技术通过块级缩放和动态范围优化 显著降低带宽需求并提升计算效率 成为适配下一代国产芯片的关键创新 [10][11][19][20] - 国产AI芯片厂商如寒武纪、海光、沐曦等已布局FP8支持 软硬协同生态构建有望减少对国外算力依赖 提升行业竞争力 [23][24][33][34] 技术架构分析 - UE8M0 FP8由Open Compute Project定义 采用8位微缩块格式 通过分块缩放因子扩展动态范围数十倍 [8][10][11] - UE8M0格式无符号位和尾数位 全部分配8bit至指数位 处理器复原数据仅需移动指数位 无需浮点乘法或舍入逻辑 [14][19] - 相比传统FP32缩放 UE8M0使32个FP8数据仅追加8bit缩放因子 节省75%流量 显著优化带宽和功耗 [24] 国产芯片厂商动态 - 寒武纪早盘股价大涨近14% 总市值超4940亿元 跃居科创板首位 其MLU370-S4及思元590/690系列均支持FP8计算 [4][29] - 海光深算三号DCU、沐曦曦云C600、中昊芯英"刹那"TPU及摩尔线程MTT S5000均已支持FP8精度计算 [23][32] - 华为昇腾路线图显示2025Q4将支持原生FP8 预计2026年推出的新品可能成为"下一代芯片" [30] 产业生态影响 - 半导体ETF半日大涨5.89% 科创50指数涨3%创近三年半新高 芯片产业链集体走强 [4][31] - DeepSeek与15家厂商联合验证UE8M0格式 包括中国电信、昆仑芯等8家通过大模型适配 构建统一软硬协同生态 [23][27][34] - 技术升级提升国产芯片"性价比" 同等硬件可运行更大模型 实质性减少对英伟达、AMD等国外算力依赖 [33][34]
港股午评 恒生指数早盘涨0.32% 国产芯片强势上扬
金融界· 2025-08-22 13:09
智通财经获悉,港股恒生指数涨0.32%,涨80点,报25184点;恒生科技指数涨1.61%。港股早盘成交 1498亿港元。 国产算力芯片近期迎多重利好。DeepSeek官微留言:UE8M0 FP8是针对即将发布的下一代国产芯片设 计。华虹半导体(01347)涨11.74%;上海复旦(01385)涨6.5%;中芯国际(00981)涨6.29%;贝克微(02149) 涨9%。 中国天瑞水泥(01252)再涨超39%,公司上半年水泥销量增加,机构看好行业盈利水平持续恢复。 速腾聚创(02498)绩后涨超9%,机器人业务呈现爆发式增长,产品销量同比增超6倍。 蔚来-SW(09866)涨7.33% ,全新ES8正式开启预售,电池租用款预售价30.88万元起。 途虎-W(09690)绩后拉升9.13%,中期经调整净利润同比增加14.6%,公司持续推动供给侧成本优化。 中远海能(01138)早盘涨超7%,美国加强对俄油出口制裁,机构称或推高合规原油需求。 IFBH(06603)跌13%,中期纯利同比减少4.82%,毛利率下滑4.7个百分点。 本文源自:智通财经网 中联发展控股(00264)飙升逾60%,1亿港元收购RWA平 ...
DeepSeek最新透露:是针对即将发布的下一代国产芯片设计
财联社· 2025-08-21 18:00
DeepSeek官微在置顶留言里表示, UE8M0 FP8是针对即将发布的下一代国产芯片设计。 DeepSeek在其官宣发布DeepSeek-V3.1的文章中提到,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。 另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。 ...