FP4

搜索文档
华尔街见闻早餐FM-Radio | 2025年8月28日
华尔街见闻· 2025-08-28 07:29
市场表现 - 美股标普500指数收涨0.24%至6481.40点创新高,道指涨0.32%,纳指涨0.21% [7] - 欧洲STOXX 600指数微涨0.10%至554.76点 [7] - A股沪指大跌1.76%至3800.35点,深证成指跌1.43%,创业板指跌0.69% [7] - 寒武纪市值超越贵州茅台成为A股新股王 [4] - 中概股指数下跌2.58%,美团ADR美股盘中跌幅超14% [2] 英伟达财报表现 - 营收及利润超预期但下季指引不够亮眼,盘后股价一度跌5% [4][10] - 数据中心收入连续两季逊色,Blackwell产品营收环比增17%但H20销售收入减少40亿美元 [12] - 上季度未在华销售H20芯片,释放1.8亿美元库存 [12] - 新增600亿美元股票回购授权 [4][12] - 黄仁勋称中国市场今年可能带来500亿美元商机 [4][12] 美团业绩下滑 - Q2经调整净利润同比骤降89%至14.9亿元,远低于市场预期的98.5亿元 [4][10][12] - 营销开支大增51.8%,经营利润暴跌98%至2.3亿元 [4][12] - 核心本地商业业务经营利润率从25.1%骤降至5.7% [12] - 公司预计Q3核心本地商业业务将出现大幅亏损 [4][10] 美联储政策动向 - 特朗普试图通过解雇理事库克掌控美联储,可能影响货币政策独立性 [11][13] - 若获得四张鸽派投票,特朗普可能推动激进宽松政策及单方面调整利率 [13] - 纽约联储主席威廉姆斯强调美联储独立性极其宝贵 [24] - 5年期美债拍卖出现需求疲软信号,得标利率3.724% [24] 企业动态与行业趋势 - Snowflake财报强劲并上调全年指引,盘后股价涨13% [6][16] - 蜜雪冰城上半年收入同比增长39.3%,净利润增44.1%,全球门店数达5.3万家 [5][15] - 紫金矿业上半年净利润286亿元同比增55%,市值超800亿美元 [19] - 高盛上调中际旭创目标价至392元,新易盛至398元,认为估值合理 [16] - 美国企业股票回购规模达1万亿美元,创历史最快纪录 [24] 能源与大宗商品 - WTI原油期货收涨1.42%至64.15美元/桶,布伦特原油涨1.23%至68.05美元/桶 [7] - 高盛预测2026年底布伦特原油或跌至50美元出头,因全球库存可能飙升近8亿桶 [25] - COMEX黄金期货涨0.51%至3450.60美元/盎司 [7] 科技与人工智能进展 - 英伟达推出FP4精度预训练技术,较FP8更快更便宜 [4][10] - 生成式AI冲击美国年轻人就业,22-25岁程序员就业人数下降近20% [27] - 马斯克星舰第十次试飞成功,实现历史性Starlink卫星模拟部署 [27] - OpenAI重组或将推迟至明年,与微软谈判存在关键分歧 [26] 债券与汇率市场 - 10年期美债收益率跌2.52基点至4.2362%,2年期收益率跌5.60基点至3.6229% [7] - 美元指数较日高下挫0.60% [2] - 30年期法国国债收益率创14年新高 [2] 地区与产业政策 - 欧盟拟削减美国关税以满足特朗普要求,汽车进口关税或从27.5%降至15% [14] - 特朗普政府暗示将关注军工和造船业,洛克希德·马丁被点名 [14] - 中国7月规模以上工业企业利润同比降幅收窄至1.5%,高技术制造业利润增18.9% [17] - 人形机器人产业在中国快速发展,大摩称成本控制及规模化生产进展显著 [18]
DeepSeek掷出FP8骰子
第一财经· 2025-08-26 14:34
芯片与AI算力指数表现 - 芯片指数(884160 WI)午盘涨002% 近一个月涨195% [3] - AI算力指数(8841678 WI)午盘涨145% 近一个月涨2247% [3] DeepSeek-V31技术突破 - DeepSeek发布V31版本 采用UE8M0 FP8 Scale参数精度 针对下一代国产芯片设计 [3] - FP8为8位浮点数格式 遵循IEEE 754规范 相比FP16内存占用减半至05倍 传输效率与硬件算力提升至2倍 [10] - 低精度量化可同时应对计算量大、储存不足和数据传输慢问题 [12] FP8技术发展历程 - 英伟达2022年9月在GTC大会首次将FP8写入产品路线图 H100 GPU原生支持FP8 [8] - 2023年OCP发布《MX规范》第一版 通过块缩放将FP8包装为可落地的MXFP8 [8] - 2024年12月DeepSeek通过V3模型跑通MXFP8 吸引行业关注 [9] - 行业从FP16向FP8演进 因万卡集群与推理爆发导致成本、功耗、显存成为核心问题 [9] 国产芯片市占率与政策支持 - 2025年第二季度国产芯片市占率提升至387% [12] - 工信部《算力互联互通行动计划》提出2026年建立算力互联互通标准体系 2028年实现全国公共算力标准化互联 [12] - 中国AI加速卡国产份额从2023年不足15%升至2025年上半年超40% 预计年底过半 [17] 低精度计算的优势与局限 - FP8在矩阵乘法中表现优异 但累加或特定函数计算仍需高精度支持 [15] - 低精度浮点技术缓解硬件需求压力与HBM瓶颈 减少算力需求、内存容量及带宽要求 降低芯片功耗 [13] - 精度低于FP4时数据可能失真 FP4可能是技术极限 训练与微调仍需FP16/FP32高精度 [15] - 精度替换只能部分进行 敏感环节需保留高精度计算 [16] 行业应用与未来趋势 - FP8推动算力厂商调整技术路线 多精度混合架构可同时运行FP32/FP16/FP8任务 训练效率显著提升 [12] - 低精度计算提升大语言模型效率 改善多模态领域如AI视频生成与世界模型的响应速度 [17] - 国产算力产业链完成融资-研发-场景落地正向循环 走出独立于海外生态的可持续路径 [17]