华为昇腾910B芯片

搜索文档
英伟达H20芯片解禁是一场“阳谋”
36氪· 2025-07-23 11:48
英伟达H20芯片重返中国市场 - 英伟达H20芯片在2025年4月15日被禁止向中国出口后,于7月15日获批出口许可并计划大举进入国内市场 [1] - 公司CEO黄仁勋强调"一直在中国扩张",但H20回归本质是中美科技博弈的缩影而非技术恩赐 [2] - H20芯片在大模型训练和推理方面具有性价比优势,成为国产芯片的强劲竞争对手 [2] 美国对华技术封锁态势 - 美国商务部2025年5月14日将华为昇腾系列芯片纳入"通用禁令10",禁止全球企业使用违者面临最高20年监禁 [2] - 美国财长承认解禁H20是因"中国已研发出性能相当芯片",反映技术封锁策略调整 [2] - 从软件到硬件生态,美国持续多维度封堵中国科技企业 [2] 华为昇腾芯片技术突破 - 昇腾910B采用自研达芬奇架构实现IP到指令集全自主研发,通过中芯国际7nm(N+2)工艺实现能效比显著优于H20 [3] - 通过本土供应链合作优化封装设计,实现国产化自主可控并提升性能 [3] - 采用稀疏计算、模型量化等软件算法优化,在较低制程条件下达成高效计算效果 [5] 国产芯片生态建设 - 华为构建异于CUDA的GPGPU新平台,通过兼容CUDA中间件降低用户迁移成本 [2] - 集群计算模式使整体算力媲美顶级GPU,支持盘古大模型训练 [5] - 光量子技术作为下一代算力基础设施有望重构芯片技术架构 [3] 市场竞争格局演变 - 昇腾910B与H20处于性能博弈临界点,国产芯片在性能比和本地化适配优势持续扩大 [5] - H20短期内可缓解部分企业AI算力压力加速大模型训练,但产业自主化趋势不可逆 [5] - 未来美国高性能芯片对华出口政策预计持续收紧,市场将呈现路线分化 [5]
超越DeepSeek?巨头们不敢说的技术暗战
36氪· 2025-04-29 08:15
DeepSeek-R1模型技术突破 - 模型性能指标与OpenAI等领军企业产品相当甚至超越 计算资源需求较同类减少30% [1] - 独创分布式训练框架和动态量化技术使单位算力推理效能提升40% [1] - 多头潜注意力机制(MLA)实现内存占用降低50% 但开发复杂度显著增加 [2] MLA技术创新与挑战 - 键值矩阵存储密度提升18-23倍 4096 tokens上下文窗口内存占用量从96GB降至7.2GB(降幅92.5%) [4][5] - 非英伟达GPU部署需手动实现37%算子级优化 工程周期平均延长2.8周 [5] - RISC-V架构处理器运行MLA时推理延迟激增300% [6] 全球AI算力发展格局 - 全球AI算力支出占比从2016年9%升至2022年18% 预计2025年达25% [9] - 2022年全球智能算力规模451EFlops首次超越基础算力(440EFlops) 同比增速94.4% [10] - GPT-4单次训练消耗超2.5万块A100 GPU 相当于1200个美国家庭年用电量 [10] 算力市场竞争态势 - 美国科技巨头2023年AI算力投入占资本开支超60% 中国2022年AI算力支出增速38% [11] - 中美欧形成三足鼎立格局(美34% 中33% 欧17%) 竞争转向生态控制 [12] - 中国国产AI芯片良率仅达国际水平60% 先进制程代工依赖构成隐忧 [13] 新一代计算基础设施需求 - 需实现即插即用式替换 开发者仅需最小化修改即可部署各类系统 [15] - 要求自适应实时性能优化 硬件能动态调整资源配置维持峰值利用率 [16] - 必须突破传统架构桎梏 构建多层次算力矩阵应对指数级增长需求 [18] 中国算力产业发展 - 2024年全国算力总规模突破280EFLOPS 智能算力占比超30% [18] - 2025年中国智能算力预计突破千亿EFLOPS 2026年实现两年翻番 [19] - 推理算力年复合增速将达训练算力四倍 推动形成三位一体算力生态 [20]