Workflow
寒武纪思元590
icon
搜索文档
杭州深度求索公司推出适配国产芯片的DeepSeek V3.1模型
搜狐财经· 2025-08-24 17:08
模型技术突破 - 采用UE8M0FP8参数精度 显著减少内存占用和计算开销 适配下一代国产芯片结构[2] - 推理效率较此前版本提升40% 大幅提高AI应用响应速度[2] - 数学推理任务正确率达92% 代码生成超越行业标杆GPT-4达35%[3] - 在Aider多语言编程基准测试中取得71.6%高分 单次编程任务成本仅1.01美元[3] 国产芯片生态协同 - 技术专门针对寒武纪思元590 华为昇腾910D等国产AI芯片架构优化[3] - 缓解国产芯片在软件栈 开发者工具和模型兼容性方面的生态支持不足[3] - 推动国产AI芯片商业化进程 减少对国外技术依赖[3] 产品商业化进展 - 官方App及网页端已同步更新至DeepSeek V3.1版本[4] - 为用户提供全新功能体验和性能改进[4] - 促进国产AI芯片与模型协同发展 支撑人工智能产业自主创新[4]
英伟达H20重回市场,但中国芯片过去三个月已爆单
36氪· 2025-07-16 08:12
英伟达中国市场动态 - 英伟达创始人黄仁勋进行2025年第三次中国行 行程包括政府拜访、客户会议、链博会出席及中国媒体会 [4][5][6] - 公司宣布获得美国政府保证 将恢复H20芯片在中国的销售 并推出全新兼容RTX Pro系列GPU [5][6] - 英伟达市值突破4万亿美元 过去两年实现四倍增长 [6] 国产芯片替代进展 - 2025年国内厂商密集发布H20平替产品 包括昆仑芯P800、摩尔线程MTT S80、华为昇腾910C、寒武纪思元590等 [7] - 国产芯片厂商采取降价、生态兼容、锁定大客户等策略抢占市场 沐曦和摩尔线程近期寻求上市 [7] - 寒武纪2025年Q1营收暴涨42.3倍 实现上市后首次季度盈利 主要客户为运营商、智算中心和互联网大厂 [12][13] - 国内GPU厂商重点突破方向:模型适配、显存扩容、数据搬运提速、能效比提升 [14] 市场份额变化 - 英伟达在中国AI芯片份额从2022年95%降至2025年50% [8] - H20禁令仅维持三个月 但国产芯片已抢占市场真空期 多家厂商出现爆单情况 [8][12] - 国产芯片当前主要对标H20规格 长期计划向B200/H100等高端产品迭代 [19] 中国市场重要性 - 中国贡献英伟达全球15%收入 约180亿美元/年 是公司第四大市场 [16] - H20禁售导致2025年Q2预计损失80亿美元收入 [17] - 中国拥有超过150万CUDA开发者和数千家支持企业 [17] 未来竞争格局 - 行业认为H20回归具有双重目的:增加销售数据+狙击中国芯片公司 [17] - 国产芯片在性价比和长期供应链安全方面形成优势 替代趋势可能难以逆转 [19] - 英伟达需平衡政治与商业关系以维护中国市场 [20]
超越DeepSeek?巨头们不敢说的技术暗战
36氪· 2025-04-29 08:15
DeepSeek-R1模型技术突破 - 模型性能指标与OpenAI等领军企业产品相当甚至超越 计算资源需求较同类减少30% [1] - 独创分布式训练框架和动态量化技术使单位算力推理效能提升40% [1] - 多头潜注意力机制(MLA)实现内存占用降低50% 但开发复杂度显著增加 [2] MLA技术创新与挑战 - 键值矩阵存储密度提升18-23倍 4096 tokens上下文窗口内存占用量从96GB降至7.2GB(降幅92.5%) [4][5] - 非英伟达GPU部署需手动实现37%算子级优化 工程周期平均延长2.8周 [5] - RISC-V架构处理器运行MLA时推理延迟激增300% [6] 全球AI算力发展格局 - 全球AI算力支出占比从2016年9%升至2022年18% 预计2025年达25% [9] - 2022年全球智能算力规模451EFlops首次超越基础算力(440EFlops) 同比增速94.4% [10] - GPT-4单次训练消耗超2.5万块A100 GPU 相当于1200个美国家庭年用电量 [10] 算力市场竞争态势 - 美国科技巨头2023年AI算力投入占资本开支超60% 中国2022年AI算力支出增速38% [11] - 中美欧形成三足鼎立格局(美34% 中33% 欧17%) 竞争转向生态控制 [12] - 中国国产AI芯片良率仅达国际水平60% 先进制程代工依赖构成隐忧 [13] 新一代计算基础设施需求 - 需实现即插即用式替换 开发者仅需最小化修改即可部署各类系统 [15] - 要求自适应实时性能优化 硬件能动态调整资源配置维持峰值利用率 [16] - 必须突破传统架构桎梏 构建多层次算力矩阵应对指数级增长需求 [18] 中国算力产业发展 - 2024年全国算力总规模突破280EFLOPS 智能算力占比超30% [18] - 2025年中国智能算力预计突破千亿EFLOPS 2026年实现两年翻番 [19] - 推理算力年复合增速将达训练算力四倍 推动形成三位一体算力生态 [20]