百度昆仑芯

搜索文档
事关AI芯片,阿里发声:大规模采购寒武纪不实
36氪· 2025-09-02 10:11
阿里云AI芯片采购传闻及回应 - 有消息称阿里云追加寒武纪思元370芯片订单至15万片 但阿里云回应称采购15万片GPU消息不实[1] - 阿里云实施一云多芯战略支持国产供应链 并通过多元化合作伙伴建立后备方案应对AI芯片供应及政策变化[1] - 阿里每个季度AI开发支出可能根据供应链波动 但3800亿资本开支仍按预期完成[1] 中国AI芯片市场竞争格局 - 2024年中国加速芯片市场规模超过270万张 GPU卡占据70%市场份额[2] - 中国本土AI芯片品牌出货量达82万张 华为昇腾占据大部分份额 百度昆仑芯 天数 寒武纪 沐曦 燧原等厂商出货量数万张不等[2] - 国产AI芯片主要参与者包括寒武纪 华为 海光信息 壁仞 沐曦 燧原股份 摩尔线程等厂商[2] 阿里平头哥自研芯片进展 - 阿里2018年成立平头哥半导体公司 已推出玄铁系列RISC-V处理器 含光系列AI芯片 倚天系列通用服务器CPU及企业级SSD主控芯片[3] - 自研CPU倚天710和AI推理芯片含光800已在阿里云实现规模化部署[3] - 有媒体报道阿里新款AI芯片正在测试 旨在服务更广泛AI推理任务且与英伟达兼容 转为国内企业代工 但官方未回应且知情人士称信息不准确[3] 互联网企业芯片自研布局 - 百度昆仑芯3万卡集群于今年正式点亮 可承载多个千亿参数大模型全量训练 支持1000个客户同时做百亿参数大模型精调[4] - 腾讯推出三款自研芯片包括AI推理芯片紫霄 视频转码芯片沧海和智能网卡芯片玄灵 并与AMD合作推出星星海智慧木系GA01 GPU卡[4] - 字节自研芯片涉及视频编解码和云端推理加速等应用场景[4] AI芯片行业发展趋势 - AI大模型从单模态向多模态发展导致算力爆发性增长 算力一直供不应求[4] - 相比英伟达 国产AI芯片系统生态仍不够完善 需以性能提升和生态构建双重策略应对全球算力产业链挑战[4] - 互联网企业支持国产芯片并建立自给自足供应链对AI生态发展至关重要 阿里2021年提出一云多芯战略全面兼容X86 ARM RISC-V等多种芯片架构[4]
算力产业近况解读
2025-05-25 23:31
纪要涉及的行业和公司 - **行业**:算力产业、GPU 行业 - **公司**:英伟达、华为、阿里巴巴、百度、腾讯、字节跳动、寒武纪、昆仑芯、韩 5G、海光、火山引擎、智谱、讯飞 纪要提到的核心观点和论据 市场需求与前景 - **全球和国内 GPU 市场需求持续增长**:中国因贸易摩擦,依赖国产或降配版进口芯片;国际上美国生成式多模态及 AGI 技术发展、其他地区推进大模型行业落地带动算力需求[1][3] - **未来两年存在两种情景**:贸易摩擦加剧,国产芯片需求增加;关系缓和,降配版进口芯片推动多模态应用发展,无论哪种情景算力需求都增加[3] 英伟达产品情况 - **英伟达 H20 不受青睐**:降配后性能优势减少、利润下降,头部互联网公司或云服务企业倾向选择性价比更高的国产芯片,国产卡逐渐占据更多市场份额[1][4][5] - **英伟达在中国市场 GPU 卡性价比降低**:预计 2025 年再推降配版 H20 难获大量订单,仅个别急需公司可能购买[5] - **国内公司倾向 B20 而非 H20**:H20 性能下降严重,无法满足多模态推理和 agent 应用需求;B20 架构并行速度和卡间协作更佳,单机内和集群内表现损耗小[1][11] - **B 系列降配版能满足禁令要求**:H 系列因物理架构限制,缩减显存和降低计算频率会使集群表现大幅下降;B 系列架构处理好,配置低时表现损耗小[12] 国产芯片情况 - **华为升腾系列有进展但存在不足**:升腾 910C 通过 3D 空间式设计提升单机架内算力约 25%,但缺乏 Nvlink 导致数据传输速度受限[6] - **韩 5G 芯片有突破但表现欠佳**:实现单片参数技术突破,但在组网及复杂计算中表现欠佳,高可用性材料有差距[6] - **国产芯片需补足多方面**:软硬件结合能力不足、产能问题(如寒武纪无训练卡生产能力)、良品率低,导致显存、传输速度、更新迭代及产能分布存在不足[20] 国内互联网巨头自研芯片情况 - **阿里巴巴**:通过平头哥系列服务于阿里云,用于降低成本、硬件加速和 IoT 场景[7] - **百度**:通过昆仑芯推进大模型推理商业化,与飞桨开发框架适配,实现自主可控[7] - **腾讯和字节跳动**:集中于视频解码、加速及神经网络训练等领域,字节跳动还尝试与台积电合作研发高性能多模态推理芯片[7] 应用场景与算力投入 - **推理场景资源消耗接近训练场景**:2025 年多模态推理场景资源消耗与训练相差无几,特定场景推理成本超训练成本,预计 2026 年互联网公司算力投入向推理倾斜[1][8][9] - **公有云需求未显著增长**:中小企业接入大模型 API 或构建 agent 较少,市场以头部公司自有业务为主导,社会面日常 TOKEN 消耗量相对较低[10] 市场供应与租赁挑战 - **高性能计算芯片供应情况**:英伟达 H20 大部分被头部公司购买,A100 和 A800 应用场景有限,H100 和 H800 价格昂贵,小型企业难以负担,且头部公司考虑数据安全不轻易选择外部集群[17] - **企业租赁高性能芯片面临挑战**:大规模预训练需显卡集中,推理环节需求无法分散,高性能芯片大规模使用存在市场供应量和技术困难,零星或大规模租赁不可行[2][19] 多模态技术市场情况 - **多模态技术占领市场概率高**:2024 - 2025 年末市场规模预计增长 15 - 20 倍,火山引擎大模型有效 tokens 部分来自公有云供中小企业使用[14] 其他重要但可能被忽略的内容 - **字节跳动租赁情况**:租赁 IDC 和机房存放芯片,年初租赁算力用于抖音和豆包相关功能加速,为临时性非大规模租用 GPU[15][16] - **腾讯 GPU 采购困难**:今年一季度疯狂购买 GPU,二三月难买到,四月底五月甚至考虑向字节跳动购买,反映国内市场优质 GPU 资源争夺激烈且供不应求[22] - **非上市公司芯片情况**:昆仑芯推理效果优异,集群版每秒可处理 4000 多个 tokens,单机版能处理三四十个 tokens,P 系列推理优化后集群表现优于华为 910B;韩 5G 芯片带宽传输有瓶颈、耗电量大;海光少量采购组网测试,测试质量难保证[23][24] - **全球 GPU 市场格局及资本开支**:2025 年资本开支增长迅速,2026 年预计下降至 50%以下;字节跳动和阿里巴巴算力采购总量可能降至 80%左右,腾讯增加采购量,百度需求与今年持平但推理侧需求增加;若政策支持,百度将增加昆仑芯产能或进口芯片;2026 年华为生成芯片产能约 85 万,可能被国央企优先购买[25]
从叙事强化到业绩兑现:A股科技逻辑愈发清晰,成长股牛市前奏已响?
21世纪经济报道· 2025-05-09 23:44
全球资本市场变革与AI产业重塑 - DeepSeek技术突破引发中国资本市场资产重估热潮,AI产业加速发展 [1] - 半导体、新能源、信息技术、生物科技等核心科技赛道同步迸发活力 [1] - 中国股票市场正从叙事强化向叙事兑现进阶,有望实现业绩与估值双重提升 [1] 科技股估值修复行情 - 恒生科技指数2025年Q1上涨20.74%,南下资金净买入港股4386.53亿港元创历史新高 [2] - 科创100指数Q1上涨10.69%,科创50上涨3.42%,"AI+"浪潮推动科技板块走强 [2] - A股估值仍处低位,沪深300市盈率12.3倍,较标普500显著折价 [3] 中国AI发展潜力与估值 - 中国AI综合水平仅次于美国,但科技龙头估值显著低于美股同类公司 [4] - 恒生科技动态市盈率12.9倍,较美股科技七姐妹折价55% [4] - 市场对中国AI优势认知不足,估值折价有望收窄至35% [4] AI技术突破与产业落地 - 国产大模型DeepSeekR1性能接近海外第一梯队,性价比优势显著 [5] - AI算力需求旺盛,国产AI芯片出货量达82万张,市场份额30% [6] - C端AI应用月活用户破亿,B端在营销、教育等领域渗透率较高 [7] 政策支持与产业集群 - 国家级政策推动AI技术突破,地方政策打造差异化竞争力 [8] - 杭州"六小龙"等AI产业集群涌现,政策助力场景应用落地 [8] 其他科技领域协同发展 - 创新药企进入商业化放量期,部分企业实现扭亏为盈 [9] - 中国全球创新指数排名第11位,高新技术企业达46.3万家 [9] - 信息技术市值占A股17%,科创板总市值同比增长30.5% [11] 资本市场未来展望 - 科技叙事逻辑清晰,有望经历强化、兑现、升级三阶段 [11] - 下一阶段或吸引亚太"长钱"及欧洲资本回流,推动全面重估 [11]