AI芯片自研趋势与云厂商优势 - 在AI竞赛中,无论是多模态还是基模厂商,选定赛道后必然走向设计极致适配自身业务的芯片底座[2] - 通用GPU为适配多元场景而设计,存在大量冗余逻辑单元和复杂架构,导致计算阵列无法为特定AI任务深度定制,且多芯片组网存在显著的互联通信开销,直接影响效率[2] - 云厂商为追求效率开始自研芯片,以摆脱对英伟达的依赖[3] - 云厂商凭借场景与研发的闭环优势,通过真实业务负载与模型运行数据反向定义芯片设计,将AI高频算子与核心计算逻辑固化为硬件电路,从根源上削减冗余,实现效率最大化[3] - 采用“From cloud to chip”(从云到芯)思路搭建自研算力基座已成为行业主流选择,让最终解决方案天生具备大规模组网、集群调度和云上原生适配的优势[6] 平头哥“真武810E”芯片性能与优势 - 平头哥半导体于1月29日正式公布高端AI芯片“真武810E”[3] - 该芯片研发始于2020年,于2022年底至2023年初完成研发和场景验证[4] - 芯片配备96GB HBM2e高带宽内存,可承载千亿参数大模型训练推理与长序列任务,3D堆叠设计优化了功耗与散热[6] - 片间互联带宽达700GB/s,基于自研ICN链路与7个独立ICN端口,集群加速比高、多卡扩展灵活,带宽超越英伟达A800[6] - PCIe 5.0×16接口带来单向63GB/s、双向128GB/s带宽,是PCIe 4.0的2倍,能降低主卡间数据传输瓶颈[7] - 芯片功耗为400W,低功耗设计可实现更密集机柜部署,提高能效比,降低数据中心运营成本与PUE[7] - 据媒体报道,真武PPU累计出货量已达数十万片,超过寒武纪,在国产GPU厂商中属于第一梯队[7] - 当前推理算力需求已占据AI应用企业70%的成本权重,该芯片通过超大带宽、高容量内存打破内存墙限制,加速高性价比商业化推理业务[8] - 芯片重点拓展大型车企及金融行业,其算力水平精准匹配车企介于L20与H20之间的需求,并在某银行数十台算力服务器招标中脱颖而出[21][22] 阿里“通云哥”全栈自研生态闭环 - 真武810E的亮相,标志着阿里形成了“平头哥(芯片)+阿里云(平台)+通义实验室(模型)”的“通云哥”黄金三角闭环生态[4][14] - 平头哥构建了“镇岳510 SSD主控芯片 + 倚天710 CPU + 真武810E”的“存储-计算”芯片协同闭环[11] - 全栈自研方案首要价值在于实现供应链安全自主,例如用自研芯片组合搭配PSLC NAND闪存,实现对Intel傲腾产品的国产化替代[11] - 自研硬件深度协同优势包括:缩短CPU与GPU间的PCIe传输延迟,优化异构算力调度;让SSD主控逻辑直接匹配CPU内存控制器与IO调度策略,提升4K随机读写性能[12][13] - 真武810E已经在阿里云实现多个万卡集群部署,为芯片规模化部署提供了领先验证平台[14] - 在自研芯片与阿里云加持下,通义千问模型的训练推理效率实现阶梯式提升[15] - 真武810E针对Qwen3等主流MoE架构模型完成了算子深度优化、张量并行调度等专项适配,可高效支撑千亿乃至万亿参数大模型的分布式训练与高并发推理[15] 阿里AI战略布局与市场影响 - 公司自2018年开启面向AI的战略布局,当年全资收购中天微,随后整合成立平头哥半导体,布局前瞻性领先于当前国产GPU厂商[17] - 2019年通义实验室启动大模型研发,2021年全球首个十万亿级参数大模型M6成功落地,如今千问大模型家族已跻身全球第一梯队开源模型[18] - 阿里云投入研发HPN 7.0智算集群网络架构,成为SIGCOMM历史上首个AI智算集群网络架构成果,支撑通义千问2.5版本中文性能达到世界顶尖[17] - 凭借完整AI全栈技术体系,公司相关解决方案已服务小鹏汽车、国家电网、中科院、新浪微博等400余家行业标杆客户[23] - 市场数据显示,真武GPU已成为出货量最高的国产GPU之一、千问在中国企业级大模型调用市场中位居第一、阿里云季度营收达398.24亿元,同比增长34%[15] - 全景视角下,阿里已具备对标“英伟达+甲骨文+OpenAI”组合的生态化能力,在全球AI竞争中处于领先身位[15]
真武810E亮相,阿里如何「重构」估值?