Workflow
算力自由
icon
搜索文档
平头哥AI芯片内供转外销
经济观察报· 2026-02-11 15:53
文章核心观点 - 阿里巴巴旗下芯片公司平头哥已从服务内部的“成本中心”转向寻求外部商业化和独立发展的“利润中心”,其高端AI芯片“真武810E”性能对标英伟达H20,并已实现数十万片的出货量,标志着公司在国产AI算力市场商业化的重要突破 [2][3][9][11] 平头哥的成立背景与战略定位 - 阿里基于对“算力自由”的刚需启动造芯,其逻辑与谷歌自研TPU类似,旨在支撑自身庞大的电商、搜索、广告及云服务体系,并应对密集的推理需求和成本压力 [5] - 阿里在2017年宣布3年投资1000亿元用于基础科学研究,并于2018年通过收购中天微与达摩院自研芯片业务整合,成立了独立运营的芯片公司平头哥 [5] - 平头哥最初建制归属达摩院,后经过调整,其唯一股东变更为平头哥(上海)技术有限公司,公司内部形成上海团队研发云端算力芯片、杭州团队研发RISC-V处理器芯片的分工 [5][6] “真武810E”芯片的研发与亮相 - 平头哥高端AI芯片“真武810E”对标英伟达H20,采用自研并行计算架构,拥有96GB HBM2e显存,片间互联带宽高达700GB/s,应用于AI训练、推理和自动驾驶等领域 [7] - 该芯片的PPU(并行计算处理器)研发项目于2020年低调启动,其首次在公众视野露面是2025年9月央视《新闻播》中关于中国联通智算中心报道的一秒画面,结束了长达数年的秘密研制状态 [2][7] - “真武810E”在2026年1月官网上线时,直接公布其出货量已达数十万片,而同期多数国产AI芯片厂商的出货量还在数万卡级别徘徊 [2][9] 从内部供应到外部商业化的转变 - 过去平头哥被视为阿里的“内部车间”或“成本中心”,其芯片如倚天710、含光800主要供阿里内部消化,以最低成本满足自身需求并进行优化 [3][9] - 目前“真武810E”系列PPU的外部客户已超过400家,包括国家电网、小鹏汽车、新浪微博等,公司展现出明确的商业化诉求和独立生存的意愿 [9][11] - 平头哥背靠阿里云,提供“云芯一体”服务,例如为社交平台的大规模推荐算法业务提供服务,能将推理成本降低超20%,并凭借阿里云服务500万客户的生态拥有天然应用场景 [10] 行业竞争与市场前景 - 2025年巨头在AI芯片领域动作频繁:腾讯投资的燧原科技已完成IPO辅导,百度旗下的昆仑芯已向港交所递表,平头哥谋求上市的消息也广为流传 [2] - 第三方研究机构Bernstein Research预测,2026年中国本土AI芯片厂商份额将显著增长,其中华为或将成主导,平头哥则以约5%的市场份额居于第五位 [11] - 行业正迎来国产替代的时代红利,但包括平头哥在内的厂商仍面临先进制程受限的普遍挑战 [12]
平头哥AI芯片内供转外销
经济观察网· 2026-02-11 14:29
公司产品与研发进展 - 平头哥半导体有限公司是阿里巴巴旗下独立运营的芯片公司[2] - 2025年9月,平头哥从未公开过的PPU(并行计算处理器)在央视《新闻联播》中意外曝光,结束了其长达数年的秘密研制状态[2][8] - 2026年1月29日,平头哥正式发布高端AI芯片“真武810E”,其性能直接对标英伟达的H20芯片[3][7] - “真武810E”采用自研并行计算架构,拥有96GB HBM2e显存,片间互联带宽高达700GB/s,应用于AI训练、推理和自动驾驶等领域[9] - 该芯片在发布时已实现出货量达数十万片,外部客户超过400家,包括国家电网、小鹏汽车、新浪微博等[3][11] - 平头哥在2020年低调启动PPU研发,一款PPU从研发设计到流片通常消耗1-2年时间[7][8] - 公司首款AI芯片含光800于2019年亮相,从设计到流片只用了一年半[6] 公司发展历程与战略 - 阿里巴巴的造芯逻辑源于对算力自由的刚需,以支撑其庞大的电商、搜索、广告及云服务体系[5] - 2017年,阿里宣布3年投资1000亿元投入基础科学研究,包括芯片技术[5] - 平头哥于2018年阿里云栖大会上宣布成立,其前身整合了阿里收购的中天微系统有限公司与达摩院自研芯片业务[5] - 公司最初投入IoT芯片,后分为两支:一支在上海自研云端算力芯片,另一支在杭州研发玄铁等RISC—V处理器芯片[6] - 2023年组织调整后,平头哥的唯一股东变更为平头哥(上海)技术有限公司[6] - 2025年,阿里管理层宣布投入3800亿元布局AI,平头哥战略地位提升[13] - 阿里提炼出“通云哥”一词概括其AI战略,由通义实验室、阿里云、平头哥构成“大模型+云+芯片”全栈架构[13] 商业模式与市场表现 - 平头哥长期以来主要作为阿里的内部供应商,其芯片首供阿里内部使用,以实现成本最低化和应用优化[10][11] - 公司产品如倚天710、含光800等芯片过去主要在阿里内部消化[11] - 目前,平头哥正从“内供”转向商用,其“真武”系列PPU作为服务器芯片投入使用,能为客户(如社交平台的推荐算法业务)将推理成本降低超过20%[11][12] - 平头哥背靠服务500万客户的阿里云,生来就带有应用场景,提供“云芯一体”服务,降低了客户(如车企)迁移算法的成本[11][12] - 第三方研究机构Bernstein Research预测,在2026年中国本土AI芯片厂商份额将显著增长,其中平头哥预计以约5%的市场份额居于第五位[13] - 2026年1月,关于阿里有意推动平头哥独立上市的消息引发市场震动,阿里美股应声大涨[12] 行业背景与竞争态势 - 2025年,国内AI芯片领域动作频频,腾讯投资的燧原科技已完成IPO辅导,百度旗下的昆仑芯已向港交所递表[4] - 谷歌自研TPU(张量处理器)的成功为科技巨头自研芯片提供了可行路径,其TPU已从支持内部业务发展为开放给云客户的商业化产品[5] - 在AI模型训练领域,没有英伟达芯片就炼不出超大参数模型曾长期是行业共识[10] - 当前多数国产AI芯片厂商的出货量还在数万卡级别徘徊,而平头哥“真武810E”已公布出货量达数十万片[11] - 有客户(如车企)反映,英伟达算力卡虽能力优越,但“又贵又难抢”,需要稳定、有大规模部署案例的备选方案[11] - 包括平头哥在内的AI芯片厂商正迎来国产替代的时代红利[14] - 行业依然面临先进制程受限的现实挑战[15]
奇瑞尹同跃:对标特斯拉FSD,更要实现“算力自由”;全球最大汽车供应商预警利润跌破2%丨汽车交通日报
创业邦· 2026-01-18 18:23
奇瑞汽车AI战略与产品规划 - 奇瑞汽车董事长尹同跃表示,公司正派人赴美体验特斯拉FSD与Grok模型组合,以对标其智能座舱与驾驶水平并快速追赶[1] - 奇瑞在“2026奇瑞汽车AI之夜”上展示了全域AI战略技术蓝图,核心成果包括超级AI智能体“小奇同学”、猎鹰智驾、灵犀智舱及墨甲机器人[1] - 公司宣布其AI智能化正式进入AI+ 2.0时代,加速从“技术奇瑞”向“全球AI科技公司”全面跃迁[1] - 在智能驾驶领域,“猎鹰智驾”系列计划在2026年搭载超过35款车型,以推动高阶智能驾驶的普及[1] 博世集团财务表现与经营压力 - 全球最大汽车零部件供应商博世预计其2025年营业利润率将明显低于2%,远未达预期目标[2] - 博世2024年营业利润率已从2023年的4.8%下降至3.5%[2] - 2025年利润缩水部分源于高达31亿欧元的重组成本(主要为裁员拨备),约占其销售额的3.5%[2] - 博世2025年营收预计约为910亿欧元,略高于2024年的900亿欧元,但增长主要得益于收购江森自控-日立公司带来的约40亿欧元收入;剔除该并购影响,按可比口径计算其实际营收出现下滑[2] 理想汽车辅助驾驶运营数据 - 理想汽车发布的“理想辅助驾驶2025年出行报告”显示,其辅助驾驶累计用户达150.5万人,累计行驶里程超60亿公里,其中2025年辅助驾驶里程为30.7亿公里[3] - 理想辅助驾驶用户活跃率高达99.5%[3] - 2025年度,理想汽车单日辅助驾驶里程超1000公里的次数达36643次,单个用户最长辅助驾驶里程为11.9万公里[3] - 其VLA语音指挥功能累计使用1225.4万次,用户驾驶偏好累计记忆20.1万次[3]
奇瑞尹同跃:对标特斯拉FSD,更要实现“算力自由”
第一财经· 2026-01-18 17:44
奇瑞汽车AI战略与成果 - 公司于2026年1月17日举办“2026奇瑞汽车AI之夜”,主题为“科技有AI”,并展示了全域AI战略技术蓝图[3] - 公司核心AI成果集体亮相,包括超级AI智能体“小奇同学”、猎鹰智驾、灵犀智舱、墨甲机器人[3] - 公司宣布其AI智能化正式进入2.0(AI+)时代,加速从“技术奇瑞”向“全球AI科技公司”全面跃迁[3] 智能驾驶发展规划 - 在智能驾驶领域,“猎鹰智驾”系列持续进化,并计划在2026年搭载超过35款车型,以加速高阶智能驾驶的普及[3] - 公司正不断派人到美国体验特斯拉的FSD+Grok模型组合,并与特斯拉的舱驾水平对标,以找出差距并快速追赶[3] 公司对AI的认知与战略定位 - 公司董事长尹同跃将AI比喻为时代的“文字”、“蒸汽机”与“电力”,认为AI是催生新智能形态、重构一切产业的核心力量[3] - 公司认为所有产业,特别是汽车产业,都值得也必须被AI重构一遍,因此将坚定不移、不遗余力地拥抱AI[3] - 公司以汽车为基石,推动AI向物理世界全面延展[3] AI与汽车产业融合面临的挑战 - 公司认为AI与汽车产业高度融合发展面临三大挑战:安全挑战、法律与伦理挑战、质量管理的挑战[4] - 安全是首要验证关,因为汽车承载生命安全[4] - 法律与伦理挑战涉及建立符合人类价值观的AI治理架构[4] - 质量管理挑战在于需建立适配AI研发的新逻辑,确保AI系统在全生命周期中稳定、可靠、可追溯[4] AI发展的基础设施与能源布局 - AI算力背后是高算力芯片和能源,全球算力爆发式增长将伴随巨大的能源需求和新的基建需求[5] - 公司已成立芯片研究院和绿色能源公司,并参与一些更新的能源技术,旨在让AI“有芯”,为算力“供能”[5] - 公司希望人类从追求出行自由,转变为追求算力自由和能源自由[5] 汽车产业的新使命与AI愿景 - 在汽车工业与智能文明的历史交汇点,汽车被赋予新使命,成为塑造未来文明形态的关键起点[5] - 公司相信AI的终极意义是让技术普惠大众,让产业发展更繁荣,让未来社会更富有、更公平、更有温度[5]
奇瑞尹同跃:对标特斯拉FSD,更要实现“算力自由”
第一财经· 2026-01-18 14:47
公司AI战略与愿景 - 公司提出从“技术奇瑞”向“全球AI科技公司”全面跃迁,其AI智能化正式进入2.0(AI+)时代 [1] - 公司董事长尹同跃将AI比作时代的“文字”、“蒸汽机”与“电力”,认为所有产业特别是汽车都值得也必须被AI重构一遍 [1] - 公司展示全域AI战略技术蓝图,包括超级AI智能体“小奇同学”、猎鹰智驾、灵犀智舱、墨甲机器人等核心成果 [1] 智能驾驶与产品规划 - 在智能驾驶领域,“猎鹰智驾”系列持续进化,并计划在2026年搭载超过35款车型,以加速高阶智能驾驶的普及 [1] - 公司正不断派人到美国体验特斯拉的FSD+Grok模型组合,并与特斯拉的智能座舱和驾驶水平进行对标,以找出差距并快速追赶 [1] AI发展面临的行业挑战 - AI与汽车产业融合面临三大挑战:首先是安全的挑战,汽车作为承载生命安全的产品,安全是首要验证关 [2] - 其次是法律与伦理的挑战,行业需建立符合人类价值观的AI治理架构 [2] - 第三是质量管理的挑战,必须建立一套适配AI研发的质量管理新逻辑,确保AI系统在全生命周期中的稳定、可靠与可追溯 [2] 算力、芯片与能源布局 - AI算力的背后是高算力芯片和能源,全球算力的爆发式增长将伴随巨大的能源需求和中国新的基建需求 [2] - 公司已成立芯片研究院和绿色能源公司,并参与一些更新的能源技术,旨在让AI“有芯”,为算力“供能” [2] - 公司董事长希望人类从追求出行自由,转变为追求算力自由和能源自由 [1][2] 对汽车产业未来的展望 - 在汽车工业与智能文明的历史交汇点,汽车被赋予新使命,成为塑造未来文明形态的关键起点 [2] - 公司相信AI的终极意义是让技术普惠大众,让产业发展更繁荣,让未来社会更加富有、公平和有温度 [2]
DeepSeek V3到V3.1,走向国产算力自由
虎嗅APP· 2025-08-24 17:02
DeepSeek-V3.1技术升级 - 公司发布V3.1版本采用混合推理架构,同时支持思考模式和非思考模式,提高思考效率并减少token消耗和时间成本[6] - 模型通过后训练优化提升Agent能力,外扩训练增加840B token,上下文长度和两种模式均达到128k[8] - API Beta接口支持strict模式Function Calling,提升工程可靠性和企业易用性,并增加对Anthropic API格式支持以渗透其企业市场[8][9] UE8M0 FP8超低精度创新 - 公司采用UE8M0 FP8 Scale参数精度,这是一种对数数值系统(LNS)特化实现,用于存储缩放因子而非直接权重[11][13][24] - 该格式兼容MXFP8标准,可在支持该标准的硬件(包括英伟达Blackwell和国产GPU)上直接运行,减少75%内存使用并提升训练推理效率[4][13][27] - 超低精度设计覆盖极宽动态范围,通过软件定义适配国产芯片,使国产GPU能高效运行大模型[13][24][27] 算力自主战略路径 - 公司分两阶段突破:先通过魔改PTX指令集最大化利用英伟达GPU算力利用率,再通过UE8M0 FP8降低算力物理需求适配国产芯片[4][26][27] - 软硬件协同优化构建"算力无关"模型生态,长期减少对进口先进GPU依赖并推动国产芯片生态发展[4][27][32] - 超低精度技术加快国产下一代GPU推出(如寒武纪、沐曦、燧原、昇腾),形成去英伟达化路线[14][27][32] 对英伟达市场的影响 - UE8M0 FP8技术降低对H20/B30等缩水版芯片需求,国产芯片生态完善将削弱CUDA锁定效应[29][30][32] - 英伟达优势仍存于G200的更大带宽、更强互联和显存以及CUDA生态绑定,但低成本训练路径弱化其必选性[32] - 公司技术路线可能影响英伟达中国市场策略,中长期国产方案更受成本敏感企业青睐[29][30][32]
DeepSeek V3到V3.1,走向国产算力自由
虎嗅· 2025-08-24 08:33
技术升级与架构创新 - DeepSeek-V3.1采用混合推理架构,同时支持思考模式和非思考模式,提升模型灵活性和效率[3] - 模型通过后训练优化显著增强Agent能力,在工具使用和智能体任务中表现提升[6] - 基础模型在V3基础上新增840 B token的外扩训练,上下文长度和双模式均扩展至128k[7] - 引入UE8M0 FP8 Scale参数精度,最多减少75%内存使用,大幅提升训练和推理效率[1][13] - UE8M0 FP8格式兼容MXFP8标准,可直接在支持该标准的硬件上运行,无需额外转换[14][15] 算力优化与硬件适配 - 公司通过魔改英伟达PTX指令集提升GPU算力利用率,最大化挖掘现有硬件潜力[33] - UE8M0 FP8格式采用对数数值系统特性,覆盖极宽动态范围,适合低算力环境工程优化[14][30] - 超低精度技术降低对进口GPU依赖,适配寒武纪、沐曦、燧原、昇腾等国产芯片[1][16][34] - 软件定义策略使模型与多种芯片适配,推动国产芯片实现前沿大模型训练推理[15][35] 企业服务与生态建设 - API Beta接口支持strict模式Function Calling,提升工程可靠性和企业易用性[8] - 新增Anthropic API格式支持,便于Claude用户迁移,直接渗透其企业市场份额[9] - 升级后模型在保持性能同时降低价格,凸显性价比创新优势[7] - 技术路线旨在构建"算力无关"模型生态,减少对CUDA生态依赖[35][42] 行业竞争与市场影响 - 超低精度技术可能削弱英伟达H20/B30芯片在中国市场竞争力[37][39] - 国产AI软件栈逐步成熟,中长期将降低对英伟达芯片需求[38] - 国际厂商仍优先选用英伟达G200追求极致性能,但中国厂商形成去英伟达化路径[40][42] - 技术突破激活资本市场,推动算力自主进程[2][10]