Workflow
含光800芯片
icon
搜索文档
自研芯片露真容 阿里“通云哥”角逐全球AI赛场
上海证券报· 2026-01-30 02:46
阿里巴巴AI战略与“通云哥”黄金三角 - 公司正式推出自研AI芯片“真武810E”,标志着其AI基础设施“黄金三角”——通义实验室(大模型)、阿里云(云计算)、平头哥(芯片)完成集结,公司已从电商公司转型为“电商+AI”双轮驱动的高科技企业 [1] - 目前,全球仅有阿里巴巴与谷歌两家公司同时在大模型、云计算、芯片三大领域均具备顶级实力 [1] - 公司历经17年持续投入,从2009年创建阿里云,到2018年成立平头哥,再到2019年启动大模型研究,最终在2026年实现全栈AI完整布局 [6] 平头哥与“真武”AI芯片详情 - “真武”PPU采用全栈自研的并行计算架构、片间互联技术及软件栈,内存为96G HBM2e,片间互联带宽达700GB/s,可应用于AI训练、推理和自动驾驶 [3] - 对比关键参数,“真武”PPU的整体性能已超过主流国产GPU [5] - 该芯片已在阿里云实现多个万卡集群部署,服务了国家电网、中国科学院、小鹏汽车、新浪微博等超过400家客户,并已大规模用于千问大模型的训练和推理 [5] - “真武”PPU已成为出货量最高的国产AI芯片之一 [6] 阿里云业务表现与定位 - 阿里云是全球四朵超级AI云之一,与亚马逊、微软、谷歌并列,在全球服务的客户数超过500万,市场份额稳居亚太第一 [6] - 2026财年第二季度,阿里云单季度营收达398.24亿元,同比增长34% [9] - 公司已将阿里云的新定位确立为“全球领先的全栈人工智能服务商”,并正在推进三年3800亿元的AI基础设施建设计划 [9] 通义实验室与千问大模型生态 - 千问大模型已实现“全尺寸、全模态”全面开源,累计开源超过400款模型,其衍生模型数量已突破20万款,全球下载量超10亿次,稳居全球第一 [6] - 在国内,千问已成为最受企业欢迎的大模型之一,服务各行业头部客户 [6] “通云哥”体系的协同效应与竞争优势 - “通云哥”体系被视作一台AI超级计算机,通过芯片、云平台、模型架构的协同创新,使阿里云上大模型的训练与调用效率达到最优 [7] - 对平头哥:可针对千问模型优化芯片,加速核心芯片从研发到应用的落地,并协同阿里云满足千问对大规模计算的需求 [7] - 对通义实验室:依托阿里云部署的自研芯片进行模型训练和推理,提升了研发与运行效率 [7] - 对阿里云:自研芯片大幅降低了供应链成本,并可提供差异化的算力和模型服务,提升市场竞争力 [7] - 全栈AI技术能力已成为阿里云的关键竞争优势 [7] 全球AI竞争格局与公司战略路径 - 亚马逊、微软、谷歌和阿里巴巴组成的“四强”格局占据超过80%的云平台市场份额 [8] - 竞争战略出现分化:亚马逊和微软采用“云+生态”模式,深度绑定外部模型公司(如OpenAI、Anthropic) [8] - 谷歌和阿里巴巴则选择了“全栈自研”路径,在云计算、基础大模型和AI芯片三个核心层面同时发力 [8] 公司未来展望与市场观点 - 随着模型能力增强和AI应用侧投入加大,公司可进一步拓展AI应用场景,市场看好阿里原生AI应用的突破潜力以及AI对生态内其他业务的赋能潜力 [9] - 市场分析认为,在增长再提速的背景下,阿里云有望迎来收入与估值的戴维斯双击 [9] - 自2023年提出“AI驱动”战略后,公司全面聚焦“电商、云+AI”核心主业,组织集中度和凝聚力得到提升,重新激活了市场竞争力 [9]
“真武”亮相,“通云哥”出道,阿里打出AI“同花顺”
上海证券报· 2026-01-29 14:45
阿里发布自研AI芯片“真武810E”与“通云哥”战略成型 - 平头哥正式发布自研AI芯片“真武810E”,标志着阿里自研芯片PPU亮相 [1] - 至此,通义实验室、阿里云、平头哥集结完毕,形成阿里AI“黄金三角”战略阵型“通云哥” [1][6] - 阿里与谷歌成为全球唯二同时在大模型、云计算、芯片三大领域均具备顶级实力的科技公司 [1][13] 平头哥与“真武”芯片技术细节 - 平头哥于2018年由阿里收购中天微与达摩院芯片团队整合成立,此前已推出含光800、倚天710等芯片 [3] - “真武”PPU采用自研并行计算架构和片间互联技术,实现软硬件全自研,内存为96G HBM2e,片间互联带宽达700GB/s [5] - 芯片性能据称超过主流国产GPU,与英伟达H20相当,性能稳定、性价比突出,市场供不应求 [5] - “真武”PPU已在阿里云实现多个万卡集群部署,服务国家电网、中国科学院、小鹏汽车、新浪微博等超过400家客户 [5] - 该芯片已大规模应用于千问大模型的训练和推理,并结合阿里云AI软件栈进行深度优化 [5] 阿里AI全栈布局历程 - **阿里云**:2009年创建,拥有自研云计算操作系统“飞天”,是全球四朵超级AI云之一,服务客户超500万,市场份额亚太第一 [7][11] - **平头哥**:2018年成立,陆续推出倚天710服务器CPU、含光800 AI推理NPU,“真武”PPU已成为出货量最高的国产AI芯片之一 [7] - **通义大模型**:2019年启动研究,实现“全尺寸、全模态”全面开源,累计开源超400款模型 [7] - 千问衍生模型数量突破20万,全球下载量超10亿次,稳居全球第一,是国内最受企业欢迎的大模型 [7] - 从2009年至2026年,历经17年持续投入,阿里最终实现全栈AI完整布局 [7] “通云哥”协同效应与战略路径 - “通云哥”体系集平头哥芯片、阿里云、千问大模型于一体,可在芯片、云平台和模型架构上实现协同创新,优化大模型训练与调用效率 [9] - 平头哥可针对千问模型优化芯片,加快核心芯片落地进程,并协同阿里云满足千问大规模计算需求 [9] - 通义实验室依托阿里云部署的自研芯片进行模型训练推理,提升研发与运行效率 [9] - 阿里云通过自研芯片降低供应链成本,并依托平头哥和通义实验室提供差异化算力与模型服务,提升市场竞争力 [10] - 全球AI云竞争形成“四强”格局(亚马逊、微软、谷歌、阿里巴巴),占据超80%云平台市场份额 [11] - 战略路径分化:亚马逊和微软采用“云+生态”模式,投资绑定外部模型公司;谷歌和阿里则选择“全栈自研”路径 [12][13] 公司战略投入与财务表现 - 阿里云新定位为全球领先的全栈人工智能服务商 [15] - 公司积极推进三年3800亿元人民币的AI基础设施建设计划,并会持续追加投入 [15] - 2026财年第二季度,阿里云单季度营收达398.24亿元,同比增长34% [15] - AI相关产品收入连续9个季度实现三位数增长,成为公司核心增长引擎 [15] - 公司自2023年提出“AI驱动”战略,全面聚焦“电商、云+AI”核心主业 [16] - “通云哥”成型标志着公司已从电商公司转型为“电商+AI”双轮驱动的高科技企业,有望迎来价值重估 [1][16][17]
追平英伟达 H20!阿里真武 810E 芯片亮王牌
是说芯语· 2026-01-29 10:29
核心观点 - 阿里巴巴集团旗下平头哥正式发布高端AI训推一体芯片真武810E,并首次完整披露了由通义实验室、阿里云、平头哥组成的全栈AI战略阵型“通云哥”,标志着公司在AI芯片领域的布局迎来关键落地,并构建起从芯片、云平台到模型算法的全链路AI生态 [1][3] 产品发布与战略阵型 - 平头哥发布高端AI训推一体芯片真武810E,该芯片即此前央视报道过的阿里自研PPU芯片 [1] - 由通义实验室、阿里云、平头哥组成的阿里巴巴AI黄金三角“通云哥”战略阵型首次正式浮出水面 [1][3] - “通云哥”阵型正朝着AI超级计算机方向迭代,整合了平头哥全栈自研芯片、阿里云及千问大模型三大核心优势,实现芯片、云平台与模型架构的协同创新 [4] 产品技术与性能 - 真武810E采用平头哥自研并行计算架构与ICN片间互联技术,单卡配备96GB HBM2e内存,搭载7个独立ICN链路,片间互联带宽高达700GB/s [4] - 芯片可根据需求灵活配置多卡组合,广泛适配AI训练、推理及自动驾驶等场景 [4] - 业内人士透露,真武PPU整体性能超越英伟达A800及主流国产GPU,与英伟达H20处于同一水平线;其升级版产品性能更优于英伟达A100 [4] - 平头哥自研的ICN技术凭借高性能、高带宽、低延迟特性,成为支撑大模型训推的关键技术 [5] 市场应用与客户验证 - 真武810E芯片已在阿里云完成多个万卡集群部署,目前服务国家电网、中科院、小鹏汽车、新浪微博等400余家政企及企业客户 [3] - 应用覆盖能源、科研、汽车、互联网等多个核心领域,规模化应用能力得到充分验证 [3] - 阿里巴巴已将真武PPU大规模应用于千问大模型的训练与推理环节,并结合阿里云完整AI软件栈提供“芯片+云+模型”一体化解决方案 [4] 产品矩阵与公司定位 - 平头哥已构建多元化芯片产品矩阵,涵盖AI推理芯片含光800、训推一体AI加速芯片真武810E、Arm服务器CPU倚天710、高性能SSD主控芯片镇岳510,以及超高频RFID电子标签芯片羽阵611、羽阵600等 [3] - 公司核心定位为AI时代芯片基础设施创新者,聚焦数据中心算力、存力、网力芯片及IoT芯片研发,通过端云一体全栈产品系列提供普惠算力 [7] 软件生态与开发优势 - 平头哥自主研发的AI产品软件栈具备完备工具链与独立知识产权,拥有统一编程接口,可端到端支持用户业务落地 [5] - 软件栈优势体现在高效性与高兼容性:用户可通过API基于SDK直接开发适配应用;沿用主流编程环境,开发者无需修改应用代码即可调用统一API适配主流AI生态 [5] 应用场景适配能力 - 真武810E覆盖四大核心应用领域:自动驾驶、AI训练、AI推理及多模态模型 [6] - 在自动驾驶领域,芯片已兼容超过50个自动驾驶常见模型,全面支持感知、预测、端到端等多种模型架构,并已实现万卡级别集群部署 [6] - 在AI训练领域,原生支持多类框架,依托高速片间互联技术实现优异的集群线性加速比 [6] - 在多模态模型领域,芯片在文生视频、图文生视频、图文生文等场景的训推实测中表现突出 [6] 发展历程与未来规划 - 阿里巴巴历经17年战略投入,从2009年创建阿里云,到2018年成立平头哥,再到2019年启动大模型研究,最终完成“通云哥”全栈AI生态的完整布局 [7] - 未来,平头哥将持续深耕高性能、高性价比自研数据中心芯片,以软硬一体解决方案加速新一代数据中心规模化部署,推动AI技术从数字世界向物理世界深度渗透 [7]
H200批准对华出口,2026年GPU还扛得住吗?
钛媒体APP· 2026-01-14 19:13
美国对华AI芯片出口政策调整 - 美国政府批准英伟达向中国出口其人工智能芯片H200,预计将重启对华出货[1] - 对华销售将由美国商务部负责审批和安全审查,美方将从相关交易中收取约25%的费用[1] - 同样的安排也将适用于其他人工智能芯片公司,如AMD和英特尔[1] - 英伟达CEO黄仁勋表示,中国是一个非常大的人工智能市场,再过两到三年,中国人工智能市场规模可能会达到500亿美元[1] 国产GPU行业迎来上市热潮与技术突破 - 2025年国产GPU公司密集上市:摩尔线程、沐曦股份成功登陆科创板,壁仞科技、天数智芯加速冲刺港股[3] - 摩尔线程上市首日股价大幅上扬468.8%,总市值迅速攀升至3055亿元[3] - 沐曦股份上市首日收盘涨幅高达692.95%[3] - 2025年全球GPU市场规模预计突破3500亿美元,中国占比接近40%[4] - 国产GPU企业取得技术突破:摩尔线程基于MUSA架构推出“花港”架构,算力密度提升50%,效能提升10倍[4];壁仞科技推出性能对标英伟达A100/H100的BR100芯片[4];天数智芯成为国内首家实现7nm GPGPU量产的企业[4] - 商业化层面,国产GPU已切入政务云、智算中心等核心场景[4] 国产GPU面临的生态与系统级挑战 - 国产GPU的突破仍停留在“单点技术达标”层面,尚未形成“全栈生态闭环”的核心竞争力[5] - 与英伟达相比,在高速互连协议、大规模集群调度等关键环节存在明显短板[5] - 英伟达的CUDA生态覆盖了90%以上的AI框架,形成了短期难以撼动的壁垒[5] - 国产GPU厂商各自为战的指令集与软件栈,导致开发者适配成本高昂[5] ASIC芯片对GPU市场的冲击与替代趋势 - 云服务厂商越来越偏爱自研ASIC芯片[8] - 集邦咨询预测,2026年云服务厂商对自研ASIC的需求增速将大幅领先GPU,其中ASIC增长率预计达44.6%,远超GPU的16.1%[9] - 谷歌推出第7代TPU芯片Ironwood,训练和推理性能比第六代TPU提升4倍[9] - 谷歌计划在2026年将TPU芯片产能提升至430万颗,其中新一代V8系列合计占比达65%[9] - 亚马逊推出首款3nm AI芯片Trainium 3,计算能力较Trainium 2大幅提升[10] - Meta与Broadcom共同开发下一代MTIA v2,微软下一代Maia v2的设计也已定案[10] - 国内云服务企业也推出自研ASIC芯片,如阿里巴巴的含光800、百度的昆仑芯、腾讯的紫霄芯片等[10] - 野村证券报告称,目前英伟达GPU在AI服务器市场中占据超过80%的份额,而ASIC仅占约8%-11%[11] - 野村证券预测,到2025年,仅谷歌和亚马逊两家的ASIC出货量就可能达到英伟达GPU出货量的40%至60%[11] - 高盛预测ASIC服务器将在2025至2026年间占据全球AI服务器市场38%至40%的份额[12] 存算一体技术对GPU构成的新挑战 - 存算一体技术旨在解决传统计算架构中数据搬运导致的“冯·诺依曼瓶颈”[13] - 在处理大模型推理时,数据搬运产生的能耗可能占到近50%[15] - 存算一体技术能将数据搬运产生的损耗降低60%以上,在低功耗场景下优势明显[15] - 该技术产业化逻辑是从GPU不擅长的场景突破,与GPU形成“互补竞争”[15] - 自2017年起,英伟达、微软、三星等大厂提出了存算一体原型,同年国内存算一体芯片企业开始涌现[15] - 国内初创企业如知存科技、亿铸科技、九天睿芯等押注不同的存算一体技术路线,分别专注于大算力场景和边缘小算力场景[16] GPU的固有优势与巨头的反击策略 - GPU在大模型训练、复杂科学计算等需要多任务并行处理的场景里,通用性和灵活性是ASIC、存算一体短期内比不了的[18] - 2025年12月24日,英伟达以200亿美元收购推理芯片独角兽Groq的核心技术与团队[19] - Groq的LPU芯片以5-10倍于GPU的速度优势,以及1/10的成本优势,切中了英伟达在推理赛道的核心短板[19] - 此次收购延续了英伟达通过并购补全生态、巩固优势的一贯策略[20] - 未来在大模型训练等通用算力场景,GPU仍将保持核心优势;而在推理、边缘计算等细分领域,其与ASIC、存算一体芯片的“互补共存”将成为主流[20]
AI让边缘更智能 边缘让AI无处不在
搜狐财经· 2025-12-13 10:18
行业背景与政策驱动 - 自2012年起,国家部委持续出台政策推动城市管理与服务智能化、智慧化 [3][27] - 截至2019年底,全国100%的副省级城市、95%以上的地级市、50%以上的县级市均提出建设新型智慧城市 [1][3][13] - 已有32个主要城市成立了专门的大数据管理机构,负责智慧城市建设 [1][3][13] - 视频数据作为城市主要数据之一,其视觉AI分析需求不断增长,对专业度要求越来越高 [1][3][13] 产品定位与核心价值 - 阿里云重磅升级“混合云视觉AI一体机”,旨在通过AI让边缘更智能,助力企业在5G时代快速创新 [3][15][27] - 该产品主要面向城市交通出行和城市服务场景,提供软硬件一体化解决方案 [4][16][28] - 产品旨在解决城市视频规模庞大带来的带宽、机房承载、建设成本高企,以及端侧设备算力不足、大规模云平台建设周期长、成本高、可复制性弱等问题 [11][23][35] - 产品通过预安装、预集成、深度调优,能极大简化IT架构,提升部署和运维效率,实现快速复制推广 [3][4][16] 产品架构与技术特性 - 产品形态包含支撑云边协同计算的硬件矩阵体系与统一的IaaS底座,在边缘侧提供计算、数据库、存储等基础云能力 [4][16][28] - 一体机内置视觉AI PaaS组件,如视频网关、视觉算法智能调度引擎、视图库等 [4][16][28] - 基于混合云统一基座,实现对PaaS和IaaS的统一运维,对外呈现一套系统,对标云原生解决方案 [6][18][30] - 产品集成了达摩院城市视觉智能引擎,该引擎是首批国家人工智能开放创新平台之一,也是全球最大规模的人工智能公共系统之一 [6][18][30] - 产品采用高度收敛的标准化硬件,由阿里集团深度优化定制,网络设备支持特有隔离映射功能,最少仅需4个外部IP即可完成部署,提升了网络稳定性与安全性 [7][19][31] 产品规格与性能 - 产品已形成密集计算型、计算存储型、NPU增强型和嵌入式阵列四种主要规格,以适应不同场景的算力需求 [5][17][29] - NPU增强型使用了阿里巴巴自研的含光800芯片,极大增强了视频分析处理能力 [5][17][29] - 嵌入式阵列面向人机共存场景,极大降低了功耗和噪音,可部署于日常办公环境 [5][17][29] - 采用自研NPU芯片(含光800),硬件性能提升60% [9][21][33] - 采用自研向量快速比对算法,可实现百亿底库检索2秒返回,亿级静态库比对1000 QPS [9][21][33] 核心功能与算法能力 - 具备统一调度能力,通过算法集成开发功能打破“烟囱式”建设,兼容多厂家算法,并基于K8s实现资源池化共享和统一纳管 [10][22][34] - 包含达摩院城市大脑实验室研发的100多种城市视觉AI算法,提供全面、全量、实时的智能分析能力 [11][23][35] - 提供达摩院大量的视觉图像认知理解和归纳推理算法服务,服务于交通、应急、电力、环保等十多个城市职能部门 [7][19][31] 应用场景与案例 - 产品广泛应用于高速、交管、安全生产、住房建设等10多个场景 [11][23][35] - 在某城市大脑建设中,通过该产品实现边缘侧视频智能结构化分析,并汇聚到云中心,结合多源数据融合与数字孪生技术,实现交通规律分析和问题诊断,极大提升了交通出行效率 [11][23][35] - 2019年,阿里云联合达摩院、高德搭建“交通数据中台”,在边缘侧通过该产品及达摩院AI算法,对高速路段过车图片实现实时全量结构化分析,并在云中心进行数据融合纠偏,推动了高速自由流场景下稽查业务的智能化升级 [12][24][36] - 产品针对边缘节点百路至千路规模的中小规模视频分析需求,提供快速、轻量的视频分析解决方案,实现云边结合的城市超大规模视频分布式处理 [12][24][36]