MTIA v2芯片
搜索文档
突发,Meta放弃一颗自研芯片,拥抱谷歌TPU
半导体行业观察· 2026-02-27 10:19
公司自研芯片战略与挑战 - Meta公司内部自研AI训练芯片项目屡次受挫,已放弃代号为Iris的第二代训练芯片和更先进的代号为Olympus的训练芯片[2] - 放弃Olympus芯片的原因在于,高管认为在与OpenAI和Google竞争时,使用自研芯片训练新模型存在重大风险,包括软件稳定性不如英伟达产品以及复杂设计难以大规模生产[2] - 作为替代方案,Meta已与谷歌签订一项价值数十亿美元的协议,租用谷歌的AI芯片(张量处理单元TPU)来开发新AI模型,此举将加剧谷歌与英伟达的芯片竞争[2] 公司自研芯片的财务与技术动因 - 公司自研芯片是旨在克服现成AI加速器在技术和财务方面局限性的深思熟虑战略[4] - 从财务角度看,鉴于公司预计2025年收入约为1900亿至2000亿美元,资本支出约为660亿至720亿美元(按中值计算约占总收入的61%),即使基础设施成本降低几个百分点也能对盈利能力产生重大影响[4] - 公司希望跳过Arm架构,直接采用开源但尚未成为主流的RISC-V架构来构建其未来的计算引擎[5] - 公司于2020年开始定制芯片研发,并于2023年5月推出第一代Meta训练和推理加速器(MTIA)v1,该芯片只能进行推理,不能进行训练[5] - 研发MTIA芯片的原因是GPU并非总能以其所需的效率水平高效运行公司的特定推荐工作负载,因此设计了一系列专用于推荐的ASIC芯片[5] MTIA推理芯片的技术演进 - MTIA v1是包含芯片、PyTorch和推荐模型在内的全栈协同设计解决方案,采用台积电7nm工艺制造,运行频率800 MHz,在INT8精度下可提供102.4 TOPS运算能力,在FP16精度下可提供51.2 TFLOPS运算能力,热设计功耗为25 W[6] - 2024年4月,公司发布了性能大幅提升的MTIA v2,其推理能力有所提高,但仍无法进行训练[6] - MTIA v2采用台积电5nm工艺制造,时钟频率提升68.8%至1.35 GHz,芯片面积从v1的373平方毫米增大12.9%至421平方毫米,功耗增加了2.6倍达到90瓦[7] - 在矩阵运算中增加了稀疏性支持,性能提升了近7倍,矢量核心上的SIMD操作性能提高了72.5%[7] - 两代芯片均采用基于RISC-V内核的处理单元阵列,由负责标量运算和向量运算的两个内核组成[9] 通过收购Rivos增强芯片能力 - 2025年10月,Meta收购了人工智能芯片初创公司Rivos[11] - Rivos成立于2021年9月,创始团队拥有丰富的芯片设计行业经验,来自苹果、博通、高通、英特尔等公司[12] - Rivos成功流片了3.1 GHz处理器,并构建了兼容英伟达CUDA的软件栈,使得为NVIDIA生态系统开发的AI工作负载能够在RISC-V硬件上无缝运行[13] - Rivos的设计为从模型训练到推理等一系列工作负载提供了可扩展性和能效,其架构通过最大限度地减少外部数据传输和降低功耗来消除计算和内存资源之间的不平衡[13] - Rivos提供的芯片结合了高性能服务器级RISC-V CPU和针对大型语言模型优化的数据并行加速器,CPU与并行计算紧密集成,并在DDR DRAM和HBM上共享统一内存[13] - 通过此次收购,Meta将获得一支能够制造高端RISC-V芯片的团队,这些芯片可根据其AI工作负载进行定制[14] 公司多元化的外部芯片采购策略 - 公司近期与英伟达达成了数百万颗GPU的交易,并与AMD达成了6吉瓦的GPU交易[16][17] - 通过与英伟达和AMD两大巨头的合作,公司在未来的算力竞争中获得了更多筹码,并分担了风险[17] - 谷歌已成功证明其Gemini 3和4模型几乎完全(95-100%)在内部TPU上进行训练,英伟达GPU仅处理该工作负载的0-5%,对于搜索和YouTube等内部推理任务,TPU处理约85-90%的业务量[18] - 谷歌正计划推出TPU即服务模式,作为GPU的可行替代方案[18] - Meta与谷歌洽谈购买TPU的协议,对谷歌而言是一项胜利,有助于其打造数十亿美元的TPU销售业务,同时对主导AI芯片市场的英伟达构成威胁[18] - 谷歌还与一家未透露名称的大型投资公司签署协议,为一家向其他客户租赁TPU的合资企业提供资金,并正在与其他投资公司洽谈资助其他类似合资企业[19]
GenAI系列报告之64暨AI应用深度之三:AI应用:Token经济萌芽
申万宏源证券· 2025-09-24 20:04
行业投资评级 - 报告对AI应用行业持积极态度 投资评级为看好 [4] 核心观点 - AI应用Tokens消耗量大幅增长体现落地进展加速 大模型实现大规模商业化且收入向头部集中 OpenAI年化收入达到120亿美元 [4] - AI视频工具已迈入1亿美元ARR台阶 大规模商业化节点即将到来 [4] - AI编程为最热门融资方向 商业模式已跑通并加速兑现收入 Anysphere实现5亿美元ARR [4] - 企业级AI软件商业化偏慢 但具备坚实应用场景的AI法律 招聘 客服等领域已渐次兑现收入 [4] - 互联网巨头通过AI推荐系统升级和AI应用孵化推动商业化 META业绩已体现生成式推荐系统效果 [4] AI应用总览 - 大模型API调用量2025年后增长明显 OpenRouter平台显示谷歌Gemini Anthropic Claude OpenAI GPT等模型竞争格局高波动 [11] - 互联网公司AI Chatbot成为核心算力消耗场景 ChatGPT周活跃用户达8亿 谷歌Gemini月活用户达4.5亿 [14] - 微软Tokens消耗量从2024Q1的20万亿增长至2025年3月的400万亿 谷歌Tokens消耗量从2024年5月的9.7万亿增长至2025年7月的980万亿 [13] - 初创公司商业化进展分化 OpenAI估值3000亿美元 Anthropic拟以1700亿美元估值融资 xAI估值1130亿美元 [16] - AI视频工具Runway ARR达8400万美元 Synthesia ARR达1亿美元 Midjourney年营收预计3亿美元 [16] - AI编程工具Anysphere估值99亿美元 ARR达5亿美元 Replit估值30亿美元 ARR达1.4亿美元 [18] - 垂类AI应用Scale AI年营收预计20亿美元 Surge AI年营收超10亿美元 ElevenLabs ARR达1亿美元 [22] 互联网巨头进展 - 生成式推荐架构正替代传统DLRM模型 META GRs 快手OneREC 字节HLLM等方案推动推荐系统升级 [34] - META生成式推荐系统使Facebook用户使用时长提升7% Instagram提升6% 广告转化率提升5% [42] - 谷歌AI搜索功能AI Overview月活用户超20亿 AI Mode月活达1亿 Gemini月活达4.5亿 [47] - OpenAI年化收入120亿美元 其中C端订阅55亿 B端订阅36亿 API收入29亿 [53] - Anthropic年化收入50亿美元 其中API收入31亿(60%来自编程工具) 编程工具Claude Code ARR达4亿美元 [53] AI编程领域 - AI编程工具ARR总和超30亿美元 GitHub Copilot用户达2000万 Cursor ARR从1亿快速提升至5亿 [61] - 应用层公司仍需完成代码库感知 编辑器整合 UI优化等工作 具备独立竞争壁垒 [65] - Cursor通过VS Code集成 影子工作区验证 多模型智能路由等技术实现出色用户体验 [68] - 长期看AI编程可能演进为UGC应用程序平台 降低开发门槛并丰富应用生态 [73] 企业级AI软件 - 企业级AI部署前期需3-18个月完成数据清洗 工作流结合等工作 大规模落地节点或在2026年后 [80] - 定制化AI平台更适合企业落地 ServiceNow AI ACV订单达2.5亿美元 指引2026年达10亿美元 [77] - 竞争壁垒来自数据获取能力和行业Know-how Palantir Snowflake ServiceNow SAP等公司具优势 [85] - Palantir通过数据层归一化 逻辑层模型结合 行动层人工审核等构建企业AI操作系统 [91] 内容生产工具 - AI视频工具Runway Synthesia ARR接近1亿美元 但文本忠实度等仍有提升空间 [96] - 设计软件市场分化 Adobe面向专业设计者市场 Figma Canva面向传播者市场 [99] - Figma高价值客户数量高速增长 超过1万美元ARR客户达11107家 超过10万美元客户达1031家 [101] - 多邻国Max会员渗透率达8% 定价29.99美元/月 高于Super会员的12.99美元 [109] 国内AI应用 - 2025H1中国大模型公有云服务Tokens调用量达537万亿 2024全年为114万亿 [112] - 互联网公司通过推荐系统升级 AI Chatbot和云业务推动AI落地 [115]
国际产业新闻早知道:5月中国稀土出口量锐减,比亚迪海外热销
产业信息网· 2025-06-25 13:41
国际社会热点 - 欧盟准备对价值950亿欧元的美国商品征收一揽子关税,并考虑对美国科技公司征税及限制公共采购合同[5] - 中国对英国出口额显著增长,4月进口额达60亿英镑同比增长11%,创两年多新高[10] - 德国通过2025预算草案,计划2025-2029年举债逾8000亿欧元,国防支出将增至GDP的3.5%[11][12][13] - 英国公布十年工业战略,2027年起实施竞争力计划,为高耗能企业降低用电成本最高25%[16] 人工智能 - SK集团与亚马逊合作投资51.1亿美元建设韩国最大数据中心,计划扩展至1吉瓦容量[18][19] - 高盛在全公司推出AI助手工具,已有1万名员工使用,功能包括文档总结和数据分析[22][23][24] - 德国Neura Robotics拟融资10亿欧元推出人形机器人4NE1,已积累近10亿美元订单[25][26][27][29] - 英伟达与富士康洽谈在休斯顿AI工厂部署人形机器人,目标2025Q1投运[33][34][35] - Meta与Oakley合作推出AI智能眼镜,售价499美元,集成Meta AI技术[37][38] 芯片 - Q1全球半导体晶圆代工2.0市场收入722.9亿美元同比增长13%,台积电份额达35%[40] - Meta自研MTIA v2芯片采用台积电5nm工艺,年底量产,用于AI服务器和广告推荐[41][42] - 三星泰勒晶圆厂计划2026年量产2nm工艺,已获日本AI芯片公司订单[43][44][46] - 邑文科技交付首台12英寸CCP刻蚀机,采用自主研发核心技术[47][48] - 联电计划收购南科彩晶厂房发展先进封装技术,已具备2.5D封装产能[50][51] 汽车 - 央行等六部门鼓励开展汽车贷款业务,减免以旧换新违约金[54] - 比亚迪匈牙利工厂年内投产,腾势和仰望品牌将登陆欧洲,目标跻身欧洲主流车企[55][56] - 小米YU7即将在二期项目大规模量产[57] - 上汽旗下享道出行增资至41.06亿元增幅20%[58] - 特斯拉在奥斯汀推出Robotaxi服务,收费4.2美元/次,计划扩展至千辆规模[59][60] 航空航天 - 全球首颗光子量子计算机由SpaceX发射升空,部署于550公里轨道[65] - 日本ispace公布月球着陆器坠毁原因为激光测距仪异常[66] - 亚马逊发射第二批27颗柯伊伯卫星,与星链竞争[67][68] - 通宇通讯星地互联方案已应用于我国试验星并进入国际供应链[70][71] 能源矿产 - 中国5月稀土磁铁出口量1238吨环比下降52.9%,创5年新低[74][75] - Gradiant将在宾州页岩区建锂生产工厂,锂回收率97%,2026年投产[78][79][80] - 耐普矿机拟投资9459万美元建设Alacran铜金银矿,铜品位0.41%[81]
电子行业周观点:ASIC需求全面爆发,重视自研芯片产业机遇
国盛证券· 2025-06-08 21:30
报告行业投资评级 - 行业投资评级为增持(维持) [5] 报告的核心观点 - ASIC需求全面爆发,应重视CSP自研芯片产业机遇,特别是亚马逊定制芯片与谷歌TPU产业链的投资机会,具备相关优势的ASIC定制服务厂商有望受益 [1][7] - 模拟芯片下游需求回暖,国产化需求迫切,国产替代空间大 [8] 根据相关目录分别进行总结 ASIC需求全面爆发,重视CSP自研芯片产业机遇 - 北美CSP加速自研ASIC布局,谷歌和亚马逊进展领先,2023年定制加速计算芯片市场规模为66亿美元,占加速芯片的16%,预计2028年达429亿美元,占25%,2023 - 2028年CAGR为45% [1][14] - 博通25Q2 AI半导体收入超44亿美元,同比增长46%,预计2026年下半年XPU需求加速,2027年至少3家客户各部署100万AI加速器集群 [2][21] - Marvell FY26Q1收入创纪录,2026年将启动3nm芯片生产,与另一家美国超大规模客户合作进展顺利,还与NVIDIA建立合作提升定制化能力 [3][23][25] - 纬创2025年5月营收2084亿新台币,同环比高速增长,ASIC需求全面爆发,中系CSP也在加速自研AI ASIC [4][30][36] 模拟芯片下游需求回暖,国产化需求迫在眉睫 - 预计2025年全球模拟芯片市场规模为843亿美元,2024年中国汽车模拟芯片国产化率仅5%左右,国产替代空间大 [8][40] - TI、ADI、Microchip均指引下游复苏趋势,各终端市场有不同程度的增长或变化 [8][47] 相关标的 - 谷歌产业链:胜宏技技、天弘技技、lumentum、FINISAR [50] - 海外AI:胜宏技技、工业富联、沪电股份、麦格米特 [51] - 国产算力底座:中芯国际、华虹半导体 [52] - 芯片:寒武纪、海光信息等;配套:深南电路、兴森技技等;封测:长电技技、通富微电等;模拟芯片:纳芯微、圣邦股份等 [53][54]