Workflow
Ironwood TPU
icon
搜索文档
马斯克赢了!1万亿美元薪酬计划获批;俞敏洪发文确认孙东旭离职;小鹏现场剪开机器人腿部自证;小红书获支付牌照丨邦早报
创业邦· 2025-11-07 08:09
完整早报音频,请点击标题下方小耳机收听 【俞敏洪发文确认孙东旭离职】 11 月 6 日,俞敏洪发文确认孙东旭从东方甄选离职。俞敏洪 称:"东旭和我,是东方甄选的创始人。没有东旭的努力和坚忍不拔的奋斗,就不可能有东方甄选的 发展和今天。" 天眼查 App 显示,东方甄选关联东方优选(北京)科技有限公司成立于 2021 年 10 月,法定代表 人为孙东旭,注册资本 1000 万人民币,经营范围包括广播电视节目制作经营、网络文化经营、演出 经纪、旅游业务等。股东信息显示,该公司由北京新东方迅程网络科技有限公司全资持股。知识产权 信息显示,该公司已成功注册多枚孙东旭照片和东方小孙商标,国际分类涉及教育娱乐、广告销售 等。此外,该公司还登记了"东方甄选主播东方小孙卡通形象"美术作品著作权。 ( 和讯网 ) 上下滑动可查看长图 【小鹏现场剪开机器人腿部自证】 11 月 6 日晚,在小鹏 X9 超级增程技术发布会上,小鹏就"全新一 代 IRON 机器人是否内藏真人"等质疑再次回应,并在机器人 IRON 通电运行状态下,现场剪开其腿 部覆盖件,公开展示内部的机械结构。 小鹏汽车董事长、首席执行官何小鹏在现场一度哽咽,并表 示 ...
OpenAI高管言论引发风暴,纳指跌近2%
凤凰网· 2025-11-07 07:14
昨夜今晨,伴随着美国就业市场恶化的迹象,叠加OpenAI高管言论引发"狂撒万亿订单后,AI巨头需要美国政府担保"的误解,一众明星科技股又回到集体 下跌的状态。虽然奥尔特曼等人紧急发声澄清,三大指数均收跌。 截至收盘,标普500指数跌1.12%,报6720.32点;纳斯达克综合指数跌1.9%,报23053.99点;道琼斯工业平均指数跌0.84%,报46912.3点。 (纳斯达克指数日线图,来源:TradingView) 据悉,OpenAI首席财务官Sarah Friar在周三的一场活动中表示,公司正在寻求构建由银行、私募基金、以及联邦政府"兜底"(backstop)或"担保"( guarantee)组成的生态体系,以帮助公司为其巨额芯片投资提供融资支持。 毫无疑问,这番话又把"AI泡沫"拱到市场焦点下,还呈现出一副"美国政府收拾烂摊子"的画面感。 随着舆情升温,Friar周四发帖强调,OpenAI目前并没有在寻求政府为其基建投资承诺提供"兜底",使用"兜底"这个词导致她的本意被混淆。 OpenAI首席执行官奥尔特曼也在周四收盘前发了一篇超长帖子,回应了一系列问题。 总结来说,奥尔特曼强调OpenAI不想,也不会 ...
速度快4倍多,谷歌“最强芯片”来袭,A股概念股已大涨!
每日经济新闻· 2025-11-07 00:28
谷歌方面称,新的Ironwood TPU在单个吊舱中连接多达9216个芯片,速度比其前代产品快四倍多,消除了"要求最苛刻的型号的数据瓶颈",并使客户"能 够运行和扩展现有最大、数据最密集的型号"。 每经编辑|许绍航 据美媒报道,谷歌表示,正推出其迄今为止最强大的芯片Ironwood,未来几周将全面上市。Ironwood是谷歌第七代张量处理单元(TPU),最初于4月推 出进行测试。 图:Ironwood,来源:谷歌官网 值得一提的是,大多数大语言模型和AI工作负载一直依赖于英伟达的图形处理器(GPU),但谷歌的TPU属于定制芯片类别,在价格、性能和效率方面均 有可能提供优势。谷歌称,目前,人工智能初创公司Anthropic已计划使用多达100万个新TPU来运行其Claude模型。 这意味着,谷歌正与微软、亚马逊和元宇宙平台公司(Meta)等竞争对手展开一场高风险的角逐,目标是搭建未来的人工智能基础设施。 在消息传出同日(当地时间11月6日),据媒体报道,谷歌还表示,计划在下周提出其在德国有史以来的最大投资计划。该项目的细节将在11月11日与德 国财长克林拜尔共同共同举行的新闻发布会上公布。 据称,该计划将涉及" ...
深夜,芯片大消息!巨头直线拉升!
证券时报· 2025-11-07 00:09
美股市场整体表现 - 美股三大指数小幅低开,道指跌0.18%,标普500指数跌0.16%,纳指跌0.17% [1] 个股表现与业绩驱动 - DATADOG股价上涨超过18%,公司业绩表现强劲 [1] - SNAP股价上涨超过17%,第三季度营收超预期,并与Perplexity AI达成4亿美元协议 [1] - DOORDASH股价下跌超过11%,第三季度利润未达预期 [1] - 谷歌股价上涨超过1%,受其推出AI芯片Ironwood消息影响 [3] - 中概股多数上涨,小鹏汽车涨超6%,百度集团涨逾3%,阿里巴巴涨超2% [4] 谷歌AI芯片技术进展 - 谷歌推出其最强大的第七代AI芯片Ironwood,未来几周将全面上市 [2] - Ironwood是谷歌第七代张量处理单元(TPU),速度比前代快四倍多 [2] - 人工智能初创公司Anthropic计划使用多达100万个新TPU来运行其Claude模型 [2] - 新的Ironwood TPU在单个吊舱中连接多达9216个芯片,旨在消除数据瓶颈并支持最大、数据最密集的模型 [2] AI基础设施行业竞争格局 - 谷歌正与Microsoft、亚马逊和Meta进行构建未来人工智能基础设施的竞赛 [2] - 虽然大多数大型语言模型依赖英伟达的GPU,但谷歌的TPU作为定制芯片可在价格、性能和效率方面提供优势 [2]
深夜,芯片大消息!巨头直线拉升!
证券时报· 2025-11-06 23:39
11月6日,美股三大指数小幅低开,道指跌0.18%,标普500指数跌0.16%,纳指跌0.17%。 DATADOG涨超18%,公司业绩表现强劲。SNAP涨超17%,第三季度营收超预期,并与Perplexity AI达成4亿 美元协议。DOORDASH跌超11%,第三季度利润未达预期。 谷歌正在推出其最强大的AI芯片Ironwood,未来几周将全面上市。Ironwood是谷歌第七代张量处理单元 (TPU),最初于4月推出进行测试。据谷歌称,Ironwood的速度比其前身快四倍多,主要客户已经在排队。 谷歌表示,人工智能初创公司Anthropic计划使用多达100万个新TPU来运行其Claude模型。谷歌表示,新的 Ironwood TPU 在单个吊舱中连接多达 9216 个芯片,消除了"要求最苛刻的型号的数据瓶颈",并使客户"能够 运行和扩展现有最大、数据最密集的型号"。谷歌正处于一场超高风险的竞赛中,与竞争对手 Microsoft、亚马 逊和Meta 并肩作战,构建未来的人工智能基础设施。虽然大多数大型语言模型和 AI 工作负载都依赖于英伟 达的图形处理单元 (GPU),谷歌的 TPU 属于定制芯片类别,可以 ...
盘前直线拉升 谷歌AI芯片放猛招!PCB产业链大利好
上海证券报· 2025-11-06 22:17
| | | | 胜宏科技 | | E | | | --- | --- | --- | --- | --- | --- | --- | | | | | 300476 融 深股通 ▼ | | | | | 316.21 → | | | | 304.00 最高 320.00 最低 301.05 | | | | 5.97% 17.82 块子 | | | 5.31% 总手 | | 45.4万 金额 141.60亿 | | | 总值 2752亿 流值 | | | 2704亿 市盈 | 63.61 | 更多 | | | 盘后量 47.84 | | | 盘后额 151万 | | 盘后行情 ( | | | 分时 | 五日 | | 日K 周K | 月K | 更多,◎ | | | 320.00 | | | | 7.24% | 合金 | | | | | 卖 5 316.29 | | | | | | | | 三十 316.28 | | | | 2 | | | | 重3 316.27 | | | | 2 | | | | 卖2 316.25 | | | | - | | | | 三十 316.24 | | | | 7 | | 298.39 - ...
Google's rolling out its most powerful AI chip, taking aim at Nvidia with custom silicon
CNBC· 2025-11-06 21:00
新产品发布 - 谷歌宣布其第七代张量处理单元TPU Ironstone将在未来几周内公开上市,该芯片最初于4月推出用于测试和部署[2] - 新款TPU Ironstone的性能比其前代产品快四倍以上,并且能够将多达9,216个芯片连接到一个Pod中,以消除最苛刻模型的数据瓶颈[3][4] - 人工智能初创公司Anthropic计划使用多达100万个新款TPU来运行其Claude模型[4] 市场竞争格局 - 公司正与微软、亚马逊和Meta等竞争对手进行一场超高风险的竞赛,以构建未来的人工智能基础设施[3] - 尽管大多数大型语言模型和AI工作负载依赖于英伟达的GPU,但谷歌的TPU属于定制芯片类别,在价格、性能和效率上可能具有优势[3] - 谷歌在推出新芯片的同时,还推出了一系列升级,旨在使其云服务更便宜、更快、更灵活,以与更大的云服务商亚马逊AWS和微软Azure竞争[4] 财务表现与投资 - 谷歌第三季度云收入为151.5亿美元,较去年同期增长34%[5] - 同期,微软Azure收入增长40%,亚马逊AWS增长20%[5] - 公司在2025年前九个月签署的超过10亿美元的云交易数量超过了前两年的总和[5] - 为满足激增的需求,公司将今年资本支出的预测上限从850亿美元提高至930亿美元[5] 管理层评论与展望 - 首席执行官Sundar Pichai表示,公司看到对其AI基础设施产品(包括基于TPU和GPU的解决方案)的实质性需求,这是过去一年增长的关键驱动力,并且预计未来需求将继续非常强劲[6]
一颗芯片的新战争
半导体行业观察· 2025-10-07 10:21
文章核心观点 - AI推理芯片市场竞争加剧,成为AI下半场商业化关键,市场规模预计2028年达1500亿美元,年复合增长率超40% [3] - 华为、英伟达、谷歌三大巨头及初创公司Groq相继发布推理芯片,竞争焦点从原始算力转向成本、能效、软件生态和应用场景的综合较量 [3][5][10][25][28] 华为Ascend 950PR - 华为宣布昇腾芯片规划,未来3年将推出950、960、970系列,目标算力一年一代翻倍 [3] - Ascend 950PR专攻推理Prefill阶段和推荐业务,采用自研低成本HBM(HiBL 1.0),预计2026年一季度面世 [3] - 芯片采用同一Die设计,低成本HBM策略可解决HBM供给紧缺并降低总成本(内存成本占推理支出40%以上) [3][4] - 互联带宽相比Ascend 910C提升2.5倍,达2TB/s,支持低精度数据格式如FP8,算力达1P和2P [6] 英伟达Rubin CPX - 英伟达推出专为大规模上下文设计的GPU Rubin CPX,预计2026年底上市,标志公司向推理市场延伸 [5][8] - 单机架算力达8 Exaflops,较GB300 NVL72提升7.5倍,配备100TB快速内存和1.7PB/s带宽 [5] - 芯片针对百万Token级上下文,峰值算力30 Petaflops,内存128GB GDDR7,系统专注力提升3倍 [8] - 支持NVFP4精度,集成视频编解码器,旨在解决AI Agent长上下文瓶颈(80%AI应用将涉及多模态长序列处理) [8][9] 谷歌Ironwood TPU - 谷歌推出第七代TPU推理芯片Ironwood,以应对内部推理请求量激增(2024年4月至2025年4月令牌使用量增长50倍) [10][13] - 提供256芯片和9,216芯片两种配置,后者总算力42.5 Exaflops,是El Capitan超算的24倍;单芯片峰值算力4.614 Exaflops [15] - 功率效率为Trillium的1.5倍,每瓦性能翻倍,较首代TPU提升30倍;单芯片内存带宽7.37 TB/s,容量192 GB,为Trillium的6倍 [17][20] - 通过光路交换机(OCS)互连集群,提供1.77 PB HBM内存容量,支持动态重构和故障修复,软件栈支持PyTorch和JAX [20][21] - 软硬件协同优化可帮助客户降低推理延迟高达96%,吞吐量提高40%,每个令牌成本降低多达30% [24] Groq推理芯片初创公司 - Groq在2025年9月融资7.5亿美元,估值从2021年10亿美元跃升至69亿美元,投资者包括Disruptive、三星、思科等 [25] - 公司计划到2025年第一季度部署超108,000个LPU(14纳米),已获沙特阿拉伯15亿美元订单和贝尔加拿大独家合作 [26] - LPU采用张量流架构,单大核心设计,延迟比GPU低10倍,内存带宽优势达10倍,适合实时AI推理 [27] 行业趋势与竞争格局 - AI推理市场增长速度快于训练市场(推理年复合增长率40% vs 训练20%),支撑智能推荐、内容生成等实时应用需求 [3] - 推理阶段是实现AI商业化的关键,芯片竞争围绕成本控制(如华为HBM策略)、能效提升(如谷歌TPU)和长上下文处理(如英伟达)展开 [3][4][8][17][28]
英伟达:GPU 与 XPU- 人工智能基础设施峰会及超大规模企业主题演讲
2025-09-15 09:49
涉及的行业或公司 * 人工智能基础设施与加速器行业 包括GPU XPU ASIC TPU等异构计算领域[1] * 英伟达公司 股票代码NVDA O 市值约4149 468亿美元[6] * 超大规模云计算厂商 包括Meta 亚马逊AWS 谷歌[1] 核心观点和论据 **超大规模厂商的AI基础设施战略** * 所有主要超大规模厂商均已大规模部署英伟达GB200 GB300系统 但同时也在与AMD等其他GPU制造商合作 并开发内部定制芯片 以支持AI工作负载多样性并驱动每瓦最低价格性能[1] * 运行GPU集群与CPU集群是不同的挑战 GPU集群是由许多GPU协同处理单个长时间运行作业的超级计算机[3] * 跨AI工作负载 如LLM训练 LLM推理预填充 LLM推理解码 排名和推荐训练 R&R推理 一种计算尺寸无法满足所有需求 模型尺寸快速演变 基础设施需要在规模 计算 内存和网络元素上进行优化[3] **Meta的AI部署与规划** * AI复杂性日益增长 短视频驱动了对AI排名和推荐的需求 导致集群扩展[2] * 生成式AI模型规模急剧扩大 Llama 3使用了24,000个GPU Llama 4使用了约100,000个GPU 未来生成式AI集群预计将驱动巨大的吉瓦级数据中心 例如2026年的Prometheus 1GW+集群和未来几年的Hyperion 5GW集群[2] * Meta已大规模部署GB200和GB300 并与AMD MI300X合作 内部定制ASIC MTIA系列加速器使其能够专注于AI工作负载多样性 并推动强大的路线图以实现其在R&R推理 训练和生成式推理 训练方面的雄心[4] * Meta是开放系统的支持者 如Llama和deepseek模型 Pytorch Ultra Ethernet和Ultra Accelerator Link UAL[4] **AWS的AI基础设施重点** * 延迟 计算性能和规模弹性是AI基础设施中最重要的基础[5] * AWS自称是运行GPU的最佳位置 Amazon EC2 P6 B200实例适用于中大型训练和推理 P6e GB200 ultraservers是AWS最强大的GPU产品[5] * AWS Trainium是专为在降低成本的同时提供高性能而构建的 AWS Trn2 Ultraservers为AWS上的生成式AI提供最佳价格性能[5] * AWS将为Anthropic项目Rainier使用Ec2 ultraclusters 以提供520 FP8 exaflops的算力 AWS拥有定制冷板设计以支持Trainium集群[8] **谷歌的AI计算方法与技术** * 随着在更大数据集上训练更强大模型且能力更多 强大的AI爆炸性成本驱动了更高的计算成本[9] * 定制ASIC或TPU是谷歌设计的超级计算基础设施的基础 专为机器学习和AI而设计 以驱动高性能 成本 功率效率和无缝扩展[9] * 谷歌今年推出了第七代Ironwood TPU 其最大pod为9,216个芯片 pod 并且比2024年的Trillium多6倍的HBM 它被用于谷歌内部工作负载 如Gemini AlphaFold Imagen Veo AlphaGo Zero和AlphaChip 芯片设计代理 帮助其设计未来TPU版本 以及GCP中[10] * 谷歌拥有配备TPU的专用数据中心 垂直供电以提高能效 同步高带宽片间互连 ICI 以提高吞吐量 光路交换 OCS 以实现容错和高效调度 以及液冷以最大化系统效率 专用TPU硬件实现了大规模扩展 大量共享内存 成本和功率效率 可靠性 灵活性和弹性[11] **英伟达的投资观点与风险** * 投资评级为买入 目标股价200美元 基于约30倍C26E市盈率 该倍数与3-5年平均水平一致 预期股价回报率为17 1%[6][13] * 下行风险包括 1 游戏领域的竞争可能导致英伟达市场份额流失 进而打压股价 2 新平台采用速度慢于预期可能导致数据中心和游戏销售额下降 3 汽车和数据中心市场的波动性可能增加股票 倍数的波动 4 加密挖矿对游戏销售的影响[14] 其他重要内容 * 花旗环球市场公司持有英伟达100万美元或以上的债务头寸 并在过去12个月内因向英伟达提供投资银行服务而获得报酬 目前或过去12个月内与英伟达存在投资银行业务 证券相关和非证券相关业务关系[18][19][20] * 研究分析师的薪酬由花旗研究管理层和花旗集团高级管理层确定 基于旨在惠及花旗环球市场公司及其关联公司投资者客户的活动和服务 薪酬不与具体交易或建议挂钩[21]
AI算力投资风向大转变! 市场真金白银押注ASIC强势崛起
智通财经网· 2025-09-06 15:43
英伟达股价表现及市场压力 - 英伟达股价周五下跌近3% 盘中跌幅一度接近5% 连续四周周线下跌 面临失守4万亿美元市值的风险 [1][8][9] - 较8月高点下跌约10% 市值蒸发近4700亿美元 跌破50日均线 但仍为全球最高市值公司 [9] - 市场抛售压力源于美国非农数据远不及预期触发衰退预警 以及博通AI ASIC市场规模激增 [1] 博通AI ASIC业务强劲增长及竞争影响 - 博通第三财季AI基建相关半导体营收52亿美元 同比增长63% 超出华尔街预期的51.1亿美元 [4] - 预计第四财季AI相关营收达62亿美元 同比增长近70% 高于分析师预期的58.2亿美元 [4] - 获得OpenAI超100亿美元AI基础设施订单 预计2026财年AI相关营收增速将比此前预期更强劲 [5] - 博通周五股价一度飙升16% 市值最高增加近1500亿美元 达约1.6万亿美元 [9] - 博通与谷歌、Meta、微软等科技巨头联合推出AI ASIC 其高性价比和能效比优势对英伟达AI GPU构成直接竞争 [2][11][14] AI ASIC技术路线及市场份额趋势 - AI ASIC在AI训练/推理领域具备明显性价比与能效比优势 单位吞吐成本和能耗显著优于纯GPU方案 [3][15] - 谷歌Ironwood TPU性能提升显著 与TPU v5p相比峰值FLOPS提升10倍 功效比提升5.6倍 [14] - 摩根大通预计Ironwood将在未来6-7个月为博通带来约100亿美元营收 [14] - AI ASIC市场份额有望从当前英伟达占90%的格局转向份额对等 科技巨头倾向采用ASIC与GPU混合架构以最小化TCO [11][15] 台积电行业地位及业绩表现 - 台积电为AI GPU和AI ASIC核心代工厂 占据全球绝大多数5nm及以下先进制程芯片代工订单 [1][17] - Q2净利润激增61% 预计2025年以美元计销售额增长30% 高于此前接近20%中段的预期 [18] - 先进封装产能供不应求 正积极扩建CoWoS产能以支持英伟达等客户需求 预计强劲需求持续至2026年 [18] 寒武纪业绩及股价表现 - 寒武纪2025年上半年营收28.81亿元 同比暴增4347.82% 归母净利润10.38亿元 去年同期亏损5.30亿元 [6] - 今年以来股价涨幅达95% 高盛将12个月目标价从1835元上调至2104元 上调幅度14.7% [5] 全球AI算力投资趋势 - AI算力需求井喷式扩张 美国政府主导的AI基础设施投资项目庞大 科技巨头持续投入大型数据中心建设 [7] - 全球资金押注核心从英伟达AI GPU链转向AI ASIC链 推动MSCI全球指数自4月以来大幅上攻并创历史新高 [7][9]