AI推理
搜索文档
谷歌TPU杀疯了,产能暴涨120%、性能4倍吊打,英伟达还坐得稳吗?
机器之心· 2025-12-09 16:41
谷歌TPU产能与商业化战略 - 摩根士丹利大幅上调谷歌TPU产量预测,预计2027年达500万块,2028年达700万块,较此前预测分别上调67%和120% [2] - 未来两年(2027-2028)谷歌计划生产1200万块TPU,而过去四年总产量仅为790万块 [2] - 摩根士丹利测算,谷歌每销售50万块TPU芯片,2027年可贡献约130亿美元收入,并增加每股收益0.40美元 [2] - 谷歌战略包括直接向第三方数据中心销售TPU,作为谷歌云平台业务的重要补充,为广泛商业化做准备 [2] AI算力市场格局演变:从训练到推理 - 到2030年,推理将消耗75%的AI计算资源,形成一个规模达2550亿美元、年复合增长率19.2%的市场 [8] - 分析师估计,到2026年,推理需求将比训练需求高出118倍,并将推动7万亿美元的基础设施投资 [14] - 训练是一次性高成本投入,例如GPT-4训练成本为1.5亿美元,而推理是持续成本,例如OpenAI 2024年推理支出预计达23亿美元,是GPT-4训练成本的15倍 [13][14] - 市场格局正从模型训练(英伟达强项)向模型推理(实时应用)重塑 [8] 谷歌TPU与英伟达GPU的技术与成本对比 - 在大型语言模型等推理任务上,TPU的性价比是英伟达H100 GPU的4倍 [17] - 谷歌最新的Ironwood (v7) TPU速度是v6的4倍,峰值计算能力是v5p的10倍,每代产品带来2-3倍的性价比提升 [17] - TPU能效更高,执行搜索查询时比GPU节能60-65%,在MLPerf基准测试9个推理类别中赢得8个 [17] - TPU v6e按需使用起价为每小时1.375美元,长期合约可降至每小时0.55美元,且无需支付英伟达授权费,而H100成本为每小时2.50美元以上 [17][21] ASIC与GPU的架构差异及竞争态势 - GPU是通用处理器,灵活性高;ASIC是专用集成电路,为单一任务(如张量运算)设计,牺牲灵活性以换取极高效率 [27] - ASIC在能效、延迟、每次操作成本和可扩展性方面具有优势,TPU通过硬件固定操作,相同工作负载下能耗降低60-65% [28] - 未来计算策略预计是混合部署:GPU用于研究和训练,ASIC用于生产推理 [30] - 谷歌云高管预计,仅TPU的采用就可能影响英伟达10%的收入,并对英伟达70-80%的高毛利率构成价格压力 [22] 行业巨头向TPU迁移的案例 - 图像生成公司Midjourney在2024年转向TPU后,推理成本降低65%,从每月200万美元降至70万美元 [34] - Anthropic与谷歌达成价值数百亿美元的交易,承诺使用多达100万个TPU,预计到2026年释放超过1GW计算容量 [35] - Meta作为英伟达最大客户(计划2025年支出720亿美元),正就价值数十亿美元的TPU部署进行深入洽谈,计划从2026年开始通过谷歌云租赁TPU,并在2027年前部署本地TPU [36] - Salesforce和Cohere使用TPU后实现了3倍的吞吐量增长 [36] TPU与GPU的选择决策框架 - 选择TPU的场景:推理成本超过每月5万美元、工作负载为大规模LLM服务或推荐系统、部署于谷歌云平台、重视能源效率、具有可预测的扩展需求 [41][42][43] - 选择英伟达GPU的场景:需要训练灵活性及CUDA生态系统、实施多云战略避免供应商锁定、运行多样化非AI工作负载、每月AI计算预算低于2万美元、尝试尚未针对TPU优化的前沿模型架构 [44][45][46][47][48] - 混合战略建议:部署英伟达H100用于训练和模型开发,使用TPU v6e/v7进行生产推理服务,可节省40-50%的总计算资源 [49] - 大规模TPU迁移通常需要2-6个月,投资回报期约为3-4个月 [49] 市场影响与投资者行为 - 部分精英投资者抛售英伟达股票,例如彼得·蒂尔的对冲基金在2025年第三季度清仓价值约1亿美元的英伟达股票,日本软银清仓3210万股套现58.3亿美元 [65][66] - 投资者担忧包括:GPU供应过剩和资产贬值(每年价值下降30-40%)、TPU竞争导致英伟达利润率压缩、客户多元化投资减少对英伟达收入依赖 [67] - 尽管面临挑战,英伟达仍控制着超过80%的AI芯片市场,其2023年数据中心业务收入达600亿美元 [13][67] TPU面临的挑战与未来竞争 - TPU生态系统与TensorFlow/JAX绑定,灵活性不及英伟达CUDA,本地部署市场处于起步阶段 [69] - 扩展TPU至4096个芯片需要谷歌云投入,混合架构将持续存在 [69] - 新兴竞争者包括亚马逊的Trainium、微软的Maia芯片,但它们在成熟度(TPU已发展至第九代)和规模上尚无法与TPU相比 [69] - 谷歌与博通和台积电合作加速v7芯片生产,预计到2026年第二季度TPU供应将能满足需求 [69] 其他关键问答摘要 - 英伟达即将发布的Blackwell架构承诺提升推理效率,但早期分析表明TPU在大规模纯推理方面仍保持2-3倍的成本优势 [74] - AMD的MI300和英特尔的Gaudi芯片是GPU替代方案,可节省30-40%成本,但效率仍不及TPU [77] - TPU在标准架构上表现出色,对于自定义AI模型,建议先在GPU上原型设计,待架构稳定后再针对TPU优化生产模型 [76]
资产配置周报告|大金融发力,反攻节点出现!
新浪财经· 2025-12-08 20:27
全市场估值与表现概览 - 截至数据统计日,全球主要指数估值分化显著,标普500市盈率(PE)为32.11倍,处于历史97.87%的高分位,而恒生指数PE为12.04倍,处于历史54.86%分位,显示港股估值相对较低 [1][39] - 从年度表现看,创业板50指数年涨幅达53.40%,领跑主要宽基指数,北证50年涨幅为35.70%,科创50年涨幅为34.09%,显示科技成长风格表现强劲 [1][39] - 市场风格监控显示,上周资金偏好大盘股,沪深300周涨幅1.28%,表现优于中证500的0.94%、上证50的1.09%及中证1000的0.11% [7][45] - 同花顺全A股债利差为2.52%,位于历史前50%的高利差区域,当前市盈率(PE)为22.92倍,10年期国债收益率为1.85%,显示股票资产具备相对配置价值 [4][42] A股市场回顾与展望 - 上周A股市场呈现“大金融发力,反攻节点出现”的特征,指数放量重回3900点上方,航天、福建板块、AI手机、贵金属等主题持续活跃 [1][39] - 板块轮动加快,航天、福建等板块走出持续性行情,其余板块以轮动为主,伴随周五市场重新放量反攻,短期补跌风险暂时解除 [2][40] - 操作策略上,短期建议关注“十五五”规划提及的可控核聚变、量子科技、商业航天等方向,中期多头趋势未变,逢调整是布局时机 [2][40] 港股市场展望 - 港股市场短期维持箱体震荡格局,日线级别在26000点附近形成有效支撑,短期反弹有望持续,上方缺口存在回补预期 [9][47] - 伴随近期利好政策催化,市场情绪有望稳步回升,中期多头趋势不变,市场有望回归慢牛格局 [9][47] - 在市场量能提升背景下,消费电子、大科技、AI等相对景气板块存在结构性机会,上攻阶段若遇调整,公用事业等防守类板块可能迎来资金回流 [9][47] 债券市场分析 - 国内利率债近期维持窄幅震荡,1年、5年、10年期国债收益率分别为1.40%、1.63%、1.85%,其中10年期收益率较前一日下降2.38个基点(BP) [11][49][52] - 央行此前表述十年期国债收益率运行区间为1.75%-1.85%,本周屡次尝试突破1.85%后回落,预计短期内仍将在此区间运行 [11][49] - 进入12月中期,需关注美联储议息会议及中央经济工作会议等国内外重磅会议可能给债市带来的波动影响 [11][49] 行业表现与机会解析 - 上周行业涨幅前三为:有色金属(周涨4.31%)、石油石化(周涨3.35%)、国防军工(周涨3.40%);跌幅前三为:媒体娱乐(周跌-3.68%)、家庭用品(周跌-2.58%)、房地产(周跌-2.19%) [14][52] - 行业逻辑解析指出,短期看好海洋经济与固态电池方向,中期看好算力与人形机器人方向 [15][53] 海洋经济产业分析 - 2025年政府工作报告首次在新质生产力部分提及“深海科技”,将其与商业航天、低空经济并列,有望获得高速发展,尤其是在深海装备、深海探索等核心科技领域 [16][54] - 在“海洋强国”战略驱动下,以蓝色债券为代表的创新型金融工具正成为推动海洋经济高质量发展的重要抓手,有望引导资本向海上风电、海水淡化等绿色产业聚集 [19][57] - 海洋经济产业链长,可分为基础设施层(海港与服务)、装备技术层(作业船和海运)、资源开发层(海水淡化、海鲜产品)三个层级,其中装备与制造环节或将最先受益于深海科技建设 [19][57] 固态电池产业分析 - 固态电池使用固体电解质替代传统锂电池的电解液和隔膜,全固态电池能量密度可达500Wh/kg以上,大幅高于主流液态锂电池的150-300Wh/kg [21][23][59][61] - 政策持续加码支持,自2020年《新能源汽车产业发展规划》首次将固态电池研发列为重点,到2023年《关于推动能源电子产业发展的指导意见》强调加强其产业化技术攻关与标准体系研究 [24][62][63] - 产业化进程加速,上汽MG4车型将于8月5日亮相并全球首次量产搭载半固态电池,起售价预计低于9万元,标志着固态电池市场正式迈入量产阶段 [28][66] - 市场空间广阔,EVTank预计固态电池将在2025年开始放量,到2030年全球出货量有望达614.1GWh,在锂电池中渗透率约10%,市场规模将超过2500亿元 [28][66] AI算力产业分析 - 阿里发布自主研发的磐久128超节点AI服务器,实现单柜128颗AI芯片的业界最高密度,采用开放架构,同等算力下推理性能较传统架构提升50% [30][68] - 摩尔线程IPO过会,公司为国内极少数兼顾图形渲染与AI计算的全功能GPU公司,拟募资80亿元用于新一代AI训推一体芯片、图形芯片等研发项目 [31][69] - AI推理需求爆发,英伟达CEO提出“思考”推理定律,认为推理能力将呈指数级增长,带动AI算力硬件需求持续强劲,国产算力硬件有望迎来爆发式增长 [31][69] 人形机器人产业分析 - 宇树科技IPO辅导于2025年11月29日完成,标志着中国人形机器人产业从“研发投入期”向“规模化落地期”转型,若成功上市将成为“A股人形机器人第一股” [32][70] - 市场潜力巨大,根据中国信息通信研究院数据,预计国内人形机器人需求将超过1亿台,整机市场规模可达10万亿元级别 [32][70] - GGII预计2024年全球人形机器人销量为11,867台,至2030年有望达605,680台,年复合增长率(GAGR)为92.60% [33][71] - 人形机器人对上游零部件需求巨大,以特斯拉Optimus为例,其40个关节驱动装置需要大量减速器、滚珠丝杠、力传感器和驱动电机,为国产供应链公司带来发展机遇 [35][73][76]
计算机行业跟踪周报:构建数据库的“CUDA”,英伟达存储变革下软件重构-20251207
东吴证券· 2025-12-07 16:46
报告行业投资评级 - 增持(维持)[1] 报告的核心观点 - 随着AI推理时代的到来,传统的以CPU为中心的存储与计算架构已成为瓶颈,行业正经历从“以CPU为中心”到“以GPU为中心”的根本性变革[4][9] - 为满足AI推理“小块高频”的极致I/O需求,硬件上出现GPU直连SSD的新架构,软件上则需要重构以GPU为核心的数据库(GPU-Native数据库),这将为数据库产业带来新的机遇[4][18][25] 根据相关目录分别进行总结 1. AI推理时代来临,GPU直连SSD存储新架构出现 - AI推理与训练对存储的需求差异巨大:训练需要大数据块(10MB-1GB)、少并发、总容量相对较低(1-10TB);而推理需要小数据块(低至8B、64B、512B)、高并发(数千条)、大存储容量(高达1PB或数百TB)[4][9][10] - AI工作负载分化推动存储评估指标从传统的“每TB成本”(TB/TCO)转向“每IOPS成本”(IOPS/TCO),推理和预测式AI的性能瓶颈在于处理海量、高并发、小I/O请求的能力(IOPS)[9][10] - 传统以CPU为中心的架构无法满足AI推理的高并发需求,成为瓶颈,需要提升GPU地位,使其成为数据访问的控制中心,实现从CPU“推送”数据到GPU“拉取”数据的转变[4][11][14] - 解决方案是通过GPU直连SSD硬件(如通过NVMe-of、RDMA、GPUDirect Storage等技术)和SCADA软件架构,让GPU绕过CPU直接、高效地从SSD读写数据,彻底旁路CPU在数据流中的角色[4][14][16] 2. 存储架构变化带来数据库架构的变化 - 架构层面发生根本变化:从“以CPU为中心”转向“以GPU为中心”,GPU成为主计算单元,CPU角色退化为任务调度器、事务协调器和元数据管理器[4][18] - 数据库核心组件需要升级改造:1) 存储引擎革新,新的缓存管理器需直接管理GPU显存和直连SSD间的数据流动;2) 数据布局优化,为匹配GPU的SIMD架构,可能采用纯列式或混合存储格式并原生支持Apache Arrow等零拷贝格式;3) 查询执行引擎重构,核心算子需深度重写为GPU内核并能直接从SSD流式消费数据,实现计算与I/O的完全重叠[4][19][21] - 查询优化器面临挑战,成本模型需纳入GPU计算核心占用率、HBM与SSD间带宽、PCIe传输延迟等新因素,并优先考虑数据本地性优化[21] - GPU直连SSD技术将使得数据库从一个在通用操作系统上运行的应用程序,演变为一个直接调度和管理GPU、SSD的“数据中心级操作系统内核”[4][21] 3. 产业进展逐步加快 - 硬件方面:1) 2025年8月,闪迪与SK海力士签署谅解备忘录,共同制定高带宽闪存(HBF)技术规范,目标在2026下半年发布HBF样品,首批搭载HBF的AI推理系统预计于2027年初面世[4][21][22];2) 2025年9月,铠侠宣布将与英伟达合作,开发可直接连接到GPU并进行数据交换的SSD,目标性能需达到2亿IOPS,并计划支持PCIe 7.0标准[4][22] - 软件方面:1) Hammerspace通过优化元数据读取和GPU服务器直连存储驱动器中的数据放置策略,加速了其数据编排平台软件的性能[4][23];2) Cloudian HyperStore通过RDMA over S3技术,实现对象存储与GPU内存的直接数据传输,使基于S3接口的向量数据库性能提升8倍[4][24] 4. 投资建议 - 投资逻辑基于AI推理爆发驱动GPU地位提升及硬件架构变革(GPU直连SSD),进而引发软件生态(尤其是数据库)的重大重构需求,数据库产业有望迎来新机遇[4][25] - 报告提及的相关标的包括:【星环科技】、达梦数据、海量数据、MongoDB、Snowflake等[4][26]
云天励飞副总裁郑文先:AI进入推理时代 国产芯片迎窗口期
21世纪经济报道· 2025-12-06 12:55
文章核心观点 - 人工智能发展当前面临深度应用与高成本两大瓶颈 但作为第四次工业革命的底层根技术 其长期发展前景依然广阔 中国AI芯片企业正迎来国产化机遇 需通过选对赛道、技术创新和生态构建来应对挑战并把握未来智能硬件与Agent智能体等方向的机会 [1][2][3][4] AI行业发展现状与瓶颈 - **应用瓶颈**: AI进入深度应用阶段 在C端大模型价值已验证 但在To B侧因数据壁垒、深度场景挖掘及行业Know-how不足 尚未出现真正意义上的杀手级应用 [1] - **成本瓶颈**: AI推理成本偏高 大模型训练所需的算力资源、数据中心电力等成本推高企业研发投入 限制了AI的大规模应用 [2] - **泡沫争议**: 人工智能作为第四次工业革命的关键技术 未来将是底层“根技术” 即便存在泡沫也只是阶段性短暂过热 [2] 云天励飞的公司战略与技术布局 - **芯片研发历程**: 公司自2014年成立起持续投入AI推理芯片研发 已推出四代自研NPU 并基于最新NPU架构推出多款应用于端侧与边缘侧AI推理场景的芯片 [2] - **新一代芯片架构**: 正在研发采用GPNPU架构的新一代芯片 以更好适应GPU的CUDA生态并兼顾NPU的高效灵活 在成本端更具优势 更符合大模型在端侧与边缘侧规模化落地的需求 [2] - **供应链国产化**: 2022年成为国内首批采用国产先进工艺推动AI推理芯片量产的企业之一 目前芯片底层工具链、指令集、算子库及封装测试环节已全部实现国产化 [3] - **生态融合**: 已与DeepSeek、千问等开源模型以及鸿蒙系统完成适配 下一代产品将瞄准云端大算力推理芯片 [3] 中国AI芯片产业的机遇与挑战 - **发展机遇**: 国内集成电路发展进入快车道 更有自信推动全链条国产化技术的全面升级 人工智能正进入推理时代 应用需求爆发对推理算力的巨大需求为国产NPU类芯片带来广阔空间 [3][4] - **主要挑战**: 国产生态尚未形成合力 更多是企业单打独斗 而英伟达GPU的成功离不开CUDA生态提供的模型部署能力 此外 需求碎片化对芯片通用性提出更高要求 [3] 行业突围路径与未来展望 - **突围路径**: 首先选对赛道 抓住推理算力需求爆发的机会 其次坚持技术创新 通过架构和系统设计对冲国产先进工艺与国际顶尖水平的代际差距 第三是以系统化思维构建软硬一体的产品与生态 满足客户整体需求 [4] - **未来方向**: 未来三到五年重点看好两个方向 一是智能硬件 2025年将成为“AI+智能硬件”元年 智能眼镜、手表等产品将加速普及 公司已成立消费品全资子公司并推出AI拍学机和AI宠物产品 二是Agent智能体应用 将在企业流程再造和业务重构中发挥重要作用 [4] - **企业建议**: 未来每家公司的CEO都需要具备AI思维 主动审视并重塑业务流程 用人工智能推动提质增效 每位CEO都应成为公司的CAIO 每家公司都应设立人工智能官 [4]
亚马逊云科技首席执行官 Matt Garman:亚马逊云业务年增220亿美元,增量超半数《财富》500强企业全年收入
新浪财经· 2025-12-04 19:47
公司财务与业务规模 - 亚马逊云科技业务规模已达1320亿美元,同比增长速度加快至20% [1][1] - 过去一年业务新增220亿美元,该绝对增长额超过《财富》500强企业中一半以上公司的全年收入 [1][1] 核心产品与服务表现 - Amazon S3客户存储对象数量超过500万亿个,数据规模达数百EB,日均处理超2亿次请求 [1][1] - 连续第三年,新增到云中的CPU能力有超过一半来自Graviton5 [1][1] - 数百万客户使用其数据库服务 [1][1] - Amazon Bedrock已为全球超过10万家企业提供AI推理能力 [1][1] 人工智能与新兴技术进展 - Amazon Bedrock AgentCore为企业级安全部署和运行高能力Agent提供基础构件,发展势头强劲 [1][1] - AgentCore SDK发布仅几个月,下载量已超过200万次 [1][1] - 发布首款量子计算芯片原型Ocelot,将量子纠错的实现成本降低90%以上 [1][1] 基础设施与网络能力 - 拥有全球规模最大、部署最广的AI云基础设施 [1][1] - 全球数据中心网络覆盖38个区域、120个可用区,并已宣布规划新增三个区域 [1][1] - 过去一年新增3.8吉瓦数据中心容量,规模位居全球首位 [1][1] - 拥有世界上最大的私有网络,过去12个月增长50%,已铺设超过900万公里的陆地与海底光纤电缆 [1][1]
云天励飞陈宁对话Hinton:推理时代来临 GPNPU架构如何破局?
证券日报· 2025-12-03 14:41
行业趋势与瓶颈 - 现有计算体系在能耗和效率上面临巨大压力,未来需探索模拟计算、类脑芯片及基于类器官的计算等新形态[3] - 全球AI芯片产业规模到2030年有望达到约5万亿美元,其中训练芯片约占1万亿美元,推理/处理芯片有望达到4万亿美元,占比约80%[3] - 2025年是AI从训练时代全面迈入应用推理时代的元年,全球人工智能已进入应用大爆发阶段[5] 技术发展路径 - 未来AI处理芯片将被广泛嵌入眼镜、耳机、手机、笔记本、家电及各类企业设备中,实现无处不在的按需取用[3] - “推理异构化”成为行业趋势,单一芯片难以兼顾AI任务中高算力的需求理解阶段与高带宽的答案生成阶段[6] - 行业核心竞争力将聚焦于芯片架构的灵活适配能力,以应对多模型混合应用的常态[6] 公司战略与创新 - 公司以NPU为核心,推出GPNPU架构,走“推理优先架构”路线,目标实现推理效率百倍级提升[5] - 公司研发第五代GPNPU架构,核心是融合GPU通用性与NPU高能效,以“算力积木”设计和3D堆叠存储为核心创新[6] - 公司致力于通过全栈协同优化,为大模型组合应用与复合智能体部署提供核心算力支撑,实现“百万Token的极致性价比”[6] 公司竞争优势 - 公司自2005年参与并行计算指令集与芯片架构设计,掌握算法芯片化的第一性原理,可实现软硬结合的高性价比设计[7] - 公司沉淀了头部客户资源,具备资本与品牌优势,能吸引全球人才[7] - 公司地处粤港澳大湾区,可利用全球最完善的人工智能与机电一体化产业链,以及深圳的芯片设计、硬件制造、供应链与营销网络,以市场需求驱动研发[7] 行业生态与愿景 - 真正有意义的AI必须让更多人用得起、用得上,当AI使用成本接近水电气基础设施水平时,才能惠及偏远地区学生、基层医院和中小企业[4] - 公司呼吁建立全球统一的推理算力网络标准,以实现不同国家和地区在互联互通的推理网络上共享能力,尤其在医疗与教育领域[7]
上证早知道|AI手机,来了!《疯狂动物城2》,超20亿元!万科债,继续大跌!谷歌芯片,上调预测200万块!
上海证券报· 2025-12-02 19:44
今日提示与市场动态 - 2025企业家博鳌论坛系列活动将于12月2日至12月5日在海南博鳌举办 [1] - 2025年中国国际海事会展将于12月2日至12月5日在上海举办 [1] - 截至12月1日18时30分,影片《疯狂动物城2》票房突破20亿元 [2][6] - 沐曦股份发行初步询价日为12月2日,申购日为12月5日 [3] 政策与监管动态 - 广期所调整多晶硅期货PS2601合约规则:自12月3日结算时起,投机交易保证金标准调整为13%,套期保值交易保证金标准调整为12%;自12月3日交易时起,单日开仓量不得超过500手 [5] - 上海市政府印发人才引进落户新办法,明确引进本市紧缺急需的国内优秀人才可申办本市常住户口,自12月1日起施行 [5] - 国家发展改革委印发《基础设施领域不动产投资信托基金(REITs)项目行业范围清单(2025年版)》,新增数据中心类、人工智能基础设施项目 [5] - 瑞士投票否决了一项对超级富豪征收50%遗产税的提案 [5] 资本市场与公司事件 - 交易所债券市场12月1日收盘,万科债普遍继续下滑:“21万科04”跌超45%,“22万科02”跌超36%,“21万科02”跌超20%,“23万科01”跌超17% [6] - 万科将召开债权人会议讨论“22万科MTN004”的展期事项,会议时间为12月10日 [6] - 芯原股份股东兴橙投资方计划减持不超过525.86万股,国开基金计划减持不超过78.86万股(占总股本不超过0.15%),减持期间为2025年12月23日至2026年3月20日 [13] AI与科技产业 - DeepSeek于12月1日同时发布两个正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,官方网页端、App和API均已更新 [4][6] - 豆包手机助手技术预览版推出,搭载该助手的努比亚M153工程样机少量发售,豆包正与多家手机厂商推进合作落地 [7] - 12月1日AI手机概念掀涨停潮,广和通、福蓉科技、中兴通讯、鹏鼎控股、道明光学等涨停 [7] - 研究机构认为,端侧产业链催化剂密集,包括华为“智能憨憨”产品热销、理想AI眼镜发布会、字节火山大会等,苹果Siri也正考虑谷歌Gemini的驱动支持 [8] - 摩根士丹利基于供应链排查,大幅上调谷歌自研AI芯片TPU产量预测:将2027年预测从约300万块上调至约500万块,增幅约67% [9] - 报告测算,每销售50万块TPU芯片,有可能在2027年为谷歌增加约130亿美元的收入 [9] - 随着生成式AI走向规模化应用,全球AI产业重心正加速从训练转向推理;麦肯锡预计2028年全球AI推理市场规模将达1500亿美元,年复合增长率超40% [10] - 巴克莱预测,2026年AI推理计算需求将达到训练需求的4.5倍,占通用AI总计算需求的70%以上 [10] 大宗商品与原材料 - 12月1日百川盈孚数据显示,氧化镨钕、金属镨钕、钕铁硼价格集体上涨,幅度在3-6%之间 [11] - 研究机构认为,稀土供应端偏紧,部分分离企业开工率下降;需求端磁材企业保持较高开工率,海外市场需求逐步恢复,出口预期向好 [11] 上市公司公告摘要 - **佰维存储**:将回购股份资金总额由“不低于2000万元,不超过4000万元”调整为“不低于8000万元,不超过15000万元”;回购价格上限由“不超过97.90元/股”调整为“不超过182.07元/股” [12] - **工业富联**:截至2025年11月30日,公司累计回购931.99万股,占总股本0.05%,使用资金总额2.47亿元 [12] - **千味央厨**:将在2025年12月2日至12月16日期间开展股东回馈活动,符合条件的自然人股东可领取1份价值200元的产品礼包 [12] - **立中集团**:与伟景智能签署《人形机器人零部件委托加工技术协议》,受托进行机器人零部件的材料选型、设计研发及深加工 [12] - **恒逸石化**:控股股东及其一致行动人计划6个月内增持公司股份,增持金额不低于15亿元,不高于25亿元,增持价格不超过10元/股 [13] - **拓普集团**:拟筹划发行境外股份(H股)并在香港联交所上市 [13] - **卧龙新能**:同意通过下属公司建设包头威俊20万千瓦/120万千瓦时电网侧独立储能示范项目,总投资8.04亿元 [13] - **探路者**:拟以自有资金3.21亿元收购深圳贝特莱电子科技股份有限公司51%股权;拟以3.57亿元收购上海通途半导体科技有限公司51%股权 [13] 资金动向与机构观点 - 12月1日,**北京君正**获机构席位净买入2.51亿元,占总成交额比例3.98% [14] - 华安证券认为,存储产品在消费市场呈现周期向上趋势,公司更多型号DRAM产品将于今年下半年至明年陆续投片,DDR4及LPDDR4产品性价比将提升 [14] - 12月1日,**光启技术**获机构席位净买入1.47亿元,占总成交额比例3.70% [15] - 兴业证券认为,公司深耕超材料尖端装备行业,现有装备需求量提升及新型装备研制转批产提速,有望驱动业绩持续增长 [15] - 四季度以来截至11月28日,创新药主题ETF净申购额为191.31亿元,其中汇添富港股通创新药ETF净申购36.17亿元,广发港股创新药ETF净申购33.27亿元 [16] - 10月21日以来,有8只创新药主题指数基金上报;近一个月机构密集调研百济神州、安科生物、阳光诺和等公司 [16] - 平安基金经理周思聪表示,在创新药投资中坚持国内商业化主线和出海主线,看好ADC、多抗、细胞基因治疗、自免类产品以及医疗设备、CXO、医疗服务等领域 [16] 机构调研信息 - **伊戈尔**:泰国工厂完全投产后具备月产700台新能源变压器的能力,已与北美部分头部EPC客户达成合作,欧美体系储能客户合作也在推进 [18] - **复旦微电**:在FPGA领域保持国内领先,正布局算力从4TOPS至128TOPS的谱系化产品研发,首颗32TOPS算力芯片推广进展良好 [18] - **迈威生物**:旗下双靶点小核酸药物2MW7141与Kalexo Bio, Inc.达成全球独家授权协议,总交易额达10亿美元 [18]
12月2日早餐 | Deepseek发布新模型;大摩大幅上调谷歌TPU产量预测
选股宝· 2025-12-02 08:00
海外市场表现 - 美股主要指数收跌,道指跌0.9%,纳指跌0.38%,标普500跌0.53% [1] - 大型科技股走势分化,谷歌A跌1.65%,Meta跌1.09%,微软跌1.07%,而苹果涨1.52%,英伟达涨1.65% [1] - 纳斯达克金龙中国指数收涨0.96%,成分股中网易涨4.9%,阿里巴巴涨4.4%,小鹏汽车跌2.2%,理想汽车跌2.5%,蔚来跌5.7% [1] - 英伟达宣布向EDA巨头新思科技投资20亿美元入股 [1] 科技巨头动态与AI进展 - 苹果AI主管将离职,接班人曾在谷歌DeepMind和微软工作,公司正加速推进首款可折叠iPhone研发,预计2026年秋季发布 [2] - 谷歌将Gemini 3人工智能模式引入谷歌搜索,覆盖近120个国家和地区 [2] - 大摩大幅上调谷歌TPU产量预测,2027年预测从300万块上调至500万块,增幅约67% [1][8] - 报告测算谷歌TPU若开启外销模式,每销售50万块芯片可能在2027年为其增加约130亿美元收入 [1][8] 大宗商品与金属市场 - 伦钴收盘涨穿5万美元整数位心理关口,出口禁令到期后刚果(金)仍未恢复出口 [3] - 国际铜夜盘收涨0.73% [3] - 国内夜盘金属多数上涨,沪银收涨超5%,沪铜涨0.62%,沪锌涨0.98% [9] - 稀土磁材价格上涨,氧化镨钕、金属镨钕、钕铁硼价格集体上涨3-6%,近一周稀土价格持续上行 [8] 存储芯片市场 - 2025年11月主流NAND Flash wafer合约价全面大幅上涨,各类产品平均月涨幅达20%至60%以上 [7] - 需求受AI应用与企业级SSD订单强力拉动,行业位元供应增幅受限于厂商资本开支重点转向先进制程而非新产能扩张 [7] - TrendForce预测NAND市场供给紧缩将延续至2026年全年 [7] 人工智能与模型发展 - DeepSeek推出V3.2正式版,强化Agent能力,在智能体评测中达到当前开源模型最高水平 [6] - V3.2-Speciale模型版本成功斩获IMO 2025、CMO 2025、ICPC World Finals 2025及IOI 2025金牌 [6] - 伴随阿里QWEN大模型等竞品快速迭代,国内AI产业整体景气度有望继续提升 [6] - 麦肯锡预计2028年全球AI推理市场规模将达1500亿美元,年复合增长率超40% [10] 国内产业与公司动态 - 光大证券表示市场放量连续反弹,考虑到12月两场重磅会议的利好预期,指数有望延续反弹之势 [5] - 航天科技集团全力攻关突破可重复使用火箭等关键技术,推动太空经济发展 [9] - 上海闵行区330公里自动驾驶测试道路即将开放,滴滴自动驾驶在广州试运行全天候全无人Robotaxi服务 [9] - 电动车11月销量表现亮眼,鸿蒙智行突破8万辆创新高,小米再破4万辆,理想i6和i8累计订单突破10万辆 [9] 上市公司公告精选 - 探路者拟3.57亿元收购上海通途半导体51%股权,标的公司从事IP技术授权及芯片设计研发 [13] - 恒逸石化控股股东拟15亿元-25亿元增持公司股份 [13] - 卧龙新能投资8.04亿元建设包头威俊20万千瓦/120万千瓦时电网侧独立储能示范项目 [13] - 中超控股子公司中标合计13.18亿元项目,占公司2024年度经审计营业总收入的23.97% [13]
大摩上调谷歌TPU产量预测,产量预期呈爆炸式增长
选股宝· 2025-12-01 22:39
谷歌TPU芯片产量与市场前景 - 摩根士丹利研报显示谷歌自研AI芯片TPU供应链不确定性消退,未来两年产量预期呈爆炸式增长,可能意味着谷歌准备向第三方大规模销售TPU芯片 [1] - 基于供应链排查,将谷歌TPU在2027年产量预测从约300万块大幅上调至约500万块,增幅约67% [1] - 报告测算,每销售50万块TPU芯片,有可能在2027年为谷歌增加约130亿美元收入 [1] AI推理市场发展趋势 - 随着生成式AI走向规模化应用,全球AI产业重心正加速从训练转向推理 [1] - 麦肯锡预计2028年全球AI推理市场规模将达1500亿美元,年复合增长率超40%,远高于训练市场的20% [1] - 巴克莱预测2026年AI推理计算需求将达到训练需求的4.5倍,占通用AI总计算需求的70%以上 [1] 光学电路交换(OCS)市场机遇 - 谷歌TPU芯片的放量销售将给光学电路交换(OCS)等新增细分市场带来发展机遇 [1] - 腾景科技前期已签订YVO4(钒酸钇晶体)单笔采购订单8760.60万元,订单签订速度超预期,钒酸钇晶体为OCS核心材料 [2] - 光库科技积极布局OCS光器件业务,拓展OCS光交换机代工领域 [3]
云天励飞:第四代NPU研发完成,正在推进下一代高性能NPU研发
巨潮资讯· 2025-11-29 09:08
芯片技术研发进展 - 已完成第四代NPU的研发,并正在推进下一代高性能NPU的研发,新产品将更适合AI推理应用 [2] - 正在开发多款芯片以适配多样化应用场景 [2] - 已推出多代芯片系列,包括Deep Eye系列、Deep Edge系列及在研的Deep Verse系列、Deep XBot系列 [2] 产品应用与商业化 - 2024年推出的IPU-X6000加速卡已开始与软件企业、AI应用企业、互联网厂商等多个客户进行研发对接、生态融合并开始商业化应用 [2] - 2025年11月与金蝶软件达成战略合作,共同打造“国产算力引擎+企业级软件生态”的融合标杆,推动AI推理能力嵌入更广泛的企业数字化流程 [2] - 向客户的家庭主机产品提供DeepEdge10Max芯片,已有小批量出货,未来计划向其他边缘智能硬件产品提供AI芯片及相关服务 [2] 目标应用场景 - 芯片产品使用场景覆盖车路云、云端大模型推理、具身智能机器人等领域 [2]