AI推理

搜索文档
高通收购Alphawave:杀回数据中心市场胜算几何?
21世纪经济报道· 2025-06-16 20:36
高通收购Alphawave的战略布局 - 高通宣布收购半导体IP公司Alphawave,交易隐含企业价值约24亿美元,预计2026年Q1完成 [1] - 收购旨在加码数据中心市场竞争力,Alphawave的高端接口IP是进入AI芯片市场的重要砝码 [1] - 此次收购是继2021年收购Nuvia后,高通完善数据中心能力闭环的又一举措 [1] Alphawave的业务表现与技术优势 - 2024财年营收3.08亿美元(同比下滑4%),但预订额5.2亿美元(同比增长34%),毛利率59%(增长8个百分点) [2] - 已完成向核心数据中心业务转型,数据中心增长抵消了中国市场传统业务收入下滑 [2] - 在半导体设计IP市场排名全球第四,市场份额3.2%,专注于连接类IP产品 [3] - 通过IP、定制芯片、连接产品和chiplet业务解决AI加速器的连接带宽瓶颈 [3] 高通数据中心战略的演进 - 2017年推出基于Arm架构的Centriq 2400服务器处理器但折戟,主要因Arm生态未成熟 [5] - 2021年以14亿美元收购数据中心CPU公司Nuvia [5] - 2025年Computex宣布重返数据中心市场,与英伟达NVLink和沙特Humain公司合作 [6] - 计划结合Cloud AI 100推理加速器和Oryon架构CPU,2025年推出新服务器芯片 [7] 市场机会与竞争格局 - 数据中心向定制化CPU转变,AI推理需求快速增长推动高性能、低功耗计算需求 [2] - 高通可能采取两条路径:推出Arm架构处理器直接竞争,或学习博通的芯片设计服务模式 [4] - Oryon CPU架构的高效能解决方案将在数据中心市场与英伟达、AMD和英特尔竞争 [8] - Arm生态因亚马逊Graviton等产品的推动已变得更成熟,为高通创造机会 [7]
获沙特15亿美元投资,Groq专注以垂直整合策略打造AI推理基础设施
36氪· 2025-06-11 17:42
NVIDIA市场地位变化 - NVIDIA的市值目前稳居美国股市前三,但其市场地位已经不如之前那么稳固 [1] - Google使用TPU芯片训练出Gemini 2.5 Pro这个SOTA通用模型,打破了SOTA模型主要由NVIDIA GPU训练的垄断 [1] - 在市场更大的推理计算市场,NVIDIA的领先相对更小,面对AMD、Google、华为等大厂以及创业公司的竞争 [3] Groq公司发展 - Groq在2024年12月在沙特构建了由19000个Groq LPU组成的AI推理数据中心,仅花了8天时间就上线 [3] - Groq创始人兼首席执行官Jonathan Ross宣布获得沙特15亿美元的投资承诺,用于扩大其基于LPU的AI推理基础设施在该国的交付规模 [3] - 2024年早些时候,Groq完成由贝莱德领投的6.4亿美元融资,总融资金额超过10亿美元,公司估值达到28亿美元 [3] - Meta的首席AI科学家Yann LeCun加入Groq担任技术顾问,英特尔前晶圆厂业务负责人Stuart Pann加入担任首席运营官 [4] - Groq的创始人兼CEO Jonathan Ross参与了TPU的发明,公司吸纳了TPU团队的10位成员中的8位 [5] AI芯片市场与推理需求 - AI芯片的市场规模预计到2030年将达到1100亿美元左右 [7] - 目前大约有40%的AI芯片用于推理,未来AI推理的需求将提升至总计算需求的60-80% [7] - AI的推理成本已经下降99%,每美元在推理上的投入每年带来的价值提升十倍 [7] Groq的LPU芯片技术 - Groq的LPU(Language Processing Unit)是完全根据AI推理计算的需求而设计的 [8] - LPU专注于线性代数计算并简化多芯片计算模式,采用可编程流水线架构 [10] - LPU将内存和计算单元都集成在同一芯片上,片上SRAM内存带宽高达80TB/s,比GPU的HBM内存带宽高10倍 [10] - 当前一代LPU的能效比目前最节能的GPU高10倍 [10] - Groq的芯片组基于14纳米工艺制造,将在2025年内推出基于4纳米工艺制造的芯片 [11] Groq的产品与商业模式 - Groq的主要产品是AI推理云服务和AI计算中心,而非直接卖芯片 [12] - GroqRack集群以私有云或AI计算中心方式提供,计划在挪威部署129600个LPU [12] - GroqCloud云平台提供Tokens-as-a-Service的服务,开发者可以通过API访问平台并构建AI应用 [12] - GroqCloud平台上的活跃开发者数量从2024年7月的35.6万名增长到2025年4月的超过150万名 [15] - 大多数财富500强公司已经成为Groq的客户 [15] Groq的复合AI系统 - Groq在2025年开发了Compound复合AI系统,通过采取行动来解决问题 [16] - 该系统由多个开源模型共同驱动,使用Llama 4 Scout进行核心推理,Llama 3.3 70B辅助进行请求路由和工具选择 [16] - 开发者可以在此基础上构建AI Agent、智能助手和研究工具 [16] Groq的竞争优势 - Groq专注于提供快速的AI推理服务,没有碰训练和其他类型的计算 [18] - 垂直整合从硬件芯片到云服务之上的自研Compound复合AI系统 [18] - 与云服务商相比的差异化优势来自于专注和垂直整合 [18] - 创始人Jonathan Ross认为最关键的指标应该是每token的成本和能耗 [18] 行业趋势与创业公司优势 - 开源模型的崛起让企业和开发者能够用它们构建生产力 [13] - Groq在云服务中推出DeepSeek和Qwen的服务 [13] - 创业公司在速度、效率和对用户体验的迭代方面具有优势 [19] - 垂直整合路线中,大厂如阿里云、百度智能云更有基础,但创业公司可以在某些垂直服务上做到极致 [19]
国产替代加速或成长期主线,芯片板块小幅回调,芯片ETF(512760)昨日净流入超5000万元
每日经济新闻· 2025-06-06 10:55
消息面上,5月27日中欧半导体上下游企业座谈会在北京召开,商务部、中国半导体行业协会及40余家 中欧企业代表参会,强调深化半导体领域经贸合作,维护全球供应链稳定。 6月6日,芯片板块小幅回调,芯片ETF(512760)昨日净流入超5000万元。 东海证券指出,电子行业需求处于温和复苏阶段,AI推理市场需求高度增长,英伟达一季度数据中心 营收同比增长73%,AI推理token生成量在短短一年内激增10倍。当前国产EDA尚不具备完全替代美系 产品的能力,但长期将推动国产化进程。半导体设备、材料领域国产替代持续加速,1-4月半导体器件 专用设备制造利润同比增长105.1%。行业面临海外技术限制压力,自主可控成为发展主线,建议关注 AIOT、AI驱动、设备材料及消费电子周期筑底板块。 注:指数/基金短期涨跌幅及历史表现仅供分析参考,不预示未来表现。市场观点随市场环境变化而变 动,不构成任何投资建议或承诺。文中提及指数仅供参考,不构成任何投资建议,也不构成对基金业绩 的预测和保证。如需购买相关基金产品,请选择与风险等级相匹配的产品。基金有风险,投资需谨慎。 (文章来源:每日经济新闻) 没有股票账户的投资者可关注国泰CE ...
优刻得深度报告:从响应DeepSeek看优刻得,云计算价值重估进行时
浙商证券· 2025-06-06 08:23
报告公司投资评级 - 买入(首次)[4][6] 报告的核心观点 - 优刻得是中国领先的第三方云计算服务商,以IaaS、PaaS为核心构建完整云计算产品矩阵,服务模式分公有云、混合云与私有云,管理层专业背景深厚 [1] - DeepSeek推出R1系列模型降低模型部署与推理成本,公有云服务可使中小企业和个人低成本调用模型,私有化部署能让政企低成本完成私有模型部署 [2] - 优刻得快速上线DeepSeek模型,反映其行业洞察与执行力,作为第三方云计算服务商,独立性与中立性使其有望成敏感客户优先选择,且与大模型厂商合作具备行业know how [3] - 预计2025 - 2027年公司营业收入达18.49、21.56、24.59亿元,同比增速为+23.03%、+16.58%、+14.08%;归母净利润分别为 - 1.05、0.05、1.00亿元,采用PS估值,首次覆盖给予“买入”评级 [4] 根据相关目录分别进行总结 国内领先中立云计算服务商 - 全栈产品体系,技术优势显著:优刻得以IaaS、PaaS为核心构建完整云计算产品矩阵,云产品分公有云、私有云、混合云三类,公有云产品丰富,云主机是核心服务载体,GPU云主机提供算力;私有云主打国产化适配和轻量化部署;混合云采用“公有云+私有部署+专线网络”模式,提供UCMP平台助力降本增效;还有数据可信流通平台安全屋等增值服务,公司积累30项核心技术,获208项知识产权,有10个在研项目 [17][20][27] - 产品矩阵日益完善:传统公有云服务收入占比下降,混合云业务占比提升,积极拓展高附加值业务;公司财务状况改善,亏损逐年下降,毛利率回暖,净利率逐步改善,员工结构稳定,人均创收超170万,管理团队技术背景深厚 [27][34][36] 快速响应DeepSeek机遇,中立定位与算力优势双重赋能 - DeepSeek驱动推理需求增长,第三方中立带来市场机遇:DeepSeek系列模型降低推理成本,官方模型访问量激增致服务中断,第三方中立云计算厂商成敏感客户优先选择,优刻得提供DeepSeek模型私有化部署服务,适合政府、金融等机构,DeepSeek小模型为中小企业提供低成本方案 [45][47][48] - 算力储备充裕,快速全面适配DeepSeek:优刻得快速支持DeepSeek R1全系列蒸馏模型,上线对应模型,推出优智推理一体机和私有化部署方案,自有算力规模超4700P,依托两大自建数据中心构建算力网络,在国产化算力领域领先,推出“算力合伙人计划”,联合智谱AI构建推理集群积累经验,在具身智能领域有突破 [50][55][61] 盈利预测与估值 - 预计公司云业务持续增长,混合云、私有云快速增长,2025 - 2027年营业收入达18.49、21.56、24.59亿元,归母净利润分别为 - 1.05、0.05、1.00亿元,毛利率预计为24.33%、29.05%、32.64%,费用率呈下降趋势;公有云、混合云、私有云业务预计均有增长;采用PS估值,以数据港等为可比公司,2026年对应4倍PS,首次覆盖给予“买入”评级 [63][65][66]
AI推理成本降低推动应用繁荣,消费电子板块午后上行,消电ETF(561310)涨超1%
每日经济新闻· 2025-06-05 13:06
AI推理与消费电子行业趋势 - AI推理成本降低推动应用繁荣,端侧AI潜力巨大,耳机和眼镜或成为AI Agent重要载体 [1] - 消费级AR眼镜雷鸟X3 Pro搭载全彩Micro-LED光引擎,显示技术商业化进程加快 [1] - 海外厂商财报显示AI推理成为新增长引擎,数据中心业务爆发带动服务器、光模块等环节价值量提升 [1] 半导体与存储行业动态 - 存储价格触底回升,封测环节稼动率逐渐回升 [1] - 国产设备先进工艺突破持续推进,先进工艺扩产将成为自主可控主线 [1] - CoWoS及HBM卡位AI产业趋势 [1] 消费电子指数与ETF产品 - 消电ETF(代码:561310)跟踪消费电子指数(代码:931494),聚焦智能手机、可穿戴设备、智能家居等细分领域 [1] - 消费电子指数由中证指数有限公司编制,反映消费电子行业相关上市公司证券的整体市场表现和发展趋势 [1] - 无股票账户投资者可关注国泰中证消费电子主题ETF发起联接A(014906)和C(014907) [1]
东海证券晨会纪要-20250605
东海证券· 2025-06-05 10:56
报告核心观点 报告围绕电子、非银金融等行业展开分析,指出电子行业需求温和复苏,建议关注四大投资主线;非银金融中券商有望受益政策催化,保险保费稳健增长;同时还提及财经新闻、A股市场表现及市场数据情况 [5][10]。 重点推荐 电子行业周报 - 英伟达一季度营收440.62亿美元,同比增长69%,数据中心收入391.12亿美元,同比增长73%,AI推理需求强劲,token生成量一年激增10倍,但美对华H20禁令使其一季度计提45亿美元费用损失,二财季预计营收450亿美元 [5][6]。 - 美BIS要求头部EDA软件厂商停止对华服务,Synopsys、Cadence已确认收到通知,禁令或针对“军事用途”,短期国产EDA难替代,长期将推动自主研发 [7]。 - 本周电子行业跑赢大盘,沪深300指数下跌1.08%,申万电子指数下跌0.59%,建议关注AIOT、AI驱动、设备材料、消费电子周期筑底板块 [8][9]。 非银金融行业周报 - 上周非银指数上涨0.2%,券商指数下跌0.1%,保险指数上涨0.5%,市场股基日均成交额13090亿元,环比降5.8%,两融余额1.8万亿元基本持平,股票质押市值2.66万亿元,环比增0.3% [10]。 - 资本市场支持中国特色现代企业制度建设,6月18日陆家嘴论坛预计发布活跃资本市场政策,助推上海国际金融中心建设 [11]。 - 1 - 4月人身险公司累计保费19469亿元,同比+1.3%,4月单月同比增速11.6%,产险公司1 - 4月累计保费6486亿元,同比增长5.2%,预计预定利率调整带来“炒停售”催化 [12]。 - 券商建议关注并购重组等三条逻辑主线及大型券商;保险建议关注大型综合险企 [13]。 财经新闻 - 四部门开展人力资源服务业与制造业融合发展试点工作,将在30个左右城市先行先试,培育专业服务机构等 [14]。 - 美国5月ISM服务业PMI回落至49.9,低于预期52.0,自2024年6月以来首次低于50荣枯线 [14]。 - 6月4日公布美国5月ADP新增私营就业人数3.7万人,大幅低于预期11万人 [14]。 A股市场评述 - 上交易日上证指数拉升收红,涨0.42%至3376点,深成指、创业板收涨,短线或延续小幅震荡盘升,趋近3418点压力位 [16]。 - 上证指数周线呈阳K线,5周均线金叉20周均线,3418点压力重,整理后上破或打开上行空间 [17]。 - 上交易日同花顺行业板块多数收红,美容护理板块涨幅第一,通信设备等板块大单资金净流入居前 [18]。 - 商业指数表现活跃,日线技术条件向好,临近压力位,月线技术条件渐次向好 [19]。 市场数据 - 融资余额17927亿元,逆回购到期量2155亿元,操作量2149亿元,1年期MLF为2%,1年期LPR为3%,5年期以上LPR为3.5%等 [22]。 - 上证指数3376.20点,涨0.42%,创业板指数2024.93点,涨1.11%,恒生指数23654.03点,涨0.60%等 [22]。 - 美元指数98.8162,降0.42%,美元/人民币(离岸)7.1716,降202.00BP,欧元/美元1.1419,涨0.43%等 [22]。 - 螺纹钢2974.00元/吨,涨1.57%,铁矿石704.50元/吨,涨1.37%,COMEX黄金3397.40美元/盎司,涨0.61%等 [22]。
AI推理成为新增长引擎,5G通信ETF(515050)蓄力回调,近5日净流入5287万元
每日经济新闻· 2025-06-03 11:38
AI算力与5G通信行业表现 - AI方向表现分化 网络游戏和金融科技概念活跃 5G通信ETF(515050)跌0.29% 持仓股深南电路、移远通信、领益智造、光库科技领涨 [1] - 英伟达2026财年Q1营收达441亿美元 同比增长69% 净利润187.75亿美元 数据中心业务为核心推动力 [1] - AI推理成为主流工作负载 ChatGPT、Gemini、Grok等推动云厂商和科技巨头加速部署大规模推理平台 [1] - AI浪潮带动算力需求爆发 服务器、存储、PCB板等环节价值量大幅提升 [1] 资金流向与ETF布局 - 近5个交易日5G通信ETF(515050)获资金净流入超5287万元 [2] - 5G通信ETF(515050)跟踪中证5G通信主题指数 覆盖5G、AI算力、英伟达产业链 涉及6G、消费电子、PCB、通信设备、服务器、光模块、物联网等细分行业龙头 [2] - 创业板人工智能ETF华夏(159381)跟踪创业板人工智能指数 聚焦AI硬件+软件+应用龙头 前十大成分股包含新易盛、中际旭创、天孚通信三大光模块龙头 [2] ETF产品信息 - 华夏中证5G通信主题ETF(515050)场外联接A类008086 C类008087 [3]
AI服务器需求持续火爆! 戴尔(DELL.US)AI订单猛增 单季度订单超越2025财年出货规模
智通财经网· 2025-05-30 08:10
智通财经APP获悉,聚焦于PC与高性能服务器产品组装与制造的美国科技公司戴尔(DELL.US)周四美股 盘后发布的业绩报告显示,其全财年的利润展望超出华尔街分析师普遍预期,并称用于运行人工智能训 练/推理体系的AI服务器订单显著增加。戴尔截至5月2日的季度的AI服务器订单价值甚至超越整个2025 财年AI服务器出货量带来的整体价值,戴尔预计其计算机、服务器和存储业务的盈利能力将持续大举 扩张,并加快了股票回购,共同推进每股利润增长。 戴尔周四在业绩声明中指出,预计截至2026年1月结束的下一财年,不包括某些项目的每股收益将约为 9.40美元,高于今年2月给出的业绩预测。该公司重申其大约1030亿美元的全年销售额预期中值(戴尔给 出的销售额区间为1010亿美元至1050亿美元)。根据机构汇编的分析师平均预期,华尔街分析师们平均 预期在1030亿美元销售额基础上,每股收益约为9.21美元,意味着戴尔给出的财年利润预期显著超越华 尔街预期。 在截至5月2日的2026财年第一财季中,戴尔的整体销售额同比增长5%至234亿美元,高于华尔街分析师 们平均估计的231亿美元。不包括某些项目的调整后每股利润为1.55美元,同 ...
英伟达电话会全文!黄仁勋:“AI推理爆炸式增长”,痛失H20巨额收入但Blackwell芯片周产7.2万颗GPU
硬AI· 2025-05-29 22:05
核心观点 - 英伟达Q1营收同比增长69%至440亿美元,超出预期,但受H20出口限制影响,Q2预计损失80亿美元收入[1][8][25] - Blackwell芯片产能创纪录,周产72,000颗GPU,支撑微软单季处理100万亿Token的推理需求[1][10][28] - AI推理需求呈现爆炸式增长,微软Q1处理Token量同比增长5倍至100万亿[4][12][29] - 中国AI市场价值500亿美元,但受出口限制影响基本对美国关闭,公司正探索替代方案[3][8][45] - 企业AI和工业AI成为重要增长引擎,预计将改造5000亿美元IT基础设施[17][84] 财务表现 - Q1数据中心收入390亿美元,同比增长73%,其中Blackwell贡献近70%[25][27] - Q1网络业务收入环比增长64%至50亿美元,Spectrum-X年化收入超80亿美元[33][35] - Q1游戏业务收入创纪录达38亿美元,环比增48%,AI PC产品线扩展[37] - Q2营收指引450亿美元,GAAP毛利率预计71.8%,Blackwell盈利能力改善[20][43] 产品与技术 - Blackwell架构吞吐量比Hopper高40倍,专为复杂推理设计,软件优化使其性能提升1.5倍[3][10][30] - GB300系统本季度末量产,采用与GB200相同规格,HBM增加50%带来FP4推理性能提升50%[10][28] - NVLink技术实现PCIe Gen5带宽14倍,单机架带宽达130TB/s,Q1出货超10亿美元[34][35] - Omniverse平台助力工业客户:台积电节省数月工期,富士康热仿真提速150倍[39] 市场动态 - 全球近100个AI工厂在建,同比增长一倍,单个工厂平均GPU用量翻倍[31][62] - 主权AI成为新增长点,沙特500兆瓦、阿联酋5吉瓦项目启动,多国建设国家AI平台[49][84] - 开源模型DeepSeek R1和通义千问获认可,展现中国AI研发实力[13][46] - 推理工作负载从简单问答转向复杂代理式AI,计算强度提升100-1000倍[12][53] 供应链与产能 - Blackwell成为史上最快爬坡产品,主要客户每周部署近1,000个NVL72机架[10][28] - 美国本土制造布局加速:台积电亚利桑那厂年底量产,富士康休斯顿建百万平方英尺工厂[47] - 单个GB200 NVLink72机架含120万组件,重近两吨,供应链面临挑战[47] - H20库存减记45亿美元,部分材料被重新利用[26][45]
英伟达CEO黄仁勋:AI推理需求激增,特朗普取消AI扩散制度是利好
快讯· 2025-05-29 06:29
AI行业趋势 - AI推理需求增长超过计算能力提升速度 [1] - 特朗普政府取消拜登AI扩散制度 被认为对美国AI发展有利 [1] AI技术应用 - 企业级AI领域 Agentic AI表现优于通用AI [1] - 全球各地积极投资本土AI制造和应用 [1] - 新建工厂普遍采用AI技术 [1]