Workflow
AI推理
icon
搜索文档
博通管理层会议:AI推理需求激增,甚至超过当前产能,并未反映在当前预期内
华尔街见闻· 2025-07-10 16:46
AI推理需求 - AI推理需求正迅速放量且处于上升通道早期,未来可能带来市场规模和产能配置的重估及利润系统性上修 [1] - 过去两个月AI推理订单大幅上升,客户希望更快变现AI投资,当前推理需求已超过产能 [1][2] - 推理需求未被纳入此前市场规模预测(2027年对三个现有AI客户的预测为600-900亿美元),代表潜在上行机会 [3] AI XPU芯片业务 - 定制AI XPU芯片业务依然强劲,增长跑道清晰可见 [2] - 正与四个潜在AI XPU客户合作,计划今年为两个主要潜在客户(可能为Arm/软银和OpenAI)完成第一代AI XPU产品流片 [3] - 引领行业向2nm 3.5D封装AI XPU架构转型,计划今年完成2nm 3.5D AI XPU流片 [3] 网络产品与技术 - AI工作负载需要更高性能网络产品,计算与网络支出比例为3:1 [3] - 规模化扩展网络(scale-up networking)内容价值比规模化扩散网络(scale-out networking)高出5-10倍 [3] - 共封装光学器件(CPO)因光学组件故障率较高(5-8%)面临挑战,需更换整个CPO解决方案 [3] 非AI业务复苏 - 非AI半导体业务(服务器/存储、企业网络、通用数据中心、宽带)出现渐进式"U"型复苏 [4] - VMware通过VCF平台驱动增长,预计年化收入达200亿美元并维持强劲增长至2026/2027年底 [4] 财务与利润率 - 2026财年AI收入预计同比增长60%,运营费用不会同步高增长 [5] - AI网络收入(占AI收入30%)毛利率高于公司平均水平,具有强劲运营杠杆效应 [5] - 2025财年EPS预计同比增长38%至6.71美元,2026年增长25%至8.38美元 [5] - 2026年自由现金流预计达390亿美元,净负债率由2024年0.9降至2026年0.2 [5] 财务指标 - 2024-2026年营收预计从51574百万美元增至76362百万美元,年增速23%-20.4% [6] - 2024-2026年EBIT利润率从59.6%提升至66.2%,EBITDA利润率从68%降至59.7% [6] - 2026年ROE为43.6%,净负债/EBITDA从1.7降至0.4 [6] 战略与估值 - 专注于七个关键AI XPU客户合作机会,优先再投资而非并购 [6] - 摩根大通给出325美元目标价,较当前股价高16.9%,年内股价已累计上涨近20% [7]
【大涨解读】算力:出货量可能超iPhone,英伟达新服务器蓄势待发,配套部件有望迎来数倍需求提升
选股宝· 2025-07-03 11:07
市场表现 - 算力板块持续活跃,服务器相关股票表现突出,工业富联上涨8.27%,华勤技术上涨5.32% [1][2] - 新亚电子涨停,涨幅达10.01%,换手率为9.69%,流通市值57.96亿 [2] - 工业富联流通市值达4549.51亿,华勤技术流通市值为468.12亿 [2] 行业动态 - 高盛上调基板式AI服务器预测 [3] - 英伟达GB200量产进入高峰,下一代AI服务器芯片GB300预计2025年下半年上市 [3] - GB300出货量可能超越苹果即将推出的iPhone,成为科技产业新焦点 [3] - 广达电脑负责英伟达AI服务器系统集成,GB300预计9月出货 [3] 机构预测 - 高性能AI服务器H200、B200等2025/26年出货预期上调至52.5万/52.7万台 [4] - AI推理服务器2025/26年出货量预计同比增长10%/16%,市场规模同比增长37%/19% [4] - 2024年全球AI服务器出货量预计181.1万台,同比增长26.29% [4] - 搭载HBM的高阶AI服务器出货量预计108.8万台,同比增长40%以上 [4] - 全球服务器市场规模预计从2024年2164.0亿美元增长至2028年3328.7亿美元,年复合增长率18.8% [4] - AI服务器将占据近70%市场份额 [4] - 中国AI服务器市场规模预计从2020年26.8亿美元增长至2024年75.3亿美元,年复合增长率29.6% [4] 成本结构 - AI服务器中GPU成本占比接近70% [5] - 从普通服务器升级至AI训练服务器,内存、SSD、PCB、电源等部件价值量有数倍提升 [5]
大家都在用AI,程度远超你想象
36氪· 2025-06-30 15:18
企业级AI推理用量爆发 - AI推理API使用量与收入增长迅猛,毛利率高达75%以上 [1] - 即便模型保持不变,使用量仍呈指数级增长,且大部分在盈利范围内 [1] - 推理模型从几百token扩展到数万token,按token收费模式推动收入增长 [2] 谷歌AI战略与数据表现 - 谷歌I/O大会展示多模态竞争实力,定位为特定场景领先者及多领域前三 [2] - 谷歌AI平台月处理token数从2月160万亿飙升至逼近1000万亿,每秒处理1.5亿至2亿token [3][4][5] - 谷歌Gemini搜索概览覆盖超十亿人群,单日token处理量或很快超过Common Crawl预训练数据量(100万亿token) [5] 行业横向对比 - 微软Azure AI服务token处理量:2024年12月90万亿→2025年4月480万亿+,单月最高50万亿 [7] - OpenAI每日生成1000亿单词(约4万亿token/月),为谷歌4月数据一半 [8] - 中国公司如字节跳动、百度进入每日1万亿token量级 [11] 技术演进与商业化潜力 - 编码智能体等测试功能推动token消耗激增,单次深度查询可达100万token [12] - 行业增长周期持续加速,前代模型产品与新模型迭代形成叠加效应 [7] - 互联网数据重构为AI优先服务,人类生成数据迅速过时 [6]
黄仁勋称AI推理需要更多计算量
快讯· 2025-06-26 09:16
人工智能计算需求激增 - 英伟达CEO黄仁勋指出推理需要更多计算资源 [1] - 过去一年tokens生成量激增50到100倍 [1] - 大型人工智能工厂正在全球范围内快速建设 [1] 微软AI处理规模 - 微软上季度处理超过100万亿tokens [1] - 处理量是一年前的5倍 [1]
从PPTV到PPIO,派欧云不止负债越来越高
北京商报· 2025-06-24 23:07
公司概况 - 派欧云由PPTV创始人姚欣和前PPTV首席架构师王闻宇于2018年联合创立,采用轻资产运营模式,近期赴港递表 [2] - 按2024年营收计,公司在中国边缘云计算服务提供商中排名第七,市场份额4.1%,前三名天翼云、移动云、阿里云合计份额36.5% [2] - 公司专注于分布式云计算,适合图像及音视频传输等应用场景 [3] 财务表现 - 2022-2024年营收从2.86亿元增至5.58亿元,年复合增长率39.6% [4] - 同期销售成本从2.4亿元增至4.89亿元,占营收比例从83.9%升至87.7% [4] - 经调整净亏损从3913.4万元波动至6161.7万元,2024年同比扩大66.2% [6] - 2024年流动负债净额从4.39亿元扩大至7.38亿元,负债净额从4.04亿元增至6.96亿元 [5] 业务结构 - 边缘云计算服务贡献98.1%营收(2024年),AI云计算服务占比1.9% [9] - AI云计算服务2023-2024年营收从26.5万元增至1038.7万元,但毛损率高达91.3%-95.1% [10] - 全球AI云计算服务市场规模2024年315亿元,预计2029年达4277亿元(年复合增长率68.5%) [10] - 全球边缘云计算市场规模2024年1851亿元,预计2029年5003亿元(年复合增长率22%) [10] 客户与市场 - 2022-2024年前五大客户贡献营收占比86.1%-92.5%,最大客户占比35.2%-44.1% [11] - 主要客户集中于泛娱乐、社交媒体、电商领域,与分布式云计算应用场景高度匹配 [11] - 行业前三名天翼云、移动云、阿里云市场份额分别为13.8%、11.6%、11.1% [7] 行业观察 - 云计算行业普遍亏损,但金山云2024年亏损收窄60.5%,阿里云调整后EBITA增长33% [8] - 分布式云计算被公司视为AI推理的最佳选择,专家预测AI推理将占AI应用80%份额 [10] - 行业具有显著规模效应,龙头企业通过复用基础设施降低边际成本实现盈利 [8][9]
【美股盘前】三大期指齐涨,国际油价跌超2%;特斯拉涨近3%,瑞银上调其Robotaxi业务估值;黄仁勋开始减持英伟达股票,年底前或套现8.65亿美元;星巴克称未考虑全面出售中国业务
每日经济新闻· 2025-06-24 16:58
股指期货表现 - 道指期货涨0 66% 标普500指数期货涨0 79% 纳指期货涨1 05% [1] 国际油价走势 - 美油跌2 58% 布油跌2 71% 受以伊停火影响 [1] 美联储利率政策 - 特朗普呼吁美国利率应至少下调2到3个百分点 认为经济转弱时可再加息 [1] 稳定币市场动态 - Circle盘前续涨4 53% 上市以来累计涨幅约750% [1] 星巴克中国业务 - 星巴克否认考虑全面出售中国业务 强调中国市场长期潜力 股价涨0 73% [1] 英伟达高管减持 - 黄仁勋6月20日至23日出售10万股英伟达股票 价值1440万美元 年底前或套现8 65亿美元 [2] 特斯拉估值调整 - 特斯拉盘前涨2 8% 瑞银将其Robotaxi业务估值上调至3500亿美元 [2] AMD评级上调 - Melius Research将AMD评级从"持有"上调至"买入" 目标价从110美元上调至175美元 看好AI推理潜力 [2] 谷歌业务调整 - Google TV和Android TV团队预算削减10% 原预算不足5亿美元 可能影响约75名员工 [3] 美联储与经济数据 - 美联储主席鲍威尔将在众议院发表半年度货币政策证词 美国将发布6月谘商会消费者信心指数 [3]
研报 | 英伟达RTX PRO 6000特规版出货受市场关注,但存储器供应紧张成变数
TrendForce集邦· 2025-06-24 12:03
NVIDIA RTX PRO 6000系列产品分析 - 市场对NVIDIA RTX PRO 6000系列产品需求预期较高 但受限于存储器供应紧张等因素 出货量存在不确定性 [1] - RTX PRO 6000特规版预计2025年下半年推出 采用多元化存储器供应商策略:HBM主要依赖SK hynix LPDDR以Micron为主 GDDR由Samsung独家供应 [1] - RTX PRO 6000将采用96GB GDDR7 定位中低端GPU市场 聚焦AI推理 边缘端深度学习训练及影像模拟等应用 [2] 存储器供应链现状 - HBM领域SK hynix为主要供应商 预计2025年Micron供应占比将达30% [2] - LPDDR5x目前由Micron主导供应NVIDIA Grace主板 2026年Micron或成为SOCAMM独家供应商 [2] - GDDR7由Samsung独家供应 导致供应链持续吃紧 可能影响RTX PRO 6000生产与供货能力 [2] 产品应用与市场推广 - NVIDIA在COMPUTEX展会上联合ODM/OEM厂商推广搭载RTX PRO 6000的MGX AI Server 采用PCIe Gen5接口 瞄准企业边缘AI应用场景 [3] - MGX模块化参考设计未来将延伸至特定市场供应 [3] 行业研究背景 - 研究机构覆盖存储器 AI服务器 半导体 晶圆代工等高科技领域 提供产业分析与前瞻性报告 [12]
概率统计机制下,LLM 推理真的「理解世界了」吗?
机器之心· 2025-06-21 14:32
概率统计机制下LLM推理能力的本质探讨 - 苹果公司近期发表论文指出当前LLM的推理仅是模式匹配而非真正思考,引发行业对AI推理能力的重新审视[3] - 学术界对AI推理的经典定义强调其应包含逻辑推导、符号操作或统计关联生成新结论的过程,但佛罗里达人类与机器认知研究所科学家明确表示主流LLM尚未具备严格推理能力[4] - 2011年图灵奖得主Pearl的因果推理理论指出真正推理需理解「如果…那么…」的因果关系,而当前LLM缺乏因果框架导致推理深度不足[5] - 圣塔菲研究所教授通过实验证明GPT-4仅能复述类比题型但未发展出因果归纳能力,显示模型学习的是语言形式而非理解结构[5] 关于LLM推理能力的对立学术观点 - 普林斯顿荣誉教授提出推理本质是基于心智模型的认知活动,2018年图灵奖得主Hinton支持该观点并认为人类认知更接近模式匹配而非逻辑推理[5] - Hinton强调人类决策依赖经验映射和类比推理,而LLM展现的模式拟合能力已达到准认知水平[5][6] - UCLA研究者发现GPT-3/4在零试条件下通过类比推理解决新问题的能力匹配甚至超越人类表现[7] 思维链(CoT)在LLM推理中的实际作用 - 部分研究者认为思维链是LLM实现可用性推理的核心机制,Next Token Prediction可能构成动态建模过程而非简单复读[7] - 行业对CoT是否显性触发推理路径存在争议,强化学习后训练或可突破LLM当前的「知识幻觉」限制[1][3] 企业AI采购预算趋势分析 - 企业增加生成式AI支出的核心动因包括从自建转向采购第三方应用,且采购流程呈现传统软件特征[1] - 生产用例中采用多模型的策略源于对评估框架的优化需求,关键因素涵盖性能、成本与适配性等维度[1] 本期通讯数据概览 - 包含2项专题深度解读及31项AI/Robotics赛道要闻速递,其中国内动态8项、国外动态11项、技术进展12项[2] - 总字数达22632字,免费试读比例为7%,完整版需消耗99微信豆(约合人民币9.9元)[3]
三年累亏5.68亿元,AI云公司PPIO派欧云冲刺港股CEO要圆上市梦
钛媒体APP· 2025-06-21 08:57
公司概况 - PPIO派欧云由PPTV创始人姚欣于2018年创立,是一家独立分布式云计算服务商,上市主体PPlabs Technology Limited于2019年在开曼群岛注册成立[5] - 公司联合创始人姚欣为连续创业者,曾创办PPTV并累计募资超7亿美元,2014年出售给苏宁后转型投资领域,2016年加入蓝驰创投担任风险合伙人[5] - 公司获得百川智能创始人王小川、前微软Azure中国总裁申元庆等天使投资,以及创世伙伴资本CCV、磐霖资本等机构入股,2025年5月获港投公司支持[5] 股权结构 - 2025年4月完成B轮融资,分别获得Harvest Oriental及LCV Pathfinder的1100万美元和1000万美元投资[6] - IPO前姚欣夫妇共持股50.61%,其中吕姗姗直接持股28.52%,通过Ant Colony旗下实体持股22.09%,联合创始人王闻宇通过JayaSkypiea持股11.41%[6] - 公司执行董事包括姚欣、王闻宇、李哲,非执行董事为吕姗姗,独立非执行董事为何翠萍、孔杰、姚希[6] 业务模式 - 主营业务包括边缘云服务和AI云服务两大板块,合作伙伴涵盖中国移动、联通、电信及阿里云等[8] - 2024年收入结构:边缘节点服务占比70%(3.91亿元),边缘CDN占比28.1%(1.57亿元),AI云计算服务占比1.9%(1039万元)[12] - 算力网络覆盖全球1200多个县市,包含4000多个计算节点,AI云计算服务拥有超12万注册开发者[10] 财务表现 - 2022-2024年营收复合年增长率39.7%,分别为2.86亿元、3.58亿元、5.58亿元,2024年同比增长55.7%[11] - 同期毛利分别为4616万元、6352万元、6885万元,毛利率从16.1%降至12.3%[11] - 累计亏损5.68亿元,经调整后净亏损总额1.38亿元,主要源于优先股公允价值亏损及研发投入[11][12] - 2024年底持有现金及等价物1.14亿元,贸易应收款项1501万元,周转天数79天[13][14] 研发与行业前景 - 2022-2024年研发开支占比收入14.5%-18.9%,总额达1.96亿元,重点投入边缘云计算技术优化[13] - 中国边缘云计算市场规模预计2029年达370亿元,年复合增长率22.9%,全球AI云计算市场2029年规模将达4277亿元,年复合增长率68.5%[10] - 公司2025年5月日均token消耗量达1419亿,较2024年12月的271亿增长424%,跻身中国独立AI云计算服务商前二[10] 战略规划 - IPO募集资金将用于技术能力提升、多模态API平台升级、业务扩张及海外市场开拓[16] - 姚欣预测未来三年AI大模型推理成本或降1000倍以上,分布式算力将成为发展关键动力,中国AI将进入"免费应用"时代[15] - 公司认为智能体AI和具身智能将推动推理需求指数级增长,全球日均token使用量预计从2024年30万亿增至2029年3000万亿[16]
光电芯片:AI推理时代的算力新引擎
Wind万得· 2025-06-21 06:14
光电芯片技术优势 - 光电芯片数据传输速率可达每秒数太比特(Tbps),延迟性能较电子芯片降低两个数量级,光信号传输能耗极低,几乎不产生热量 [8][13] - 光电芯片可利用波分复用实现太赫兹(THz)级别带宽,而传统电子芯片带宽一般在吉赫兹(GHz)级别 [13] - 光计算每比特能耗低至10-18焦耳,相同功耗下运算速度比电子芯片快数百倍,大幅降低系统运行成本和散热需求 [8] AI算力需求与结构变化 - 全球AI服务器市场规模从2020年122亿美元增长至2024年1251亿美元,五年增长近10倍,2025年将持续扩大 [5] - 微软2025财年Q1资本支出达167.5亿美元(同比+53%),计划全年投入800亿美元扩建数据中心,目标2026年前AI训练算力提升5倍 [6] - 亚马逊2025年Q1资本支出243亿美元(同比+74%),全年1000亿美元支出大部分用于AI项目,算力需求从训练转向ASIC推理算力 [6][7] 光电芯片产业化进展 - 硅光平台是光计算主要实现方式,通过集成光子矩阵和DAC/ADC等器件替代传统ASIC硬件,未来将采用光电混合集成工艺提升效率 [10] - 光电芯片当前处于技术导入初期,实验室阶段已突破光信号调制技术,下一阶段将解决量产工艺难题,长期将渗透AI计算、通信等领域 [10][11] - Intel、IBM、NVIDIA占据2024年光电芯片专利总数68%,国内光本位科技完成5次芯片流片,128x128光计算板卡计划2025年商业化 [15] 国内光电芯片发展现状 - 国内10G光芯片国产化率约60%,25G以上仅5%,100G EML芯片未批量供货,CPO技术落后国际水平 [16] - 上海交大无锡研究院下线首片6英寸薄膜铌酸锂光电芯片晶圆,关键指标达国际先进水平,实现从"技术跟跑"到"产业领跑"跨越 [19] - 中国在光传输领域具备产业环境优势,光电芯片不依赖摩尔定律,通过工程经验突破高功率光源等关键技术 [16] 光电芯片市场前景 - 全球光电芯片市场规模2027年将超300亿美元,2022-2027年CAGR约25%,AI计算领域将呈现指数级增长 [17] - 光电芯片在5G/6G通信、智能驾驶(实时道路信息处理)、VR/AR设备等领域有广泛应用潜力 [21] - 广东省设立千亿级光芯片产业基金,上海张江科学城吸引15家初创企业入驻,形成产学研投协同体系 [22] 投融资动态 - 2025年国内光电芯片融资加速,老鹰半导体获超3亿人民币B轮融资,华辰芯光A++轮融资近2亿人民币 [25] - 资本集中于A轮后阶段,地方政府引导基金参与催化,如江苏国经投资喜咲光芯D轮,显示长期布局意图 [22][25]