RTX 5090
搜索文档
老黄鸽了游戏卡!30年来首次咕咕,内存优先让路AI
量子位· 2026-02-06 20:00
英伟达游戏GPU产品发布计划重大调整 - 英伟达无限期推迟RTX 50 Super系列发布,并延迟下一代RTX 60系列发布,这是公司三十年来首次出现此类情况[2][3] - 产品延期源于全球显存芯片短缺,公司需优先将供应分配给AI GPU生产[15] - 公司内部代号为Kicker的RTX 50 Super已完成新设计,但高层在去年12月突然决定推迟发布[12][13] 产品策略与市场背景 - 英伟达打破其产品发布惯例,未在2026年1月的CES上发布新游戏卡[7][9] - 公司认为当前旗舰游戏GPU RTX 5090尚无立即更新换代的必要,因其在高端市场缺乏来自AMD的强力竞争[20][21] - 作为应对方案,公司计划重新推出已停产的RTX 3060显卡[4][24] - 公司发言人表示将继续出货所有GeForce产品,并与供应商合作最大化显存供应[23] 财务表现与业务重心转移 - 在2026财年第三季度,英伟达数据中心业务(主要为AI芯片)营收创历史新高,达512亿美元,占总营收近三分之一[18] - 同期游戏业务营收虽增长30%,但在总营收中的占比已大幅降低[19] - 文章指出,AI芯片需求高且利润丰厚,公司业务重心显露出从传统游戏向AI计算领域倾斜的迹象[16] 市场价格影响与行业连锁反应 - 显存短缺导致PC硬件价格普遍上涨,以RTX 5090为例,其厂商建议零售价为1999美元,但部分型号在2026年1月零售价已飙升至3500至4000美元[27] - 预计到2026年底,RTX 5090价格可能翻三倍,达到约5000美元[28] - 价格上涨影响游戏硬件产品发布,Valve已因内存短缺问题,取消了Steam Machine等新产品的定价和发售日期计划[29] - 任天堂表示将重新评估Switch 2的价格,并已在2025年8月上调了美国市场Switch全系产品的售价[32][33] - 专家预估GPU市场的价格波动将持续至2028年[34]
英伟达:美国芯片出口规定过于严格
半导体行业观察· 2026-02-06 09:33
文章核心观点 - 英伟达正就美国对华芯片出口新规向特朗普政府提出警告,认为其过于严格,可能摧毁市场需求并损害公司在中国市场的利益,同时新规可能意外地有利于其中国竞争对手华为 [2][3] - 英伟达正在削减对中国市场的GPU供应,并调整产品供应结构,这主要受限于显存供应,可能导致市场价格上涨 [4][5] 美国对华芯片出口管制与英伟达的游说 - 英伟达警告特朗普政府,针对中国芯片出口的新规定过于严格,将摧毁需求,这是其为重新获得中国市场准入的最新努力 [2] - 公司告知官员,对H200 AI芯片潜在客户(如阿里巴巴和字节跳动)的要求过于苛刻,可能破坏政府从销售额中抽取25%利润的计划 [2] - H200芯片于2024年发布,性能不及新的Blackwell和Rubin芯片,特朗普批准出口旨在保持美国在中国市场的竞争力而不大幅提升中国AI能力 [2] - 美国国务院等部门的一些官员呼吁加强监管,认为H200芯片的性能足以左右AI竞争格局,这导致审批速度放缓 [2] - 中国已批准客户首批购买H200,但后续订单和批准取决于美国的最终许可 [2] - 英伟达警告称,新限制与拜登时代被废除的规则相似,最终可能有利于中国芯片巨头华为 [3] - 新规包含严格的安全协议,旨在防止芯片转移至中国军方,并可能限制中国客户在境外使用芯片的能力 [3] - 公司向官员表示,某些合规要求需要客户投入大量资金,将降低AI数据中心的经济吸引力 [3] 英伟达GPU供应调整与市场影响 - 据Board Channels报道,英伟达正在中国削减30%的GPU供应量 [4] - 如果报道属实,GPU供应可能不足以满足市场需求,将迫使消费者承担更高的价格 [4] - 此报道与此前泄露的消息吻合,即英伟达计划在2026年第一季度削减GPU供应量 [4] - 公司已确认其GeForce显卡供应受到“显存供应”的限制,这可能是其被迫减少对中国供应的原因 [4] - Board Channels另一份报告称,英伟达正将大部分GPU供应集中在三款低显存容量型号上 [5] - 英伟达新GPU供应的75%分配给了8GB显存的RTX 5060、RTX 5060 Ti以及12GB显存的RTX 5070 [5] - 这意味着高显存容量GPU的供应量仅占总供应量的25% [5] - 由于内存供应受限,有关英伟达减少显卡供应的报道似乎合理 [5] - 近期,许多英伟达GPU在英国的基准价格上涨,尤其是32GB版本的RTX 5090 [5]
上市仅3个月,iPhone Air大降2500元,苹果客服回应;300万就能上太空旅游?演员黄景瑜、智元机器人CMO等人已预订;TikTok官宣美国方案
雷峰网· 2026-01-26 08:28
TikTok美国运营方案落地 - TikTok成立美国数据安全合资公司,负责数据保护、算法安全、内容审核及软件保障,由字节跳动、甲骨文、银湖资本等共同持股,其中字节跳动保留19.9%股份,为最大单一股东[4][5] - 由字节跳动全资控股的TikTok美国实体将继续负责电商、广告、市场营销等商业活动及全球产品互联互通,保障产品体验一致与核心收入来源[4][6] - 该方案使超过2亿美国用户可继续使用TikTok,其公司架构与业务划分被类比为苹果公司在中国的“云上贵州”运营模式[4][6] 苹果产品动态与市场策略 - iPhone Air上市三个月后在天猫官方旗舰店大幅降价,256GB版本原价7999元,活动价5499元,降幅达2500元,主要因销量不及预期,累积激活量不到20万台[8][9] - 同期iPhone 17激活量近500万台,iPhone 17 Pro Max激活量突破800万台,对比显示iPhone Air销量远低于预期,分析指其定价在iPhone 17系列高端与基础款之间定位尴尬[9] - 苹果年货节促销涵盖多款产品:iPhone 17 Pro/Pro Max最高优惠300元,MacBook Air最高优惠1200元,iPad Air最高优惠1000元,Apple Pencil和AirPods降价100-300元不等[10][11] - 苹果计划与英特尔重启芯片合作,自2028年起由英特尔代工部分非Pro版iPhone的A22芯片,以分散供应链风险,台积电仍将是主力代工厂[48] 中国AI应用与生态竞争 - 百度APP文心助手推出春节活动,将发放5亿现金红包,并作为首席AI合作伙伴合作《2026北京广播电视台春节联欢晚会》,上线近百种春节主题AI玩法[12] - 文心助手月活用户数已突破2亿,与豆包、千问形成国内三大亿级AI入口[12] - 百度完成业务架构调整,新设个人超级智能事业群组,整合百度文库与百度网盘,两者AI月活用户分别超9700万和8000万,合计用户近3亿,2025年三季度相关AI应用板块创造26亿元收入[27][28] - 腾讯宣布春节将在元宝App发放10亿元现金红包,单个红包最高达1万元,可直接提现至微信,旨在通过春节社交场景推动AI应用提速[16][17] - 中央广播电视总台2026年春晚AI合作伙伴包括:火山引擎(独家AI云合作伙伴)、字节跳动豆包(互动玩法)、银河通用机器人(指定具身大模型机器人)[17][20] - 360集团创始人周鸿祎预测2026年全球将出现至少100亿个智能体,并指出训练算力与推理算力需求不同,推理算力是普通公司与个人的主要需求[46] 机器人及具身智能发展 - 银河通用机器人成为总台2026年春晚指定具身大模型机器人,公司近期完成3亿美元(约合20.94亿元人民币)融资,估值突破30亿美元(约合209.39亿元人民币)[20][21] - 该公司首创合成仿真数据为主的训练技术管线,构建百亿级机器人干活数据集,并自主研发多个端到端具身大模型[20] - 特斯拉CEO埃隆·马斯克表示,公司计划在2027年底前向公众出售Optimus人形机器人,并预计未来机器人数量将超过人类[62] - 智元机器人CMO邱恒成为“中国001号商业航天员”,其于2023年自费购买中国首张商业航天“太空船票”[14] 半导体与硬件市场 - 中国边缘AI芯片公司爱芯元智通过港交所聆讯,有望成为“中国边缘AI芯片第一股”,2024年底完成超10亿元人民币C轮融资[17] - 以2024年出货量计,爱芯元智是全球TOP5视觉端侧AI推理芯片供应商,在中高端市场以24.1%市占率位居首位,同时也是中国边缘计算AI芯片领域TOP3供应商,其智能汽车芯片累计出货量近100万片[19] - 三星已将第一季度NAND闪存供应价格上调超过100%,涨幅远超预期,此前DRAM内存价格已上涨近70%,反映AI基础设施需求旺盛导致的供需失衡[60][61] - 纯血鸿蒙系统装机数突破4000万台,在中国移动操作系统市场份额达到18%,超过苹果iOS[32][33] 消费电子与汽车行业 - 大疆在2026年第1-2周中国运动相机线上市场夺得销量与销额双第一,销额份额达70.8%,在传统类、可穿戴及全景相机细分市场销量占比分别为71.8%、52.2%和53.6%[35] - 大疆Osmo Pocket 3全球累计销量突破1000万台,Pocket 4预计春节后发布[37] - 上汽大众2026年产品线将重大调整,计划推出近7款新能源车型,包括首款增程式SUV ID.ERA 9X,计划于3月上市,而威然MPV已停止后续研发,ID.3、ID.4 X、ID.6 X均已停产[39][40] - 特斯拉针对Model 3推出8000元保险补贴等多重购车福利,后轮驱动版起售价23.55万元[45] - 理想汽车回应“批量闭店裁员”传闻不实,表示今年会关停少量能效较低的商超门店,截至2025年底,公司在全国有548家零售中心[42] - 小米SU7和YU7下架熔岩橙配色,雷军称该配色很帅但敢买的人太少[30] 商业航天与太空旅游 - 北京穿越者载人航天科技公司开启太空旅游船票预售,票价300万元/张,预付10%可锁定名额,已签约来自多领域的十余位付费游客,包括演员黄景瑜、智元机器人CMO邱恒、中国工程院院士李立浧等[13][14] - 该公司自主研发的“穿越者壹号”载人飞船试验舱完成着陆缓冲系统验证试验,计划于2028年实现载人首飞[14] 国际科技公司动态 - 亚马逊云科技上调其EC2机器学习容量块服务价格约15%,高端实例p5e.48xlarge每小时费用从34.61美元涨至39.80美元,可能引发其他云厂商跟进提价[57] - 智能眼镜制造商Solos起诉Meta,指控其Ray-Ban Meta智能眼镜侵犯专利,要求数十亿美元赔偿并阻止销售[51] - 育碧公布重组计划,旨在通过关闭工作室和裁员节省2亿欧元(约合16.4亿元人民币),引发内部强烈反弹与潜在人才流失[53] - 黑石集团考虑出售所持徕卡相机股份,估值可能达10亿欧元(约合82.09亿元人民币)[56] - 苹果计划将由Gemini驱动的新版Siri深度整合到其核心应用生态中,相关功能最快可能于下月亮相[58][59]
华东大厂大规模「叫停」B200租赁订单;H200陷入价格迷雾;上市AI芯片公司曾「险」被收购;国资智算平台组建高管天团或求技术自主
雷峰网· 2026-01-23 18:01
算力租赁市场设备迭代 - 华东某头部大厂大规模叫停B200租赁订单,计划全面转向B300机型,此前配套资金已批复到位,但仅1-2个B200项目完成落地,其余已紧急叫停或转投B300 [1] - B300现货稀缺,即便谈妥订单供货量也十分有限,而市场上原有B200流通量极为紧张,目前仅华南某地区有数十台库存 [1] 英伟达H200出口与市场现状 - 特朗普政府宣布允许英伟达向“经批准的中国客户”出口H200芯片,但市场陷入观望僵局,多数企业暂停下单 [2] - H200模组价格据称从150多万元降至125万元,但降价真实性存疑,因内存价格上涨且美方要求征收25%出口分成 [3] - 自开放消息公布以来,尚未有一批H200完整走完双端审批流程流入国内,真实流通成本无法核算 [4] - 数周前产业报价显示,H200整机价格约205万元,行货价格预计高出20%,而头部贸易商参考价为220万元,但许多海外服务器大厂尚未拿到合规出货法律文件 [5] - 目前仅某服务器厂商有少量出货,侧面印证英伟达备货所剩无几,即便台积电立即重启产能,到货周期也至少需要3个月 [5] 国产AI芯片公司发展动态 - 过去三年间,多家国产AI芯片公司为解决经营与融资压力,曾主动寻求被国内某头部信创整机企业收编,但谈判均以失败告终 [6] - 在产业收购路径被阻断后,上述公司转而选择并完成了公开上市,目前均已登陆科创板或港交所 [6] 国资智算平台动向 - 北京某国资背景算力平台组建了豪华高管阵营,成员来自IBM、花旗投行中国业务、全球知名半导体企业等机构 [7] - 该平台能获取医疗、金融等高门槛国央企的数据,这是民营智算企业难以触达的 [7] - 行业观点认为,该平台正试图剥离早期的外部技术服务方,转而构建完全自主的核心技术底座,并在全国范围内外包智算中心,覆盖从规划到交付的全链条 [8] 英伟达L系列芯片需求 - 华北某互联网大厂上月敲定3万余片英伟达L20、L40芯片订单,用于特效、动画制作等渲染类业务场景,反驳了“L系列产品已过时”的论调 [9] - 对大厂而言,5090存在合规风险,而L20、L40技术成熟、生态兼容度高,能稳定匹配渲染场景需求,即便有国产替代产品,该大厂仍坚定选择英伟达过代产品 [9] 英伟达5090显卡价格波动 - 英伟达RTX 5090显卡迎来涨价潮,单卡涨幅普遍达5000-6000元,当前市场价格区间为28400-31000元 [10] - 海外市场消息称5090官方参考价将从2000美元大幅上调至5000美元,进一步助推国内涨价预期 [10] - 行业分析指出,此次涨价可能并非单纯市场调节,而是英伟达的主动布局,通过抬高消费级显卡售价,引导算力需求转向刚获准出口的H200 [10] 中昊芯英市场策略与传闻 - 中昊芯英在推进AI芯片产品商业化中,疑似在部分销售合同中引入带有“最低使用率承诺”条款的协议,以稳定订单预期 [11] - 该模式可能掩盖产品在开放竞争环境下的真实性能表现 [11] - 业内对其核心团队在国际顶尖AI芯片项目中的履历存在争议,对其宣传深度与真实背景持审慎态度 [12] - 市场传闻该公司可能通过非传统IPO渠道(如寻求重组或借壳)进入资本市场 [12] 润泽科技财务表现 - 润泽科技2025年前三季度毛利率达48.11%,显著高于行业19%-25%的平均水平 [13] - 高毛利核心依托两大因素:算力需求爆发前提前布局设备优化采购价并保障供应;与核心客户签订“3+2”合作协议,将核心利润集中在前期3年兑现 [13] - 后续2年或将面临价格敞口,意味着其依托订单带来的红利效应或将逐步收窄 [13] 国产算力项目竞争与挑战 - 国产算力赛道热度攀升,国内头部服务器厂商接连接手多个国产算力项目,为各家国产芯片厂商搭建算力集群 [14] - 算力租赁厂商坦言,国产算力项目存在消纳难题,规模在64台服务器以上的集群可获得芯片厂商专属工程师支持,但中小规模集群后续运维依赖项目集成方,带来不便 [14] - 国产芯片厂商竞争进入饱和式博弈阶段,以广西某银行算力项目招标为例,仅需数十台设备却吸引多家头部厂商竞标,项目方经全流程实测验证后,最终选择阿里巴巴旗下平头哥半导体的产品方案 [14] 智算中心建设与运营模式演变 - 智算中心建设出现出资方与统筹建设方角色分离的新方式,要求运营商垫资,再由建设方自行解决包销问题 [15] - 为对冲风险,新建智算项目合同中“100%包销”已成为入场标配,原本5年的包销周期现已普遍拉长至7年,核心要求是5年内必须回本 [15]
当黄仁勋将存储定义为「AI运行内存」,基础设施该如何实现物种进化?
机器之心· 2026-01-20 18:19
AI算力需求引发的存储市场剧变 - AI算力需求导致全球内存市场出现极端结构性紧缺,一根256GB内存条标价高达5000美元,价格超过英伟达顶配显卡RTX 5090的市场溢价 [1] - OpenAI与三星电子、SK海力士签署大规模DRAM晶圆供应协议,其预估的DRAM晶圆需求可能达到全球DRAM晶圆产能的约40% [2] - 微软、谷歌等大型科技公司也派出采购团队在韩国与主要存储芯片供应商展开密集谈判,以争取更多DRAM和高带宽存储(HBM)供应资源 [2] - 英伟达CEO黄仁勋预测,围绕AI推理与上下文的数据存储正在形成一个“此前从未真正存在过的市场”,其规模很可能成长为全球最大的存储市场之一,因为它承载着全球AI系统的工作内存 [3] - AI的工作负载在访问模式、时延要求和数据生命周期上都与传统系统截然不同,现有存储架构难以满足需求,存储技术本身必须经历一次根本性的重构 [3] XSKY星辰天合的公司概况与战略转型 - 公司成立于2015年5月,已从初创团队成长为独角兽,是中国对象存储市场的领跑者 [8] - 公司肩负中国核心产业超过5500 PB关键数据的安全重任,近三年实现了超过50%的逆势高增长 [8] - 随着业务对性能渴望加剧,其全闪存占比已翻了三倍,达到35% [8] - 公司拥有280个10 PB级以上的超级集群,并跨越了单集群百PB的技术门槛 [8] - 2026年1月15日,公司举办AIMesh产品战略发布会,宣布战略重心从“信息技术(IT)”全面跨越至“数据智能(Data Intelligence)” [5] - 公司致力于通过发布AIMesh全栈AI数据方案,打造开放解耦且绝对中立的数据底座,旨在破解企业私有高价值数据向智慧转化的效率瓶颈 [10] AI时代数据价值的根本性转变 - 过去十年的IT时代,数据中心的功能类似于“图书馆”,价值核心在于数据的“存得进、找得到” [9] - 进入数据智能时代后,数据的价值正在从“被检索”进化为“被计算”,每一份文档和图片都正成为生成未来的燃料 [9] - 企业的数据中心必须从“图书馆”演变为日夜轰鸣的“AI工厂” [10] - 在大模型时代,算法正在走向同质化,数据就是“源代码”,企业真正的差异化竞争优势和护城河在于其自身拥有的独特“专有数据” [11] - 出于安全和合规考虑,高价值的核心数据不能外溢到公有云,构建私有化、安全且可控的AI数据底座成为企业的刚需 [11] - 全球AI企业MiniMax的成功上市证明了在算法日益透明的今天,私有数据资产才是支撑企业估值与竞争力的核心 [12] - MiniMax有PB级的数据存放在XSKY的存储平台上,其中包括最核心的训练数据与推理模型数据 [12] 传统存储架构面临的三大挑战(三堵墙) - **IO墙**:当算力吞吐速度远超存储读写速度时,计算单元被迫空转等待,导致GPU利用率往往低至30%到50% [14][16] - **重力墙**:随着数据体量指数级增长,跨地域流动的高昂成本让数据逐渐沦为孤岛 [14][16] - **内存墙**:随着AI应用向长上下文和复杂智能体演进,KVCache的爆炸式增长让显存撞上物理极限,导致硬件投入成本急剧攀升 [14][16] - 数据显示,2018年至2025年期间,Transformer模型尺寸每2年增长约19倍,而每个加速器的内存每2年仅增长约1.9倍 [19] - 过去20年间,峰值计算能力增长了约6万倍,但DRAM带宽仅增长了约100倍,互连带宽也仅增长了约30倍,导致处理器闲置等待数据 [19] AIMesh解决方案:MeshFS(打破IO墙) - MeshFS是专为AI训练而生的并行文件系统,旨在打破“IO墙” [18] - 系统将XGFS成熟的企业级协议栈与XSEA星飞全闪架构的Shared-Everything极速底座深度融合 [21] - 在性能实测中,MeshFS凭借“一跳读”设计实现了顺序读带宽30%的提升,同时依靠端到端EC写技术让顺序写带宽超出同类产品50% [22] - MeshFS针对英特尔新一代至强处理器的AVX-512与AMX指令集进行了深度优化 [23] - 在大模型企业MiniMax的生产环境中,MeshFS提供了高吞吐、低延迟的I/O支持,有效保证训练效率,并支撑其近万个推理服务在极短时间内上线 [23] - MeshFS提供标准的POSIX语义,现有训练代码无需修改即可运行,并实现“一份数据,多协议互通” [26] - 通过全分布式架构和元数据分片技术,MeshFS的性能可以随节点数线性增长,将元数据处理延迟压低至微秒级 [26] - MeshFS支持智能分层能力,数据可以在全闪存层和低成本层之间透明流动,让用户能够以Tier-2的成本存储数据,同时享受Tier-0的训练速度 [26] AIMesh解决方案:MeshSpace(推倒重力墙) - MeshSpace是面向EB级数据的全局非结构化数据平台,旨在推倒“重力墙” [25] - 该平台实现了从“单桶千亿”到“单桶EB”的架构演进 [28] - 在性能表现上,MeshSpace带领对象存储迈入了“百万OPS单桶时代”,单个对象存储桶可以每秒支持高达一百万次对象写入,以及数百万次对象读取,远超主流公有云产品的单桶性能上限 [29] - XSKY对底层分布式KV引擎进行了优化,让AI训练中关键的大块写性能提升了近50%,同时将延迟降低了30% [29] - MeshSpace通过统一的全局命名空间收敛数据入口,业务端不再需要感知数据的真实物理位置,彻底解决了数据迁移带来的低效问题 [29] - MeshSpace能够直接纳管企业现有的XEOS集群,使过去积累的数据资产无需迁移即可原地升级 [34] - 通过统一的DNS接入,MeshSpace将分散在不同物理机房甚至云端的物理集群抽象为一个逻辑整体,对业务端而言只有一个统一的入口 [34] - MeshSpace支持异构存储平台的统一调度,数据可以在全闪存、HDD甚至磁带之间根据数据温度和业务需求自由流动 [34] AIMesh解决方案:MeshFusion(击穿内存墙) - MeshFusion是一种面向KVCache的“持久化内存”方案,旨在击穿“内存墙” [30] - 该方案运行在GPU服务器内部,通过创新的软件栈将本地NVMe SSD资源池化,转化为可供GPU直接调用的L3级外部内存 [31] - 实测数据显示,该方案能以1%的硬件成本实现近乎无限的上下文窗口,且性能与DRAM的差距保持在10%以内 [32] - MeshFusion拥有三大特性:数据从SSD直通GPU显存的零拷贝、专为KVCache的小IO高并发写入优化的极致并发、以及兼容vLLM等主流推理框架的协议自适应 [35] - 云计算服务商ZStack表示,MeshFusion的SSD扩展内存能力将显著降低AI服务规模化部署的门槛 [32] - XSKY正在与英特尔联合预研基于CXL技术的内存池化方案,旨在彻底打破物理内存边界,为万亿参数模型提供充裕的资源池支持 [32] XSKY的核心战略:数据常青与绝对中立 - 公司提出“数据常青”理念,主张用一个稳固、长周期的底座去支撑上层快速演进的算力竞争 [36][37] - 算力硬件的生命周期通常只有3到5年,而承载企业智慧的数据资产存续周期通常长达10到20年 [36] - 公司始终坚持不绑定任何一种特定的算力平台,无论企业选择英伟达还是昇腾、寒武纪等国产芯片,AIMesh都能提供统一且标准的数据服务 [37] - 这种对中立与解耦的坚守,使公司在生态构建中获得深厚信赖,例如与ZStack在云计算和AI时代均保持紧密合作 [37] - 公司的使命是做企业数据资产的守门人,同时也是AI之路的加速器,通过构建高效、可控的AI工厂,助力企业打破算力与数据的边界 [38][41]
开源8300小时标注数据,新一代实时通用游戏AI Pixel2Play发布
机器之心· 2026-01-17 11:24
行业背景与问题 - 人工智能在代码和图片生成领域日益成熟,游戏领域成为AI研究的重要方向,早期研究已在Atari、星际争霸、Dota等游戏上训练出超越人类玩家的专用模型[2] - 然而,这些专用模型缺乏跨游戏的泛化能力,只能在单一游戏环境中运行[2] - 另一方面,ChatGPT和Gemini等通用模型在众多任务上表现出色,但在游戏环境中表现不佳,即便是简单的射击游戏也难以应对[2] 解决方案:Pixel2Play (P2P) 模型 - 来自Player2的研究员提出了Pixel2Play (P2P) 模型,旨在解决上述问题[2] - P2P模型以游戏画面和文本指令作为输入,直接输出对应的键盘与鼠标操作信号[2] - 该模型在消费级显卡RTX 5090上可实现超过20Hz的端到端推理速度,能够像人类一样与游戏进行实时交互[2] - P2P作为一个通用游戏基座模型,在超过40款游戏、总计8300+小时的游戏数据上进行了训练[2] - 该模型能够以零样本 (zero-shot) 的方式直接玩Roblox和Steam平台上的多款游戏[2] 开源与数据 - Open-P2P团队在无使用许可限制的情况下,开源了全部的训练与推理代码,并公开了所有的训练数据集[3] - 训练游戏AI模型需要高质量的游戏画面、文本指令以及对应的操作数据,这类“画面-操作”数据在互联网上很少见[5] - Open-P2P项目开源的大规模高质量人工标注操作数据,弥补了该领域的空缺[5] - 训练数据同时包括游戏图像画面与对应的文本指令,并提供了精确的键盘鼠标操作标注[8] 模型设计 - 为保证快速的推理速度,P2P选择了轻量级模型框架并从零开始训练[10] - 模型主体由一个解码器Transformer构成,并额外接入一个轻量化的action-decoder来生成最终的操作信号[10] - 该结构使得模型在推理时只需对主体模型进行一次前向计算,即可生成action-decoder所需的表征信号,从而使整体推理速度提升5倍[10] - 为实现跨游戏通用性,P2P采用自回归的离散token序列作为操作输出空间,每个操作由8个token表示:4个对应键盘按键,2个对应鼠标在水平与垂直方向上的离散位移,最后两个对应鼠标按键[10] - 在输入方面,除了当前帧图像与文本指令token外,P2P还会输入真实操作token,使模型能根据历史操作做决策,更贴近人类玩家的操作习惯[10] - 为保证模型的因果关系,训练时使用了特殊的掩码机制,以确保模型在预测时仅能看见历史真实操作[10] 模型规模与性能 - P2P共训练了四个不同规模的模型,参数量分别为150M、300M、600M和1.2B[12] - 在实测中,150M模型可以达到80Hz的端到端推理速度,而最大的1.2B模型也能达到40Hz,完全满足与游戏环境实时交互的需求[12] 模型评估结果 - 模型评估主要采用人工评估,评估环境选取自四款游戏:Steam平台上的Quake、DOOM,以及Roblox平台上的Hypershot、Be a Shark[13][14] - 在模型行为评估中,1.2B模型生成的游戏录像与较小模型进行人工比对,结果显示1.2B模型分别以80%、83%与75%的偏好度优于150M、300M和600M模型[13] - 在指令遵循评估中,对于“按下红色按钮”的文本指令,未接受指令的模型通过率只有20%,而接收指令后模型的通过率可大幅提高到80%,显示出优秀的文本指令理解和执行能力[15] 因果混淆分析与规模效应 - 因果混淆是行为克隆中的常见难题,在高频交互环境中尤其突出[17] - 研究发现,扩大模型的规模与增加训练模型的数据量能够有效提升模型对因果关系的理解能力,使其不再依赖虚假关联,从而学到更好的操作策略[17] - 随着训练数据增多与模型参数量增加,P2P模型在因果推断评估中的表现呈上升趋势[19] 团队与作者 - 本文第一作者岳煜光现任初创公司Player2研究员,负责游戏模型的开发和研究[21] - 在加入Player2之前,他曾先后在Amazon和Twitter担任研究人员,致力于语言模型与推荐系统的相关研究[21]
旧技术回潮?显存经济学或迫使英伟达重启老款GPU生产以填补市场空白
华尔街见闻· 2026-01-16 20:53
文章核心观点 - 英伟达正基于“每GB显存收益”模型调整产品供应策略,优先保障高利润型号,可能导致部分中端大显存产品被边缘化,并可能重启旧款GPU生产线以弥补市场供应缺口 [1][2][3] 产品策略与利润模型 - 英伟达供应策略的内在逻辑是通过调整供给结构实现收益优化,重点保障第1、3、5档位(高利润型号)的供应,压缩第2、4档位(单位显存收益贡献较低)的占比 [2] - 具体利润模型显示:售价300美元的GPU(如RTX5060)每GB显存可贡献约35美元收益;售价400美元的8GB版本(如RTX5060Ti)每GB显存收益提升至约50美元;而售价500美元的16GB显卡每GB显存收益仅为32美元左右,处于利润劣势 [2] - 对英伟达利润率贡献最突出的产品主要集中在8GB显存的中高端型号(如RTX5060系列)以及极高端的RTX5090与专业级显卡 [2] 具体产品供应调整 - 英伟达正优先保障RTX 5060 Ti(8GB)及旗舰级显卡的供应,而RTX 5060 Ti 16GB等中端大显存型号的产能可能受到压缩 [1] - 基于利润模型,近期传闻英伟达可能重启RTX 3060生产,同时提高RTX 5090建议零售价,以通过旧款GPU填补中低端市场供应空缺,并将新一代显存资源集中于利润率更高的新产品线 [3] - 采用GDDR5等更早期显存模块成为可能选项,这类技术不受当前AI领域高速需求冲击,可在显存短缺阶段维持消费级产品线基本运转 [3] 市场格局与行业影响 - 如果显存短缺态势延续,英伟达重启部分老款GPU生产将成为可行的补位策略,以维持对各细分市场的覆盖 [1] - 这一转变将重塑消费者可选的产品组合,可能促使中端显卡市场逐渐形成“高利润导向、显存配置趋紧”的新供应格局 [1] - 尽管英伟达澄清不会停产RTX 5070 Ti 16GB版本,但零售渠道的实际到货情况将是判断产品真实供应优先级的关键信号,部分配置的型号可能在无官方声明的情况下逐步淡出主流市场 [3] 业务背景与根本原因 - 当前显存短缺的根本原因在于数据中心建设对通用型DRAM的需求激增,AI业务持续蓬勃发展 [4] - 在AI业务背景下,英伟达的消费级GPU业务已明显处于战略次要位置,其消费级产品策略受到市场质疑 [4] - 自RTX 50 SUPER系列传出延期消息以来,市场对其消费级产品策略的质疑一直存在,近期供应链调整进一步印证了消费级业务在公司整体资源分配中的优先级正在下降 [4] 技术营销与未来展望 - 英伟达惯常通过集成DLSS等新技术来提升老一代产品的性能表现,这为旧款GPU重返零售市场提供了技术营销基础 [4] - 预计未来几个月内,市场或将看到更多老一代显卡型号供应逐步增加的现象 [4]
黄仁勋CES回应全场!内存卡了GPU脖子,游戏玩家可能只能用旧显卡了
猿大侠· 2026-01-08 12:11
黄仁勋在CES 2026上的核心观点与行业洞察 - 黄仁勋在CES 2026上的核心主题围绕物理AI展开,包括机器人和自动驾驶,并将机器人定位为“AI新移民”,以解决人口结构问题并承担人类不愿从事的工作 [10] - 黄仁勋预计“今年内”就能看到在移动能力、关节活动度与精细动作技能上达到人类水平的机器人 [12] - 黄仁勋将AI基础设施定位为“AI工厂”,认为这是一种前所未见的新型基础设施建设,持续将电力、芯片和数据转化为智能产出 [35] 机器人产业的展望与挑战 - 从人口结构看,已无法支撑理想的经济规模,需要“AI新移民”机器人来助力生产车间 [10] - “机器人革命”将推动经济发展,经济增长又会创造更多就业岗位 [11] - 未来大量岗位不会被AI取代,但制造业等领域的体力蓝领岗位可能会消失 [11] - 当前机器人通常只有视觉感知,必须具备触觉能力,相关精细动作技能的研发难度极大,但行业正在积极推进技术突破 [13] 自动驾驶领域的战略与布局 - 英伟达发布了全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1 [15] - 英伟达与特斯拉FSD的核心区别在于定位:英伟达不生产自动驾驶汽车,而是为所有想要研发自动驾驶汽车的企业提供完整的技术栈与全套解决方案 [16] - 英伟达打造了三大核心计算平台:用于模型训练的训练计算机、用于算法验证的仿真计算机以及部署在终端的机器人计算机(车载计算平台),并为这三大平台配备了完整的软件栈 [17] - 客户可根据需求灵活选择使用全套方案、部分模块或某个组件 [18] - 英伟达的合作覆盖行业上下游,客户包括特斯拉、Waymo、小鹏汽车、Nuro、Lucid和Uber等 [19] - 英伟达奉行全面开源的策略,目标是赋能全球自动驾驶产业,所有具备移动能力的载具都应实现自动驾驶 [22] - 全球道路上有超过10亿辆汽车,未来10年其中将有数亿辆具备强大的自动驾驶能力,该领域很可能成为未来十年内规模最大、增长最快的科技产业之一 [20] 游戏显卡与消费级市场的动态 - 在CES 2026上,英伟达没有发布消费级游戏显卡 [24] - DDR5内存价格暴涨,SSD价格同步攀升,部分零售渠道中RTX 5090的售价甚至逼近4000美元,显卡价格遭受内存成本上升和供应紧张预期的“双重挤压” [25] - 针对增加旧款显卡产量以应对市场的方案,黄仁勋回应“有这种可能”,并考虑将最新一代的AI技术移植到上一代的GPU产品中 [25][26] - 最新的DLSS 4.5会导致旧款显卡性能大幅下降,下放AI能力需要付出不小的研发成本 [27] - AMD高管也透露,AMD或计划复产旧款AM4接口桌面处理器以增加市场供应 [29] AI游戏与图形技术的未来 - 英伟达在CES 2026上推出了全新的DLSS 4.5版本和增强版多帧生成模型 [31] - 黄仁勋认为未来的图形技术发展方向是神经渲染,本质就是DLSS,并预计未来将具备生成几乎任何风格图像的能力,能以每秒500帧的速度呈现照片级画质 [31] - 未来的渲染方式很可能是在更少但质量极高的像素上执行更多AI运算 [32] - 未来的视频游戏本质上会充满AI角色,每个角色都会拥有自己的AI并通过AI进行机器人式动画驱动,游戏的真实感将在未来几年大幅跃升 [32] AI基础设施与内存供应链 - 当前高带宽内存供应紧张,现有HBM容量远不足以支撑GPU运行需求,且内存瓶颈只会愈发严重 [36] - 英伟达提出了“新型存储内存平台”概念,并定位为“全球最大记忆体买家之一”,是横跨HBM、GDDR与LPDDR的关键需求引擎 [36] - 随着AI工作负载规模急速扩大,对内存的需求已是系统层级的竞争 [36] - 英伟达是全球首家且在短期内几乎是唯一的HBM4主要用户,已与主要内存供应商建立高度紧密的规划机制,直接协同规划产能,确保新产品量产节奏与平台发布同步 [36] - 各家HBM供应商正在为英伟达全面扩产,且产线“全部表现非常好” [36] 其他重要动态 - 黄仁勋在CES 2026后出席联想Tech World活动,与杨元庆共同宣布“联想人工智能云超级工厂”,英伟达最新发布的Vera Rubin将是该合作的重要组成部分 [6] - 黄仁勋在IEEE颁奖现场领取了2026年IEEE荣誉奖章,IEEE授予该奖以表彰其领先行业数十年的前瞻布局能力和对创新的不断坚持 [7][8]
黄仁勋CES回应全场!内存卡了GPU脖子,游戏玩家可能只能用旧显卡了
量子位· 2026-01-07 17:11
黄仁勋在CES 2026的核心观点与行业洞察 - 英伟达CEO黄仁勋在CES 2026的核心主题围绕“物理AI”展开,包括机器人和自动驾驶,并提出了“机器人是AI移民”以解决人口结构问题并推动经济增长的观点 [10] - 黄仁勋将AI基础设施定位为前所未有的“AI工厂”,认为其需求是新型基础设施建设,持续将电力、芯片和数据转化为智能产出 [35] 机器人产业的展望与进展 - 从人口结构看,现有经济规模难以为继,需要“AI新移民”(机器人)来承担人类不愿从事的工作,以推动经济发展并创造更多就业 [10][11] - 预计在“今年内”(指2026年),将能看到在移动能力、关节活动度与精细动作技能上达到人类水平的机器人 [12] - 当前机器人主要依赖视觉,但实现精细动作需要触觉能力,这是行业正在积极推进技术突破的难点 [13] 自动驾驶战略与行业定位 - 英伟达发布了全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1 [15] - 英伟达与特斯拉FSD的核心区别在于定位:英伟达不生产自动驾驶汽车,而是为全行业提供完整的技术栈与解决方案 [16] - 公司为自动驾驶领域打造了三大核心计算平台(训练、仿真、车载)及完整软件栈,客户可灵活选用 [17][18] - 英伟达的客户遍及行业上下游,包括特斯拉、Waymo、小鹏汽车、Nuro、Lucid和Uber等,系统具有极高的行业渗透率 [19] - 全球道路上有超过10亿辆汽车,未来10年将有数亿辆具备强大自动驾驶能力,该领域可能成为未来十年规模最大、增长最快的科技产业之一 [20] - 公司奉行全面开源策略,旨在赋能全球自动驾驶产业,目标是让所有具备移动能力的载具实现自动驾驶 [22] 游戏显卡与消费级市场的策略 - 在CES 2026上,英伟达未发布消费级游戏显卡,当前DDR5内存和SSD价格暴涨,部分渠道RTX 5090售价逼近4000美元,显卡价格遭受成本上升与供应紧张的双重挤压 [25] - 针对增加旧款显卡产量以应对市场情况的方案,黄仁勋回应“有这种可能”,并考虑将最新AI技术移植到上一代GPU产品中 [25][26] - 重启旧产线需权衡研发成本,例如最新的DLSS 4.5会导致旧款显卡性能大幅下降,实现兼容需要投入相当多的工程资源 [27] - AMD高管也透露,公司正在研究所有可行方案以增加供应,考虑将部分产品重新引入旧的AM4生态系统 [29] 游戏图形技术的未来方向 - 英伟达在CES 2026上推出了全新的DLSS 4.5版本和增强版多帧生成模型 [31] - 黄仁勋认为图形技术的未来方向是神经渲染(本质即DLSS),未来将能以每秒500帧的速度生成从写实到卡通渲染的任何风格图像 [31] - 未来的渲染方式可能是在更少但质量极高的像素上执行更多AI运算 [32] - 未来的视频游戏将充满AI角色,每个角色都拥有自己的AI并通过AI进行动画驱动,游戏真实感将在未来几年大幅跃升 [32] AI基础设施与内存供应链 - 黄仁勋指出,现有高带宽内存容量远不足以支撑GPU运行需求,内存瓶颈问题只会愈发严重 [36] - 英伟达是横跨HBM、GDDR与LPDDR的关键需求引擎,也是全球首家且在短期内几乎是唯一的HBM4主要用户 [36] - 公司已与主要内存供应商建立高度紧密的规划机制,直接协同规划产能以确保新产品量产节奏,各家HBM供应商正在为英伟达全面扩产 [36] 其他业务合作与个人动态 - 黄仁勋在CES后出席了联想Tech World活动,双方共同宣布“联想人工智能云超级工厂”,英伟达最新发布的Vera Rubin超算平台将是该合作的重要组成部分 [6] - 黄仁勋在IEEE颁奖现场领取了2026年IEEE荣誉奖章,以表彰其领先行业数十年的前瞻布局能力和对创新的坚持 [7][8]
256G 比 5090 显卡还贵!内存一年暴涨 3 倍,全球为奥特曼豪赌买单
程序员的那些事· 2026-01-03 08:49
文章核心观点 - AI需求引爆全球内存供应危机,导致消费级内存价格飙升且供应短缺,其影响已从数据中心外溢至智能手机、PC、游戏主机等消费电子领域,消费者将被迫承担成本上涨 [3][12][26][86] 内存价格暴涨现状 - 全球内存价格一年暴涨3倍,有案例显示64G内存条价格从350美元飙升至2500美元 [2][3][4] - 256G内存条价格比一张RTX 5090显卡还贵出1400美元 [6] - 用于iPhone的12GB LPDDR5X内存芯片价格从2025年初的25-29美元涨至约70美元,涨幅达2-3倍 [14][15][16] - 从年初至今,DDR5合约价格上涨了123% [21] - 游戏主机(如Switch)所需内存市场价格上涨41%,闪存价格上涨8% [24] AI需求对内存产业的冲击 - AI服务器对DRAM的需求量是普通服务器的8倍,导致需求激增 [34] - OpenAI的“星际之门”项目每月锁定高达90万片DRAM晶圆供应,相当于全球DRAM月度产量的40% [36] - AI已占用全球20%的DRAM晶圆产能,且短缺状况将持续到2026年以后 [53] - 微软、谷歌等巨头高管长期驻扎韩国,以争夺三星和SK海力士的产能 [38][39] - 英伟达与三星董事长会面,敲定未来多年的DRAM战略供应合作 [41] 内存供给结构发生永久性转移 - 三星、SK海力士、美光三大内存巨头将主要产能从传统DDR4转向高利润的AI产品,如高带宽内存(HBM)和DDR5 [46] - 美光宣布退出消费类内存业务(Crucial),专注于数据中心AI芯片,导致主流市场SSD和RAM产品线终结 [49][51] - HBM使用的硅晶圆数量是标准DRAM的三倍,进一步挤占消费级DRAM资源 [52] - 产能重新分配导致每多生产一片用于GPU的HBM,就少一片用于中端手机和消费级笔记本的晶圆 [79] 对GPU及显卡市场的影响 - AMD与英伟达预计从2026年初开始上调GPU供货价格,且可能“月月加价” [55][56][57] - GPU核心与显存(VRAM)成本占显卡交付给AIB合作伙伴总成本的近80%,其涨价将迫使终端产品提价 [60][61] - 市场担忧RTX 5090等高端显卡价格可能被炒至接近5000美元 [66] - 日本部分零售商已对RTX 5060 Ti 16GB及以上或RX 9000系列及以上显卡实施限购,因大容量显存显卡进货困难 [69][71] 对消费电子终端市场的影响 - 内存短缺将在2026年重塑智能手机和PC市场,IDC报告指出市场正从“周期性波动”转向“结构性改道” [75][76][78] - 对智能手机而言,内存成本占中端机物料清单(BOM)的15%–20%,占旗舰机的10%–15% [82] - 面对DRAM/NAND涨价,原始设备制造商(OEM)面临残酷选择:要么提价、要么降低配置、要么两者兼施 [83] - PC市场同时面临Windows 10退役带来的换机潮和行业力推的AI PC叙事,成本压力预计在2026年下半年进一步抬升 [83][84] - “便宜又充足的内存”时代正在结束,2026年可能成为技术产品普遍变贵的一年 [85][86]