Workflow
Sora
icon
搜索文档
“短缺终将导致过剩”,a16z安德森2026年展望:AI芯片将迎来产能爆发与价格崩塌
华尔街见闻· 2026-01-08 20:18
"如果有什么东西出现了短缺,人类的历史证明它最终会被大规模复制,直到变成过剩——AI芯片和算力也不会例外。" 在最新的The a16z Show特别节目中,a16z联合创始人、硅谷风投教父Marc Andreessen(马克·安德森)就人工智能的未来格局、中美技术竞赛以及资本市场 最关心的回报问题进行了深度拆解。作为经历了互联网周期的资深投资人,安德森直言: "(AI)这是我有生以来经历的最大规模的技术革命……不仅比互联 网大,其量级堪比电力和微处理器。" 要点提炼: AI技术量级: AI是比互联网更宏大的技术变革,可与电力、微处理器和蒸汽机相提并论,目前仍处于"非常早期"阶段。 成本"通缩": 智能的单位成本(Per unit cost)下降速度远超摩尔定律,这将带来需求的爆发性增长。 "短缺导致过剩": 遵循"短缺导致过剩"的历史规律,GPU和数据中心的大规模建设最终将导致供应过剩,从而进一步压低AI成本。 市场结构: 未来AI市场将类似计算机产业结构:少数"上帝级模型"(类似超级计算机)在顶端,海量低成本"小模型"在边缘侧普及。 中美竞争: 这是一个双雄争霸的局面。中国(如DeepSeek、Kimi)在 ...
“短缺终将导致过剩”!a16z安德森2026年展望:AI芯片将迎来产能爆发与价格崩塌
硬AI· 2026-01-08 12:24
编辑 | 硬 AI 要点提炼: "如果有什么东西出现了短缺,人类的历史证明它最终会被大规模复制,直到变成过剩——AI芯片和算力也不会例外。"a16z联合创始人预言,AI是比互联网更宏大的技术变革,目前 尚处于早期阶段。他指出,智能成本正以超摩尔定律的速度崩塌,基础设施的短缺终将导致产能过剩,从而利好应用层。 作者 | 硬 AI 成本"通缩" : 智能的单位成本(Per unit cost)下降速度远超摩尔定律,这将带来需求的爆发性增长。 "短缺导致过剩" : 遵循"短缺导致过剩"的历史规律,GPU和数据中心的大规模建设最终将导致供应过剩,从而进一步压低AI成本。 市场结构 : 未来AI市场将类似计算机产业结构:少数"上帝级模型"(类似超级计算机)在顶端,海量低成本"小模型"在边缘侧普及。 中美竞争 : 这是一个双雄争霸的局面。中国(如DeepSeek、Kimi)在追赶速度、开源策略和芯片自研上表现惊人,这促使美国联邦层面的监管风向转为支持创 新。他说道,"基本上AI只在美国和中国被构建。世界其他地方要么造不出来,要么不想造"。 商业模式 : AI应用正从"按Token付费"向"基于价值定价"转移;初创公司不再 ...
“短缺终将导致过剩”!a16z安德森2026年展望:AI芯片将迎来产能爆发与价格崩塌
华尔街见闻· 2026-01-08 11:22
要点提炼: "导致过剩的第一大原因就是短缺" 尽管市场对于AI的营收增长与烧钱速度存在分歧,但安德森从投资者的角度指出,目前的许多担忧可能被误读了。他认为,核心在于智能成本 的"极度通缩"。 "AI价格的下降速度比摩尔定律还要快,"安德森在访谈中强调,"所有AI输入的单位成本都在崩塌。结果就是单位成本的'超通缩'(hyper deflation),这将推动超出预期的需求增长。" 对于投资者普遍关注的GPU和基础设施瓶颈,安德森给出了基于历史周期的判断:"在任何具有商品属性的市场中,导致过剩的第一大原因就是短 缺……因为短缺,你会看到数千亿甚至数万亿美元投入地下。未来十年,AI公司的单位成本将像石头一样直线下跌。" 中美竞赛:DeepSeek带来的震撼 访谈中,安德森罕见地详细评价了来自中国的竞争压力,特别是提到了DeepSeek和Kimi等模型的崛起。他承认,中国在开源模型上的进展让华盛 顿和硅谷都感到惊讶。 AI技术量级: AI是比互联网更宏大的技术变革,可与电力、微处理器和蒸汽机相提并论,目前仍处于"非常早期"阶段。 成本"通缩": 智能的单位成本(Per unit cost)下降速度远超摩尔定律,这将带 ...
派拉蒙大战Netflix,AI二创要把IP玩坏了?
36氪· 2026-01-07 18:47
文章核心观点 - AI技术正在深刻改变影视IP的创作、传播与商业化模式,用户生成的AI二创内容已形成病毒式传播,播放量可达数百万甚至上千万次,这迫使流媒体与内容巨头从最初的版权诉讼防御,转向与AI公司进行战略合作,以掌控IP在AI时代的新定义权与应用标准 [6][20][31][35] AI二创内容的兴起与影响 - 网友利用AI制作的“派拉蒙大战Netflix”IP混剪视频在X平台单条播放量超过730万,展示了将《鱿鱼游戏》、《老友记》、DC超级英雄等众多经典角色进行创意融合的能力 [6][8][11][13] - 网友自制的科罗娜啤酒AI广告片,融合了《哈利波特》、《小鬼当家》等多个IP,外网播放量超过500万,并获得了埃隆・马斯克的点赞 [20] - 此类内容引发了关于“slop”(低质量AI内容)的争议,有观点认为其缺乏逻辑与营养,但也有观点认为这是流媒体时代适合传播的新内容形式 [15][17][20] 流媒体巨头与AI公司的战略合作 - 迪士尼于去年12月11日宣布独家拥抱OpenAI,投资10亿美元,并授权旗下包括迪士尼动画、漫威、皮克斯、《星球大战》等200多个角色,用于Sora、ChatGPT等生成AI内容,该决议将于2026年生效 [31][33] - 迪士尼此举旨在建立行业标准,将高质量IP作为需付费并受控的独家资源,而非免费公共资源,在法规完善前达成企业战略一致 [35] - 国内方面,爱诗科技与阿里云签署全面合作协议,阿里云将为其PixVerse视频生成大模型提供全栈AI支持 [36] - 背靠阿里的优酷(虎鲸文娱)已在AI一键定妆、虚拟拍摄等方面落地应用,并将万相2.6模型接入千问APP,上线“AI小剧场”功能,利用《甄嬛传》等IP角色吸引用户 [38][40] - 腾讯视频在其在线视频业务单元(OVBU)设立新技术部,整合AIGC等能力,并启动“AI长片实验计划”,首批科幻、古装实验片预算控制在传统项目的60%以内,旨在用算法驱动内容生成 [42] 行业对AI侵权的应对与诉讼 - 在战略合作前,迪士尼曾积极起诉生成式AI公司侵权,例如向Midjourney提出长达110页的诉状,要求为每部侵权作品支付最高15万美元赔偿 [21] - OpenAI的Sora模型对迪士尼等版权内容设置了底层拦截,需版权方明确授权才能生成受保护角色,但用户仍能通过文本描述调整(如描述角色特征而非直接提及IP名)或视觉模糊处理等方式绕过限制 [26][28][29] - 爱奇艺在2025年1月起诉AI公司MiniMax,指控其未经授权使用爱奇艺版权素材进行模型训练,索赔约10万元人民币 [46] - 爱奇艺对AI技术持开放中立态度,在其主办的“与AI共生”短片创作大赛中,官方指定使用即梦的Seeddance 1.0pro和谷歌的VEO3等工具 [46][48] 潜在的行业收购背景 - 文中提及的AI二创视频灵感来源于一场重大的行业收购案:Netflix宣布计划以827亿美元收购华纳兄弟,随后派拉蒙发起了总价值约1084亿美元的敌意竞购 [6]
推理之父走了,OpenAI七年元老离职:有些研究这里没法做
36氪· 2026-01-06 15:45
核心观点 - OpenAI研发副总裁、核心技术奠基人Jerry Tworek于2026年初离职,其离职理由“想做在OpenAI做不了的研究”引发对公司研究方向与内部文化的深度担忧 [1][6][7] - 此次离职是OpenAI核心人才持续流失的最新案例,此前已有多位联合创始人、研究副总裁、安全负责人等关键人物因理念不合、商业化压力或安全分歧而离开 [1][8][10][11][13] - 公司正面临从理想主义研究机构向商业化巨头转型所带来的内部撕裂,核心矛盾集中在商业化压力与前沿研究/安全优先的理念冲突上,这可能动摇其最核心的资产——人才基础 [14][20][21][23] 关键人物离职详情 - **Jerry Tworek离职**:作为OpenAI七年老兵、研发副总裁,其离职标志着一位“开国功臣”级别的人物离开 [1][6] - **Jerry Tworek的技术贡献**:他是公司两大核心技术路线的奠基人和掌舵者,具体贡献包括:1) 作为“推理模型”之父,是o1/o3系列项目的团队负责人;2) 作为“编程代码”之父,是Codex模型的核心研究员;3) 是GPT-4解决复杂编程能力的关键贡献者;4) 在2025年主导了GPT-5的部署及ChatGPT Agent的研发;5) 其论文是AI解决数学难题的关键研究,在“代码生成”和“强化学习(RLHF)”领域拥有极高的学术引用数 [2] - **历史核心人才流失**:近年来离职的关键人物包括:前研究副总裁Dario Amodei(2021年出走创立竞争对手Anthropic及Claude)、联合创始人兼首席科学家Ilya Sutskever(政变后离开)、强化学习大牛及ChatGPT核心技术推手John Schulman、超级对齐团队负责人Jan Leike(因安全理念不合离职),以及产品、政策、安全等多条线的副总裁级别人物 [8][10][11][13] 公司内部环境与挑战 - **商业化转型的冲击**:公司从确保AGI造福全人类的非营利研究组织,在ChatGPT爆火和微软百亿美金注入后,转变为需要不断推出产品、追求商业回报的赚钱机器,这导致研究文化发生变化 [14] - **研究方向与安全优先级的变化**:部分核心研究人员感到工作重心转向赶产品发布截止日期、卷产品化功能以及讨好投资人和用户,与最初的研究乌托邦理想相悖 [14] - **安全问题的分歧**:前安全团队负责人Jan Leike因公司“把安全放在了次要位置”而“摔门而出”,凸显了在AI安全治理上的内部撕裂 [14] - **领导层与团队稳定性**:Sam Altman在2023年底权力斗争后虽巩固了控制权,但导致反对其的董事被清洗,并与多位元老级研究员关系破裂,权力核心变得“越来越孤独” [15][17][23] 行业竞争格局 - **竞争对手的壮大**:Anthropic(Claude)在编程等领域紧逼OpenAI,谷歌的Gemini在多模态领域不断迭代,Meta、xAI以及开源势力也在后面穷追猛打,行业竞争日益激烈 [17] - **人才流向竞争对手**:OpenAI流失的核心人才(如Dario Amodei)直接加强了竞争对手的实力 [8][17] 公司现状与未来展望 - **冰火两重天的人才流动**:在核心老将持续流失的同时,公司也在吸引新鲜血液,例如AI图像搜索引擎Lexica的创始人Sharif Shameem近期宣布加入,认为OpenAI是“改变世界的最佳舞台” [18] - **市场观点的分歧**:看多观点认为公司拥有GPT系列的技术领先、微软的坚定盟友支持、增长的用户规模与商业收入以及雄厚的技术人才储备;看空观点则指出核心人才持续流失、安全问题悬而未决、商业化透支技术信用以及竞争对手日益逼近等风险 [19] - **根本性挑战**:文章指出,科技公司最核心的资产是“人”,当最聪明的大脑开始“用脚投票”,创始元老纷纷离去,这本身就是一个危险的信号,可能预示着更深层次的危机 [20][21][23]
人工智能行业专题(14):大模型发展趋势复盘与展望
国信证券· 2026-01-05 09:16
行业投资评级 - 投资评级:优于大市(维持) [1] 核心观点 - 复盘美股科技巨头过去三年股价走势,AI叙事不断递进,从2023年OpenAI开启AI加速度,到2024年叙事转向推理侧,再到2025年谷歌后来居上,2026年预计Scaling Law将持续,模型厂商将打开差异化应用市场,模型推理侧需求或进入放量拐点,模型和算力或为最优投资方向 [2] - 2025年北美四家科技巨头资本开支同比增长50%以上,从年初的3200-3300亿美元上修至年末接近4000亿美元,预计2026年资本开支将持续实现30%以上增速,但巨额投入面临电力瓶颈制约 [2] - 模型架构继续演化,Scaling law延续,多模态和长文本能力为Agent爆发提供基础,下一代架构需解决Transformer的计算内存瓶颈和推理时记忆能力有限等痛点,中美模型差距在3-6个月 [2] - 通用大模型能力暂未分胜负,厂商商业化路径出现分化:OpenAI拥有C端8亿用户核心壁垒并计划发力企业业务;Gemini成为大模型的SOTA基准,得益于原生多模态路线和自研芯片生态;Anthropic坚持2B路线,在编程领域能力突出,估值已达3500亿美元;Grok信奉大力出奇迹,结合特斯拉数据优势 [2][3] - 大模型降低了软件开发门槛,打开了软件需求天花板,预计2029年全球SaaS市场将达到近1万亿美元(对比2025年5800亿美元),但行业玩家将重新洗牌,拥有数据壁垒或对准确度要求极高的垂类行业被替代风险较小 [3] - 2026年推理侧需求有望爆发,一级市场以编程场景、Agent爆发为主要应用方向,AI编程软件Cursor的ARR已达10亿美元,AI agent Manus在8个月时间ARR达到1亿美元,AI搜索工具Perplexity的ARR也已达到2亿美元 [3] 美股科技巨头股价和资本开支复盘展望 - 2023年:OpenAI领先开启AI浪潮,微软受益于独家合作估值抬升明显,英伟达股价全年上涨240% [7][10] - 2024年:市场叙事转向推理侧,英伟达业绩会估计其数据中心收入约40%来自推理,Meta因社交生态和广告场景成为除英伟达外PE唯一抬升的巨头,云厂商因资本开支增加但供给受限导致估值略有回落 [2][11] - 2025年:谷歌模型能力反超OpenAI,生态优势受市场追逐,云厂商供给释放收入加速,但市场开始担忧AI投资ROI及Scaling Law是否见顶,除谷歌外巨头估值均出现回落 [11][15] - 2026年预测:Scaling Law持续,模型厂商打开差异化应用市场,模型推理侧需求或进入放量拐点 [11] - 资本开支回顾:2025年北美四大科技巨头资本开支持续上修,微软约1160亿美元(同比+54%),亚马逊1250亿美元(同比+61%),谷歌910-930亿美元(同比+73%-77%),Meta 700-720亿美元(同比+78%-84%),均实现50%以上同比增长 [18] - 资本开支展望与电力瓶颈:预计2026年资本开支仍将增长30%以上,但电力成为核心制约因素,2024年北美数据中心容量约25GW,据Grid Strategies估计,未来五年将新增80GW需求,电力缺口是主要矛盾,各公司通过收购能源公司、海外拓展等方式应对 [2][25] 模型架构与Scaling Law发展趋势 - 2023年:处于Scaling law红利期,OpenAI凭借GPT-4确立SOTA基准,模型以文本为主导,多模态雏形出现 [30] - 2024年:多模态、推理模型涌现,OpenAI推出GPT-4o和推理模型GPT-o1,Claude、Gemini等模型开始缩小与OpenAI差距,编程能力提升带动Cursor出圈 [33][36] - 2025年:从“暴力美学”回归“算法与工程”,RLVR(可验证奖励强化学习)成为普遍方法,带动模型思维链使用和性能跃升,Deepseek R1通过RLVR+GRPO算法实现效率极大提升,Gemini引领原生多模态,Coding发生质变,Agent走向成熟 [37][40][44] - 下一代模型架构演化:需要解决Transformer在训练时的计算内存瓶颈(O(N²))和推理时记忆能力有限两大痛点,海外探索方向包括谷歌的Titans架构和Mamba架构,国内则更多从成本效率优化出发,如Qwen3-Next和DeepSeek V3.2 [2][47][51][57] - Scaling Law展望:预训练Scaling仍未见顶,Gemini3证明通过合成数据和架构调整可继续扩展,引入Mid training阶段,推理中的Scaling通过测试时计算和思维链实现 [63] - 强化学习是未来重点:被认为是模型训练继续Scaling law的关键,Grok4在后训练阶段实现了10倍于前代的算力投入,算法方向包括RLHF、RLAIF、RLVR以及PPO、GRPO、PRM等 [64][66] - 多模态与长文本进展:2025年趋势是从文本模型外挂多模态向原生多模态转变,谷歌保持领先,长文本能力通过新架构(如Mamba、Titans)实现突破,为更成熟Agent的出现奠定基础 [70][71] 主要模型厂商发展路线与格局 - **OpenAI**:坚持C端优先战略,拥有超过8亿用户的核心壁垒,2025年预计收入达130亿美元(C端订阅约占61%),目标2028年实现1000亿美元收入,下一代模型表现值得期待 [2][85][88][89] - **谷歌(Gemini)**:2025年成为大模型技术新的引领者,得益于对原生多模态路线的坚持、自研TPU芯片生态以及搜索和YouTube的高质量数据资源,月度Tokens消耗量持续增长 [2][44][91] - **Anthropic**:坚持2B路线,在编程领域能力突出,企业大模型API市场份额达32%,Coding市场份额达42%,2025年初推出的AI编程产品Claude Code年末ARR已达10亿美元,当前估值达3500亿美元,预计毛利率更优,最早有望2027年实现现金流转正 [2][3][95][101][102][107] - **Grok(xAI)**:信奉“大力出奇迹”,模型迭代速度快,Grok4通过投入10倍后训练算力迅速向SOTA看齐,计划推出的Grok5参数将达6万亿,拥有特斯拉独家数据资源优势,算力集群建设目标宏大 [2][109][113] 推理侧需求与AI应用展望 - **Tokens消耗增长**:推理需求反映在Tokens消耗上,根据OpenRouter数据,2025年周度Tokens消耗量从年初的5000亿增长至年末的3.67万亿,编程是主要驱动力 [118] - **当前消耗结构**:2025年各模型厂商的Tokens消耗更多聚焦于自身业务,如谷歌Gemini内部消耗占比约90%,OpenAI主要用于ChatGPT,国内阿里、字节也以内部场景为主 [124][125] - **SaaS市场变革**:大模型降低了软件开发壁垒,冲击传统SaaS企业,导致其收入增速持续放缓,据IDC数据,预计2025年全球SaaS市场达5800亿美元,2029年将达近1万亿美元,但玩家将重构 [3][126][129][131] - **应用场景分化**:通用型、对准确度要求低的SaaS工具(如营销、翻译)被大模型替代风险高,而拥有数据壁垒、工作流程复杂或准确度要求极高的垂类行业(如医疗、会计、安全)风险较小 [3][135] - **率先落地的应用**:AI编程和企业Agent是商业化落地最快的场景,AI编程市场2030年有望达260亿美元,Cursor、Manus、Perplexity等应用已实现高ARR,办公场景有望迎来更多产品落地,端侧AI设备(如AI手机、眼镜)及企业落地分销商领域将看到明显增长 [3][136]
Navigating the New Year: Market Outlook as 2026 Begins Amidst Holiday Closure
Stock Market News· 2026-01-01 22:07
市场假期与开盘前情绪 - 2026年1月1日美国股市因新年假期休市 纽交所和纳斯达克均无交易 也无官方盘前或盘后交易活动 [1] - 2025年12月31日美股期货小幅走低 标普500指数期货下跌0.2% 道指期货下跌0.1% 纳斯达克100指数期货下跌0.3% 显示新年开盘前市场情绪谨慎 [2] - 2026年1月1日期货市场交投清淡 标普500期货在盘中测试了6,936点的支撑位 暗示交易恢复后可能出现新年仓位调整 [2] 2025年市场回顾与表现 - 2025年最后一个交易日 主要股指连续第四个交易日收跌 纳斯达克综合指数下跌0.8% 标普500指数下跌0.7% 道琼斯工业平均指数下跌0.6% 罗素2000指数下跌0.7% [3] - 尽管年末回调 2025年仍是美股表现强劲的一年 主要指数连续第三年实现两位数涨幅 纳斯达克综合指数全年上涨约20% 标普500指数上涨约16% 道琼斯工业平均指数上涨约13% [4] - 2025年市场的强劲表现主要由人工智能相关公司推动 美光科技股价飙升239% Palantir上涨135% 超微半导体上涨77% 谷歌母公司Alphabet上涨65% 英伟达上涨39% [4] 宏观经济与美联储政策展望 - 美联储在2025年底将主要利率区间下调至3.5%-3.75% 为年内第三次降息 但美联储官员的预测中值显示 2026年仅会再加息一次 幅度为25个基点 [5] - 美联储2026年的政策将严重依赖经济数据演变 尤其是通胀和劳动力市场 截至2025年12月通胀率仍高于美联储2%的目标 同时市场对就业市场疲软的担忧持续存在 [5] - 美联储主席杰罗姆·鲍威尔的任期将于2026年5月结束 新任主席的可能性可能影响未来的政策决策 2025年12月的FOMC“点阵图”显示政策制定者对2026年利率路径存在分歧 [5] 近期重要经济事件日程 - 2026年1月2日 将发布美国11月建筑支出数据 [6] - 2026年1月5日 将发布美国12月ISM制造业指数 [6] - 2026年1月7日 将发布美国12月ADP就业报告和12月ISM非制造业综合指数 [6] - 2026年1月9日 将发布备受关注的美国12月就业报告 [6] 重点公司动态与新闻 - 蔚来公司2025年12月交付48,135辆汽车 同比增长54.6% 第四季度交付124,807辆 同比增长71.7% 2025年全年总交付量达到326,028辆 同比增长46.9% [11] - 特朗普媒体与科技集团宣布与一家加密货币交易所合作 向其股东奖励数字代币 该消息使其股价在12月31日上涨5% [11] - 耐克公司首席执行官据报道购买了价值约100万美元的公司股票 其股价在12月31日上涨4.1% [11] - 华特迪士尼公司与OpenAI在2025年12月达成一项里程碑协议 迪士尼将成为OpenAI生成式AI视频平台Sora的首个主要内容授权合作伙伴 并承诺向OpenAI进行10亿美元的股权投资 [11] - 美光科技股价在12月31日下跌2.5% [11] - Axsome Therapeutics、Telephone and Data Systems和DigitalBridge等公司在2025年最后一个交易日创下52周新高 [11] 其他市场数据 - 截至2025年12月31日当周 美国初请失业金人数为19.9万人 低于预期的22.2万人 [7] - 10年期美国国债收益率升至4.17% [7] - 白银期货在12月31日大幅下跌超过9% 结算价约每盎司70.40美元 但全年仍录得133%的惊人涨幅 [7] - 黄金期货下跌1.3% 至每盎司4,330美元 [7]
LeCun预言成真?这有一份通往AGI的硬核路线图:从BERT到Genie,在掩码范式的视角下一步步构建真正的世界模型
量子位· 2026-01-01 10:13
文章核心观点 - 一篇题为《From Masks to Worlds: A Hitchhiker's Guide to World Models》的论文提出,构建真正的世界模型(True World Model)最有希望的技术路径是从掩码预训练出发,经过统一架构与可交互式闭环,并设计持久的记忆系统[3][4] - 论文认为,真正的世界模型并非单一模型,而是一个由生成系统、交互系统和记忆系统三大核心子系统合成的有机整体[6][8] - 掩码(Masking)是贯穿世界模型演进五个阶段的灵魂线索,它已从一个预训练技巧进化为跨模态通用的生成原则和优于自回归的“创世法则”[4][10][13] 世界模型的定义与构成 - 真正的世界模型需要是一个由三大核心子系统合成的有机整体[6] - **生成系统**:是世界的物理法则载体,负责预测下一帧、模拟世界状态演化、将隐变量映射为观测,并预测任务相关的回报[8] - **交互系统**:包含推断器和策略,是让世界“活”起来、实现可交互闭环的关键,没有它,模型只是视频而非模拟器[8] - **记忆系统**:负责通过循环状态更新确保世界在时间轴上的持久连贯,是对抗熵增的防线[8] 世界模型的演进阶段 - 论文将世界模型的演进划分为五个阶段,并用一张全景图串联起了从BERT到Genie-3的十年AI进化史[4][9] - **第一阶段:基于掩码的模型** - 确立了“Mask-Infill-Generalize(遮挡-补全-泛化)”作为构建世界模型的地基[23] - **第二阶段:统一模型** - 目标是用同一个骨干,在同一个范式下,处理和生成所有模态[24] - **第三阶段:交互式生成模型** - 模型开始响应用户动作,从“放映机”变成“模拟器”[36] - **第四阶段:记忆与一致性** - 解决长程推理中的“灾难性遗忘”和“状态漂移”问题[46][48] - **第五阶段:真正的世界模型** - 当生成、交互和记忆系统完美融合,模型将涌现出持久性、主体性和涌现性三大本质特征[51][52] 第一阶段:掩码范式的统治力 - 掩码被证明是跨模态通用的“生成原则”和优于自回归的“创世法则”[13] - **在语言领域**:以Google的Gemini Diffusion为例,离散扩散模型将掩码进化为迭代去噪过程,在生成质量和推理速度上可比肩甚至超越传统自回归基线[16][17] - **在视觉领域**:MAE通过高比例像素遮挡学习到了极强的语义表征;MaskGIT和MUSE利用掩码生成变换器实现了并行解码,在保持高保真度的同时带来极致效率;最新的Meissonic证明掩码生成变换器可在高分辨率文生图任务上与顶级扩散模型竞争[19] - **多模态普适性**:从VideoMAE的时空管道掩码到wav2vec 2.0的音频掩码,再到Point-BERT的3D点云掩码,掩码是能统一所有数据形态的通用语言[22] 第二阶段:统一架构的路径博弈 - 实现统一模型存在两大阵营的博弈:语言先验与视觉先验[25] - **语言先验建模**:主流是自回归路线,但存在处理图像全局结构的局限;新兴的掩码/离散扩散路线(如MMaDA、Lumina-DiMOO、LaviDa-O)在保持语言理解能力的同时,利用掩码的双向注意力提升视觉生成质量,被视为掩码范式在语言建模内部的一次胜利[26][28][30] - **视觉先验建模**:从视觉模型出发反向兼容文本,例如基于潜在扩散模型的UniDiffuser和基于掩码图像建模的Muddit[32][35] - Lumina-DiMOO和Muddit等工作证明,掩码/离散扩散架构能在双向上下文中实现更精细的生成控制,是让“语言逻辑”与“视觉生成”完美兼容的最大公约数[34] 第三阶段:交互式生成模型 - 此阶段模型开始响应用户动作,从预测下一帧变为可交互的模拟器[36] - **从GameGAN到Genie**:Genie-1基于MaskGIT的离散掩码生成架构,从互联网视频中无监督学习“潜在动作”,通过预测被掩码的未来帧学会物理规律[37][38] - **Genie-3的突破**:实现了720p分辨率、24fps帧率的实时交互,并能维持分钟级的连贯游玩[41] - **效率优势**:掩码架构的并行解码能力使得Genie等模型能在极短时间内生成高质量下一帧,从而闭合低延迟的“感知-行动”回路;相比之下,传统的自回归视频生成模型在实时性上捉襟见肘[42][43] - GameNGen和Matrix-Game等基于扩散的实时引擎共同证明,要造可玩的世界,掩码/扩散范式是目前最有希望的路线之一[43] 第四阶段:记忆与一致性的挑战 - 当前视频生成模型依赖隐式的KV Cache或有限的上下文窗口,在长程推理中容易导致“灾难性遗忘”和“状态漂移”[47][48] - 论文梳理了三类解决方案以构建持久的世界[49] - **外部化记忆**:如RAG和MemGPT,给模型外挂一个可读写的硬盘,让知识可编辑、可追溯[49] - **架构级持久化**:探讨Mamba这类线性时间状态空间模型以及Ring Attention等技术,试图从架构底层实现“无限上下文”[49] - **一致性治理**:针对视频生成中的漂移,利用FramePack、Mixture of Contexts以及VMem等技术,通过显式的3D结构或稀疏注意力为像素世界打上稳固的“时空桩”[49] 第五阶段:真正的世界模型与终极难题 - 当生成、交互和记忆系统完美融合,真正的世界模型将涌现出三大本质特征:持久性、主体性和涌现性[51][52] - 要到达此阶段,需攻克三大终极难题[53] - **连贯性/评估难题**:当世界是自生成的,需要新的评估体系来衡量虚构世界的逻辑自洽性[58] - **压缩/扩展难题**:世界模型必须学会“抽象记忆”,只保留因果相关的状态,否则计算量将导致系统崩溃[58] - **对齐/安全难题**:不仅要对齐世界的“物理法则”,还要对齐世界中涌现出的亿万智能体社会的“社会动态”,难度远超对齐一个ChatGPT[58] - 跨越此门槛后,世界模型将从娱乐工具升级为“科学仪器”,可用于运行经济、社会、认知等领域的虚拟实验[55]
Google wraps up best year on Wall Street since 2009, beating megacap peers as AI story strengthens
CNBC· 2026-01-01 05:06
公司股价表现与市场地位 - 2025年公司股价全年上涨65%,略高于2021年涨幅,是自2009年以来最强劲表现[1][2] - 股价在2025年4月触底后反弹超过100%,第一季度曾暴跌18%,为2022年中以来最差季度表现[2][3] - 在市值超过1万亿美元的八家科技公司中,公司是2025年最大涨幅者,涨幅远超博通(49%)和英伟达(39%)[2] 人工智能业务进展与竞争 - 2025年4月,公司提拔16年老将Josh Woodward负责Gemini应用,以应对ChatGPT竞争[3] - 2025年8月,Gemini应用推出图像生成功能Nano Banana并迅速走红,次月底生成图像超50亿张,在苹果App Store下载量超越ChatGPT[4] - 公司通过支付24亿美元许可费和补偿金,从AI编程初创公司Windsurf引入其联合创始人兼CEO Varun Mohan等高级研发人员,该初创公司此前曾与OpenAI进行30亿美元收购谈判[5] - 2025年推出升级版AI模型Gemini 3,距Gemini 2.5发布约八个月[7] - 生成式AI流量份额显著变化:ChatGPT份额从一年前87%降至约68%,而Gemini份额从约5%跃升至约18%[8] 核心搜索业务与AI整合 - 分析师认为关键发展在于AI投资对核心搜索业务的影响,AI Overviews服务通过更新模型提高答案相关性,进一步推动用户参与度[10] - 分析师预计公司能在2025年第四季度进一步加速搜索收入增长[10] - 2025年9月法院裁决虽认定公司在互联网搜索领域存在非法垄断,但未强制其剥离Chrome浏览器,并允许其继续向苹果等公司支付费用以保持默认搜索引擎地位[6] 云计算与资本支出 - 公司在云计算领域广泛发力,追赶亚马逊AWS和微软Azure,其自动驾驶公司Waymo在机器人出租车领域处于领先地位,被视为2026年潜在催化剂[11] - 2025年10月,公司将2025年资本支出预测从850亿美元上调至最高930亿美元,分析师预计2026年该数字将跃升至超过1140亿美元[12] - 公司云业务在2025年前三季度签署的超过10亿美元的交易数量,超过前两年总和[12] 财务预期与分析师观点 - 分析师预计公司第四季度营收将增长15%至超过1110亿美元,明年全年增长预计在低双位数百分比[11] - Pivotal Research分析师将公司股票目标价上调50美元至400美元,较当前股价313美元高出约28%,并维持买入评级[13] - 尽管存在对OpenAI等主要客户支出削减可能影响AI板块的担忧,但分析师认为任何行业洗牌都将使公司成为更为主导的竞争者[13][14]
年终盘点|美股年度牛股出炉!AI热度不减,核电、太空概念强势爆发
搜狐财经· 2025-12-31 18:19
2025年美股市场整体表现 - 2025年美股三大指数连续第三年录得两位数涨幅并屡创历史新高 截至12月30日 标普500全年累涨17.25% 纳指涨21.28% 道指涨13.69% [1] - 全年行情受“关税政策波动”与“美联储降息”双重逻辑驱动 年初AI板块领涨 4月因“对等关税”引发市场恐慌 纳指和罗素2000先后进入技术性熊市 随后在关税缓和、美联储降息及AI热潮共振下强劲反弹 12月依托“圣诞老人涨势”维持强势 [1] - 美股11大行业均录得正增长 材料板块以64.89%的涨幅领跑所有行业 医疗保健板块涨超55% 通讯服务板块涨41.38% [1][3] 行业与板块表现 - **材料板块**:2025年是贵金属及有色金属的“超级大年” 黄金、白银、铜等核心品种爆发式上涨 板块内个股涨幅显著 [5] - **AI相关板块**:AI叙事贯穿全年 年初OpenAI推出Sora带动“OpenAI链”走强 11月谷歌Gemini 3模型发布触发市场风格切换至“谷歌链” [6] - **核电板块**:AI算力爆发催生巨大电力需求 核电因零碳与高稳定性成为理想电源 叠加美国政府5月推出核电新政 目标未来25年将核能发电量提高三倍 板块成为市场焦点 [9] - **太空概念板块**:下半年站上市场风口 12月特朗普政府签署确立太空主导地位的行政命令 SpaceX确认2026年IPO计划 行业迎来估值重估 [15] 个股表现亮点 - **材料股TOP10**:总市值≥50亿美元的材料股中 Sibanye Stillwater(SBSW.US)股价涨330.3% 赫克拉矿业(HL.US)涨291.89% 盎格鲁黄金(AU.US)涨285.53% New Gold(NGD.US)涨258.47% 金田(GFI.US)涨239.96% MP Materials(MP.US)涨232.88% [4][5] - **美股十大牛股**:总市值≥200亿美元的个股中 闪迪(SNDK.US)涨578.47% 回声星通信(SATS.US)涨374.02% Lumentum(LITE.US)涨343.85% 西部数据(WDC.US)涨300.31% Bloom Energy(BE.US)涨298.06% 盎格鲁黄金(AU.US)涨285.53% 美光科技(MU.US)涨250.92% 金田(GFI.US)涨239.96% AST SpaceMobile(ASTS.US)涨238.72% 希捷科技(STX.US)涨232.24% [8][9] - **AI细分赛道个股**:AI主题交易扩散至细分赛道 存储晶片公司闪迪(SNDK.US)股价飙升近580% 西部数据(WDC.US)涨300% 美光科技(MU.US)涨250% 电力供应商Bloom Energy(BE.US)涨幅接近300% [7] - **核电股TOP10**:Centrus Energy(LEU.US)涨270.86% Oklo Inc(OKLO.US)涨237.35% Energy Fuels(UUUU.US)涨177% GE Vernova(GEV.US)实现翻倍涨幅 [10][12] - **太空概念股TOP10**:Planet Labs(PL.US)涨近400% 回声星通信(SATS.US)涨374% AST SpaceMobile(ASTS.US)涨238.72% Rocket Lab(RKLB.US)涨幅超175% [13][15] 2026年美股市场展望 - 华尔街对2026年标普500的目标点位预测集中在7100-8100点区间 若走势符合预测 将是美股连续第四年上涨 [16] - **摩根士丹利**预计标普500将攀升至7800点 认为美联储降息将提供支撑 AI技术驱动企业效率提升 看好非必需消费品、医疗保健、金融、工业板块及小盘股 [16] - **花旗**预计标普500年末目标约7700点 强调2026年AI产业将完成从基础设施建设到应用落地的关键转型 市场焦点从“赋能者”转向“应用者”赛道 同时认为金融等景气循环类板块将迎来高光时刻 建议加码金融股 减仓消费必需品板块 [16]