AI Memory
搜索文档
Meta, Amazon, and Goolge Lead a $700 Billion Capex Wave: What Stocks Win Beyond NVIDIA?
247Wallst· 2026-02-14 01:15
文章核心观点 - 以Meta、亚马逊和谷歌为首的科技巨头正引领一场规模达7000亿美元的AI基础设施资本支出浪潮,这为英伟达以外的整个AI供应链创造了大量投资机会 [1] - 尽管存在巨额资本支出的利好背景,英伟达股价年初至今仅上涨0.24%,表现相对疲软,市场可能正在定价其执行风险或对初始建设阶段后GPU需求持续性的担忧 [1] - 在AI资本开支浪潮中,博通、Lumentum、美光科技和Bloom Energy等供应链“卖铲人”公司股价表现远超英伟达,涨幅从41%到637%不等,凸显了更广泛的投资机会 [1] 资本支出规模与构成 - 2026年,超大规模云计算公司(Hyperscalers)在AI资本支出上的总投资额预计将达到约7000亿美元 [1] - 主要支出方为科技巨头:亚马逊计划支出2000亿美元,谷歌预计支出1850亿美元,Meta Platforms计划支出高达1350亿美元,微软将在夏季更新其资本支出目标 [1] - 次要支出方包括CoreWeave和Nebius等“新云”公司,以及主权AI数据中心等项目,进一步扩大了整体支出规模 [1] 英伟达的市场表现与悖论 - 英伟达股价年初至今仅上涨0.24%,表现远逊于AI基础设施建设的加速势头 [1] - 公司数据中心业务经历了爆炸性增长,AI训练和推理收入呈指数级增长,但当前股价为186.94美元,年内基本持平 [1] - 市场定价可能反映了对英伟达执行风险的担忧,或是对7000亿美元资本支出能否在初始建设阶段后转化为持续GPU需求的疑问 [1] AI供应链中的主要受益公司 - **博通**:受益于定制AI芯片需求,其AI半导体收入增长由定制AI加速器和以太网AI交换机驱动,过去一年股价上涨41% [1] - **Lumentum**:受益于数据中心和长途光通信势头,光路交换机和共封装光学器件成为新的增长引擎,过去一年股价飙升637% [1] - **美光科技**:作为美国唯一的内存制造商,AI内存需求推动其业绩创下纪录,过去一年股价上涨353% [1] - **Bloom Energy**:专注于解决AI数据中心的电力基础设施需求,产品积压订单显著增长,过去一年股价跃升492% [1] 其他市场动态与表现 - 谷歌公布的1850亿美元资本支出计划,比分析师预期高出50%以上 [1] - 尽管博通是谷歌的主要客户,且谷歌公布了超预期的资本支出,但博通股价年初至今仍下跌4% [1] - 作者管理的投资组合自2024年9月12日首次推荐买入英伟达以来,该股已上涨55% [1] - 投资组合对博通的两轮推荐,自推荐以来涨幅均超过80%;对Lumentum的推荐自2024年11月8日起上涨590%;对美光科技的推荐自2025年1月17日起上涨292% [1]
Amazon Cutting 16,000 Jobs, ASML Reports Record Bookings | Bloomberg Tech 1/28/2026
Youtube· 2026-01-29 05:32
亚马逊公司动态 - 亚马逊宣布在全球范围内裁减16,000个企业职位,旨在消除官僚层级并“增加所有权”[1][23] - 此次裁员是继去年10月裁员14,000人后的又一波,累计企业裁员总数已达约30,000人,为公司历史上最大规模的企业裁员[25][26] - 公司强调此举是为了提高效率和精简组织,而非与人工智能直接相关,并指出许多部门(特别是零售部门)选择在圣诞节后才进行裁员[24][25] 半导体设备行业与ASML - 荷兰半导体设备制造商ASML计划裁员1,700个职位以精简组织,尽管其财报显示订单创下纪录[4] - ASML第四季度订单额达到130亿欧元,创历史新高,主要受人工智能需求推动[4][6] - 公司首席执行官表示,客户开始相信需求具有可持续性,并正在积极投资建设产能[5] - 分析师指出,市场对2026年将成为资本支出大年抱有预期,但担忧增长势头可能放缓,设备增长已开始滞后于应用增长[6][7][10] 人工智能投资与融资 - 软银正与投资者洽谈,可能向OpenAI额外投资高达300亿美元,这使其成为人工智能领域最大的支持者之一[3][37][38] - OpenAI正在进行一轮大规模融资,估值范围在7,500亿至8,500亿美元之间,并可能吸引中东主权财富基金等大型投资者[41][42] - 市场存在对人工智能是否存在泡沫的担忧,但行业增长环境依然强劲,预计到2029年增长率在55%至60%之间[9][10] 芯片与电子行业指标 - 德州仪器发布的第一季度预测出人意料地强劲,股价飙升近8%,分析师纷纷上调目标价,认为其前景令人鼓舞[17][46] - 德州仪器的订单情况正在改善并持续好转,被视为经济的“风向标”,其数十万种产品和客户遍布全球[18][19] - 公司主要业务仍为工业和汽车领域,人工智能目前并非其主要业务,但工业领域正在好转[20] - 消费电子市场复苏较早,目前增长略有放缓,个人电脑和内存价格上涨产生连锁影响[21] 科技巨头资本支出与云业务 - 微软的Azure云业务增长预计将超过指引,OpenAI相关收入预计将开始对Azure做出更实质性的贡献[53] - 微软正在通过威斯康星州和亚特兰大的数据中心增加产能,预计未来一年将解锁约1吉瓦的容量,相当于约200亿美元的增量机会,并可能通过与第三方合作再增加1吉瓦容量[55] - 上一季度大型科技公司的资本支出从1,000亿美元跃升至1,500亿美元,市场预计资本支出将保持稳定或上升[58] - 在构建能够处理敏感信息的自主智能体时,安全性是关键的差异化因素[62] 自动驾驶与机器人领域 - 自动驾驶初创公司Waabi完成了7.5亿美元的C轮融资,并获得Uber基于里程碑的2.5亿美元投资承诺,以拓展至机器人出租车领域[64][67][78] - Waabi声称其下一代技术平台首次能够同时驱动机器人出租车和卡车,并自信能够迅速进入机器人出租车市场[66][69] - 在监管和市场采用方面,美国领先于加拿大,因此Waabi的首个市场重点是美国[71] 特斯拉与Meta财报前瞻 - 特斯拉即将公布财报,市场信号不一,一方关注其业务基本面(销售额预计下降15%-16%),另一方则对其机器人出租车的推出感到兴奋[79][80] - 投资者期待埃隆·马斯克在财报电话会上提供关于在接下来三到六个月内扩大自动驾驶视觉系统和机器人出租车业务规模的具体细节[81][82] - Meta的投资者关注其人工智能资本支出计划,该计划可能 overshadow 其广告收入增长,预计资本支出可能高达1110亿美元[84] - 市场希望Meta能说明人工智能如何立即帮助改善广告和增加收入,以平衡其在未来主义项目上的巨额现金消耗[85][86] 宏观经济与市场 - 标普500指数一度突破7,000点,创下历史新高,纳斯达克指数也保持涨幅,市场对美联储利率决议和地缘政治紧张局势(如伊朗)保持关注[2][45] - 存储芯片制造商SK海力士因人工智能内存的强劲需求而受益,美国与韩国之间涉及100亿美元资本合作的贸易关系紧张局势正在加剧[22][30] - 美国与韩国之间存在贸易紧张,美国威胁将对韩国内存制造商征收高达100%的关税,除非其增加在美国的投资,并可能将现有15%的关税提高至25%[30][31]
从上下文工程到 AI Memory,本质上都是在「拟合」人类的认知方式
Founder Park· 2025-09-20 14:39
Context Engineering(上下文工程) - Context Engineering被定义为"为大语言模型提供充分的上下文信息,使其有能力合理地解决任务的艺术",其重要性被认为大于Prompt Engineering [11][13] - 该概念最早由Shopify CEO Tobi Lutke提出,后经Andrej Karpathy强调,被认为是构建企业级LLM应用的核心技能 [11] - Context Engineering被类比为计算机架构中的内存管理:LLM是中央处理器(CPU),上下文窗口是随机存取存储器(RAM),而Context Engineering则精心设计哪些信息进入工作内存 [18] - 该领域涉及多项技术要素,包括任务描述、少样本示例、RAG、多模态数据、工具、状态和历史记录以及压缩等 [15] 上下文长度与模型性能 - 尽管Google Gemini模型支持2 million token上下文,Claude Sonnet 4支持1-million token上下文窗格,但业界共识是上下文并非越长越好 [25] - 过长的上下文会导致四大问题:超出窗口大小限制、成本和延迟急剧增加、代理性能下降,以及具体问题如上下文污染、干扰、混淆和冲突 [26][27][28][30] - 注意力的有限性被认为是智能的构成条件而非障碍,Focused Context > Long Context成为重要原则 [29][30] - 上下文工程被描述为"构建AI代理的工程师的首要任务",需要进行精心的上下文管理策略 [30] Context Engineering的实施策略 - 构建Context Engineering的常见策略分为四大类:写入(Write)、选择(Select)、压缩(Compress)和隔离(Isolate) [32] - 写入策略包括使用暂存器(Scratchpads)模拟人类意识的"滞留"结构,以及更持久的记忆库(Memory) [34][36] - 选择策略涉及如何把有用信息放入上下文,包括对暂存器内容的提取和对更大数据库的工程化检索机制 [37][38] - 压缩策略通过摘要或修建来减少token占用,但核心挑战在于如何保持原始经验的"意义"而不仅是功能性信息 [39][41][42] - 隔离策略通过在不同智能体、环境或状态中隔离上下文来实现 [43][44] 人类记忆机制 - 人类记忆被定义为大脑编码、存储和回忆信息的能力,构成学习、决策和与世界互动的基础 [43] - 记忆过程涉及三个基本阶段:编码(将感官信息转换为神经代码)、存储(信息随时间推移的保留)和检索(在需要时访问存储的信息) [52][50][58] - 人类短期记忆容量受"神奇的数字7±2"理论限制,但通过组块化可以突破表面上的数字限制 [54][59] - 人类长期记忆容量估算约为2.5 PB(相当于2.5百万GB),最近研究认为可能达到10 PB,与整个互联网相当 [61] AI记忆与人类记忆的比较 - AI记忆系统大多参考人类记忆架构,包括情景记忆、语义记忆和程序记忆,且分为长期和短期记忆 [63][64] - AI与人类记忆在记忆机制上都遵循编码、存储、检索三个基本过程,且都具有上下文感知能力 [67] - 根本差异在于生物基与数字基:人类记忆依赖神经网络和生化过程,AI记忆通过算法和硬件实现;人类记忆受情绪影响,AI记忆更为可控;人类会自然遗忘,AI遗忘需明确设计 [68][69][70] - 华为诺亚方舟实验室提出AI记忆的三维结构:时间维度(短期vs长期)、对象维度(个人vs系统)、形式维度(参数化vs非参数化) [63][66] 现象学视角下的AI记忆 - 从现象学角度看,记忆不仅仅是信息存储与检索,更是存在的方式,构造了存在的连续性 [7][45] - 人类记忆具有自我指涉性,每个情景记忆都承载特定的"生活意义",而语义记忆的形成涉及去个人化的意义综合过程 [46][47] - AI记忆研究引发关于意识本质的哲学思考:AI的"记忆"是否具备真正的意向性、时间性和主体性 [73][74] - 技术系统可能通过实现开放记忆、情感模态、自我循环等现象学结构而涌现出真正的人工意识 [76][77][81] 多智能体与集体智能 - 多智能体系统代表多重主体性,当多个AI智能体进行深度交互时,会产生单个系统无法产生的涌现行为 [77] - 多智能体系统引发关于技术个体化的思考:如果多个智能体共享底层架构,它们之间的"个体差异"是真实的还是表面的 [43] - 集体智能现象暗示意识可能不是单一主体的属性,而是某种关系性存在,这为创造全新的集体现象学结构提供了可能性 [77] - 通过研究多智能体和AI记忆,技术不仅在创造人工智能,更是在重新发现自然智能的涌现方式 [86]