Large Language Model (LLM)
搜索文档
Is Palantir a Good Stock to Buy?
Yahoo Finance· 2026-02-06 22:35
文章核心观点 - 人工智能技术使Palantir Technologies从一家主要与国防部合作的隐秘数据挖掘公司转型为跨行业提供人工智能平台的企业 其人工智能平台AIP正被医疗保健、金融服务、制造业等众多大型私营企业采用 并带来了前所未有的效率提升 [1][2] - 生成式人工智能和大语言模型正在深刻影响软件行业 它们不仅能处理通用查询 还能集成到其他软件中处理海量数据 辅助编写代码和进行复杂数据分析 [4][5] - Palantir通过其设计的本体论提供详细的可视化数据地图 使决策者能够基于实时信息建模和模拟不同场景 这区别于传统的回顾式仪表板工具 [6] - 华尔街看好Palantir的广阔市场机会 分析师估计其总可寻址市场可能高达1.2万亿至1.8万亿美元 [7] - Palantir展现出爆炸性增长 2025年全年收入同比增长56%至45亿美元 其中美国私营部门销售额同比增长109%至15亿美元 [8] 公司转型与市场定位 - Palantir已从一家主要服务于国防部的隐秘数据挖掘公司 转型为业务遍及各行业的人工智能平台公司 [1][2] - 公司的AIP平台正被医疗保健、金融服务、制造业等多个行业的大型私营企业采用 并带来显著的效率提升 [2] - 公司专注于设计本体论 即详细的可视化数据地图 可聚焦公司最细粒度的数据层面 [6] - 该技术使决策者能够基于实时信息对不同的场景进行建模和模拟 而非依赖回顾式的仪表板工具 [6] 行业技术背景 - 大语言模型是人工智能迄今最广泛的发明之一 例如ChatGPT、Gemini或Claude [4] - 这些模型采用生成式人工智能 帮助用户更高效地执行任务 [4] - 除了回答通用查询 大语言模型可集成到相邻的软件程序中 帮助消化大量数据 [5] - 生成式人工智能可利用这些信息帮助工程师编写软件代码 或协助数据科学家快速筛选复杂输入 从而更轻松地为复杂问题找到最优解决方案 [5] 市场机会与财务表现 - 华尔街认为Palantir面临巨大市场机会 分析师估计其总可寻址市场可能高达1.2万亿至1.8万亿美元 [7] - Palantir在2025年第四季度及全年财报中表现强劲 全年收入同比增长56%至45亿美元 [8] - 公司的非政府业务部门蓬勃发展 美国私营部门销售额同比增长109%至15亿美元 [8]
2 Stocks Powering OpenAI's and Anthropic's Revenue Surge in 2026
The Motley Fool· 2026-02-03 14:00
文章核心观点 - 人工智能公司Anthropic的销售收入预计将在2024年及未来几年实现爆发式增长,这为两家为其提供关键硬件支持的公司——英伟达和博通——创造了重要的增长机遇 [1][2][3] Anthropic 销售与增长前景 - 尽管尚未上市,Anthropic预计其2024年销售额将达到约180亿美元,较去年增长超过四倍 [2] - 据报道,该公司2025年的销售额预计将达到约550亿美元 [3] - 其Claude AI平台被英伟达CEO黄仁勋评价为“不可思议”,且英伟达内部大量使用该服务 [7] 英伟达 (Nvidia) 的关键作用 - Anthropic使用英伟达的图形处理器来训练和运行其AI软件 [4] - 在高端AI处理器领域,英伟达的性能优势地位尚未出现实质性动摇,且向专用集成电路的转型仍处早期,不太可能完全抵消对英伟达AI芯片日益增长的需求 [4] - 英伟达是AI革命的核心,其硬件需求激增使其成为全球市值最高的公司,市值达4.5万亿美元 [6] - 英伟达的高端GPU推动了AI软件发展,使其获得了出色的毛利率以及销售和收益的爆炸性增长 [6] - 英伟达与微软合作,宣布向Anthropic投资至少50亿美元,并可能将投资额提高至100亿美元 [7] - Anthropic与英伟达关系紧密,联系包括直接使用其处理器、使用基于英伟达硬件的微软和亚马逊服务器,以及获得英伟达的直接投资 [8] 博通 (Broadcom) 的关键作用 - 博通是AI应用连接芯片的领先供应商,这些芯片用于连接多个芯片以构建高性能服务器集群,同时也是AI专用定制芯片的设计者 [9] - 2023年12月,博通透露Anthropic已向其下达价值100亿美元的定制芯片订单,该芯片是与Alphabet合作开发的 [10] - 此外,Anthropic还向博通追加了价值110亿美元的技术硬件订单,包括XPU定制芯片和完整的服务器机架 [10] - 在截至2023年11月2日的上一财年第四季度,博通收入同比增长28%,达到约180亿美元,来自Anthropic的现有订单积压很可能在本财年继续体现在其销售报表中 [13] - Anthropic对微软和亚马逊云计算服务的使用,很可能继续成为博通连接芯片需求的积极催化剂,并且Anthropic正成为博通最大的直接客户之一 [14] - 只要Anthropic继续快速扩张其服务基础并构建其AI基础设施,它就很可能会继续成为博通的主要需求催化剂 [14]
LeCun离职后不止创一份业!押注与大模型不同的路线,加入硅谷初创董事会
量子位· 2026-01-30 12:23
核心观点 - 人工智能领域知名学者Yann LeCun在离开Meta后,同时布局了其初创公司AMI以及新加入的初创公司Logical Intelligence,体现了其技术投资多元化的策略[1][2][3] - Logical Intelligence公司选择了一条与当前主流大语言模型截然不同的技术路线,专注于开发“能量-推理模型”,旨在解决需要强逻辑约束和精确推理的复杂问题,这被认为是实现AGI的另一种可能路径[4][5][14][30] 公司技术与产品 - **技术路线**:Logical Intelligence主推“能量-推理模型”,该模型通过为解决方案根据约束条件评分来验证和优化结果,目标是找到能量最低(最符合逻辑、最稳定)的解[5][14][16][17][18] - **核心论点**: 1. 大语言模型依赖离散token,其作为推理模型存在根本性限制[21] 2. 能量-推理模型克服了基于大语言模型的推理模型固有的主要难题[22] 3. 扩展AI推理需要结合能量-推理模型进行推理,并用大语言模型进行协调(尤其是在自然语言交互方面)[23] - **产品发布**:公司已推出首款工作型能量-推理模型Kona,其参数量低于2亿[30][31] - **产品定位**:Kona的目标是解决现实世界中与语言无关、对幻觉容忍度低的复杂问题,例如优化能源网络分配或实现精密制造自动化[42][43] - **训练数据优势**:能量-推理模型的训练数据可以是任何形式,公司策略是为每个独立业务创建较小的定制模型,利用客户特定的数据,且模型能够从稀疏数据中提取完整信息[44][45][46] - **开源计划**:Kona目前为闭源模型,但公司最终会考虑将部分内容开源[47][48] 性能表现与验证 - **测试场景**:公司选择数独游戏作为性能验证场景,因为这是一个典型的强约束、零容错的逻辑问题,能突出能量模型在有限解空间中的搜索效率[39][40][41] - **性能对比**:在单个Nvidia H100 GPU上运行时,Kona模型解决数独问题的速度显著快于主流大语言模型,用时不到1秒即正确完成,而GPT 5.2、Claude Opus 4.5等模型运行超过100秒仍未得出正确结果[6][34][37] - **测试条件**:对比测试中禁止大语言模型使用编程能力进行“暴力解题”[38] 行业观点与人物动态 - **技术信仰契合**:Yann LeCun长期看好能量模型在智能系统中的潜力,其加入Logical Intelligence被视为与其技术信仰高度契合,是两方一拍即合的结果[25][26][27] - **行业批判**:LeCun曾表示,大语言模型的成功使整个AI领域形成了路径依赖,并称人们已被“大语言模型洗脑”[26] - **CEO观点**:Logical Intelligence的CEO Eve Bodnia认为,当前存在的是“大模型泡沫”而非全面的“AI泡沫”,通往AGI的道路需要不同类型的人工智能各司其职[29][30] - **未来愿景**:公司CEO认为,结合大语言模型、能量-推理模型和世界模型(分别负责自然语言交互、推理任务和在3D空间中行动),是迈向AGI的重要一步[30][33]
2026年美中AI市场竞争态势与DeepSeek的突围-英文版
搜狐财经· 2026-01-23 02:44
全球LLM市场增长与格局 - 全球主要LLM平台月访问量从2024年4月的24亿次增至2025年8月的82亿次,增长超过三倍 [1][21][58] - 美国模型在2025年8月占据全球市场份额的93%,维持压倒性主导地位 [1][21][58] - 中国模型在2025年1月DeepSeek R1推出后访问量激增,两个月内增长460%,全球市场份额从3%跃升至13% [1][21][58] - 截至2025年8月,中国模型在30个国家的渗透率超过10%,在11个国家的市场份额达到20% [1][21] DeepSeek R1的颠覆性影响 - DeepSeek R1于2025年1月推出,其成功并未分流其他中国模型的流量,反而带动了中国LLM整体市场的扩张 [1][21][58] - DeepSeek的崛起导致中国LLM全球市场份额在两个月内从3%提升至13%,此后在2025年8月回落至约6% [21][58][61] - 其他数据源佐证了中国模型的市场地位:Sensor Tower数据显示DeepSeek移动端下载量约为ChatGPT和Gemini总和的十分之一;OpenRouter数据显示截至2025年8月,中国模型处理了其约16%的令牌量 [62] 区域采用模式与驱动因素 - 中国模型的市场份额增长主要集中在俄罗斯、中东、非洲和南美等发展中国家及与中国政治经济联系紧密的国家 [1][63] - 在美国盟友、北约国家及参与美国印太战略的国家,中国模型的增长较为温和 [2][63] - 统计分析显示,DeepSeek R1发布后,一国对中国LLM的采用率与其人均GDP呈显著负相关,表明经济因素在推动中国模型在发展中国家采用方面扮演重要角色 [66][68] 采用驱动因素分析 - **定价**:中国模型API费用仅为美国同类产品的1/6至1/4,但由于约98%的用户使用免费层级,定价差异并非关键驱动因素 [2][21][22] - **多语言支持**:美国模型曾领先,但中国模型快速追赶,例如Qwen模型支持语言从26种扩展至119种,DeepSeek R1支持超100种语言,差距显著缩小 [2][22] - **AI外交**:2015至2025年间,中国发布了401项AI合作公告,覆盖1257个国家/次,远超美国的304项和473个国家/次,但此类政府间活动对普通用户选择影响有限 [2][22] 竞争动态与未来展望 - 美国模型的主导地位源于先发优势和性能优势,但DeepSeek R1的成功证明,当中国模型缩小性能差距后,由于用户切换成本低,市场份额可能快速转移 [2][24] - 中美LLM竞争进入动态博弈阶段,随着技术差距进一步缩小且切换成本维持低位,市场格局可能持续变动 [3][24] - 美国需持续维持性能优势以巩固市场地位,而中国模型凭借性能提升、政策支持及成本优势,已在全球市场站稳脚跟 [3]
人工智能 - OpenAI:为万物构建抽象层-Artificial Intelligence OpenAI Architecting the Abstraction Layer for Everything
2026-01-22 10:44
**涉及的公司与行业** * **公司**: OpenAI [1][8][22] * **行业**: 人工智能 (AI) 行业,特别是大型语言模型 (LLM)、生成式 AI、AI 基础设施与云服务 [1][3][8][40] **核心观点与论据** **市场机遇与公司愿景** * OpenAI 正在构建“一切事物的抽象层”,目标是成为一个全栈、AI 优先的云服务提供商 [1][8] * 公司瞄准一个超过 **3.5 万亿美元** 的总潜在市场,该市场基于 AI 对全球超过 **60 万亿美元** 劳动力市场的效率提升 [1][2][8][66] * 该 TAM 包括: * **企业市场 (1.23 万亿美元)**:涵盖企业 SaaS (**3400 亿美元**)、AI 智能体 (**2870 亿美元**) 和 AI API (**6020 亿美元**) [9][52] * **消费者市场 (2.285 万亿美元)**:涵盖订阅服务 (**1460 亿美元**)、智能体电子商务 (**9000 亿美元**) 和数字广告 (**1.238 万亿美元**) [9][52] * OpenAI 的目标是成为 AI 时代的“操作系统”,从单一模型提供商演变为拥有全栈资产的 AI 优先云超大规模企业 [38][40][46] * 公司设定了激进的内部收入目标:从 2025 年估计的 **130 亿美元** 增长到 2030 年的 **2000 亿美元** (5 年复合年增长率 73%) [66][161][165] **竞争格局** * 竞争异常激烈且立即开始,自 ChatGPT 于 2022 年 11 月发布后, Alphabet、Amazon、Microsoft、Meta 等巨头迅速跟进 [3][12] * 大型竞争对手在融资、人才、数据和分销方面具有优势,但 OpenAI 拥有对 AI 的专注、非上市公司的灵活性以及强大的合作伙伴生态系统 [12][14] * 预计 AI 市场将比搜索、社交和移动等领域更加分散,出现多个领导者,而非单一垄断 [3][14] * 模型性能正在趋同,经济价值从基础模型向上迁移至编排层、工作流集成和分销控制 [117][121] * 开源/开放权重模型 (如 DeepSeek、Z.ai GLM-4.7) 性能快速提升,对专有模型的溢价定价构成压力,并扩大了可服务市场 [136][137][140] * OpenAI 通过发布 gpt-oss 系列开放权重模型作为覆盖策略,旨在扩大其品牌和工具链的普及度 [142][143] **企业业务战略** * 企业 AI 部署正在加速,从试点转向生产,Citi 的 CIO 调查显示,24% 的生成式 AI 用例已进入生产阶段 [4][87][89] * OpenAI 通过 GPT-5.2 等模型进步、订阅服务、API 和智能体,专注于获取 **1.2 万亿美元** 的企业 AI TAM [4] * AI 预计将引发生产力革命,可能推动全球 GDP 增长率从当前的约 **2.7%** 向 **4%** 或更高加速,类似于 1990 年代末的互联网繁荣 [67][69][70] * 企业正在将 IT 预算重新分配至 AI,Citi 的 CIO 调查显示,约 **6%** 的 IT 预算分配给生成式 AI,其中 **70%** 来自新资金,**30%** 来自现有预算重新分配 [72][103][104] * AI 智能体可能接管部分劳动力,在乐观情景下 (GDP 年增长 **7.5%**,AI 处理 **30%** 工作),2030 年 AI 智能体支出可能达到 **6500 亿美元** [99][100] **消费者业务战略** * ChatGPT 拥有超过 **9 亿** 周活跃用户,用户日均使用时长在 2025 年 12 月达到 **17.2 分钟** (同比增长 **30%**),公司目标在 2026 年达到 **15 亿** WAU [1][23][37] * 消费者货币化途径包括订阅、智能体电子商务和数字广告 [5][169] * 付费订阅 TAM 估计为 **1460 亿美元** (基准情景,**9%** 付费转化率),若对标 Spotify 等高转化率同行,可增至近 **7000 亿美元** [58][59] * 智能体电子商务 TAM 估计为 **9000 亿美元**,基于 2030 年全球电商 GMV (不含中国) 达 **4.5 万亿美元**,且 AI 智能体处理 **20%** 购买旅程互动的假设 [61][62] * 数字广告 TAM 估计为 **1.238 万亿美元**,基于 AI 界面捕获用户查询和注意力的份额 [63][64] **财务状况与融资** * OpenAI 已筹集超过 **600 亿美元**,估值从 **1570 亿美元** 跃升至 **5000 亿美元**,并有报道称可能达到 **7500-8300 亿美元** [15][50][54] * 公司已做出总计 **1.4 万亿美元** 的云计算和基础设施采购承诺,涉及 Microsoft、Oracle、NVIDIA、AMD、Broadcom 等供应商 [15][16] * 预计 2025-2029 年累计现金消耗将达 **1150 亿美元**,目标在 2030 年实现自由现金流转正 [162] * 所有权结构已转变为混合公益公司 (PBC),Microsoft 持有 **27%** 股份 (价值 **1350 亿美元**),OpenAI 基金会持有 **26%**,员工持股工具持有 **26%** [26][27][153] **关键风险与挑战** * **执行难度极高**:同时构建和部署新技术,面临巨大的基础设施和资金需求,以及复杂的竞争环境 [20] * **竞争压力**:资源更丰富的竞争对手 (如 Google) 可能选择长期亏损运营,以挤压 OpenAI 的融资能力 [21] * **商品化风险**:基础模型可能商品化,经济价值被拥有工作流表面和编排层的中间商捕获 [11][132][149] * **与 Microsoft 的竞合关系**:Microsoft 是关键的资本、算力和企业客户来源,但合作关系也带来限制和战略摩擦 [20][152][153] * Azure 在 AGI 被独立专家小组验证前,对 OpenAI 的 API 业务保留独家性 [154][156] * 双方存在收入分成协议,Microsoft 目前有权获得 OpenAI 约 **20%** 的毛收入,但预计到本十年末将降至高个位数百分比 [153][160][164] **成功关键因素** * **技术领先**:在生成式 AI 技术的开发和商业化方面保持领先,持续推出更先进的模型 (如 GPT-6) 和新产品至关重要 [18][19][125] * **生态系统建设**:深化与 Microsoft 等合作伙伴的关系,并构建广泛的云服务、基础设施和金融合作伙伴生态系统,形成支持联盟 [1][23] * **分销与用户规模**:利用 ChatGPT 庞大的用户基础 (超 **9 亿** WAU) 和品牌认知度,作为对抗更大平台竞争的优势,并推动新产品和服务 [23][133] **其他重要内容** **公司背景与治理** * OpenAI 最初成立于 2015 年,是一家非营利组织,旨在“以最有可能造福全人类的方式推进数字智能” [22] * 2019 年转变为“封顶盈利”的混合结构,以更好地筹集资金,Microsoft 投资了 **10 亿美元** [25] * 2025 年 10 月重组为 PBC,使公司能够发行传统的、无上限的股权,为大规模资本配置和潜在 IPO 铺平道路 [26][28] * 非营利基金会拥有任命和罢免 PBC 董事会成员的权力,确保对使命的专注 [32] **用户增长与产品** * ChatGPT 用户增长惊人,从发布一周内的 **100 万** 注册用户,到 2025 年 3 月达到 **5 亿** WAU,7 月达到 **7 亿** WAU [33] * 增长由新产品发布 (如 GPT-4, Sora)、地域扩张、企业采用和第三方合作 (如 Apple Intelligence 集成) 推动 [33][34] * 产品栈包括核心 LLM (GPT 系列)、平台服务 (API, Agents SDK, Apps SDK)、应用层产品 (ChatGPT 企业版/团队版) 以及底层基础设施计划 (如 Stargate 数据中心项目) [42][43][44] **合作伙伴生态系统** * 除了 Microsoft,OpenAI 还与 NVIDIA、Oracle、CoreWeave、AMD、Broadcom、SoftBank 等建立了广泛的合作伙伴关系,涉及计算、基础设施和投资 [16][23][157] * Stargate 项目是一个重要的云和基础设施合作伙伴关系,涉及 SoftBank、OpenAI、Oracle 等 [15][17] **行业动态与影响** * AI 讨论在标普 500 公司财报电话会中的提及率从 2022 年第四季度的 **14%** 飙升至 2025 年第三季度的 **62%** [72] * AI 已带来可衡量的生产力收益:代码开发效率提升约 **30%**,AI 智能体处理三分之二的客户支持工单,AI 助手使知识总结生产力提高约 **20%** [72][74] * 企业投资重点从办公楼转向数据中心:美国数据中心支出从 2022 年底的 **143 亿美元** 增至 2025 年 8 月的 **414 亿美元**,而同期办公楼建设从 **711 亿美元** 的高点降至 **449 亿美元** [80][82] * CIO 预计未来 6-12 个月内,生成式 AI 将导致约 **8%** 的裁员,同时生成式 AI 支出预计将增加 **12%** [88][91]
中国人形机器人 - AI 机器人与电力实地调研要点:2026-2027 年通过务实垂直整合推动出货量数倍增长-China Humanoid Robot_ AI Robotics & Power Field Trip takeaways_ Driving multi-fold shipment growth through pragmatic verticalization into 2026-2027E
2026-01-22 10:44
行业与公司 * 涉及的行业是中国的人形机器人行业[1] * 纪要基于对8家私营/未覆盖的AI机器人相关公司的实地调研,包括宇树科技、梅卡曼德、傅利叶智能、逐际动力、优必选、EngineAI、帕西尼和奥比中光,并会见了6位C级管理层[1] 核心观点与论据 **行业战略与商业化路径** * 人形机器人行业正明显转向“专用目的”的商业化部署[2] * 该战略利用当前可实现的任务规划、移动和交互能力,在特定垂直应用中实现更可靠和即时部署[2] * 应用实例包括安防巡逻、公共场所的引导/宾客服务,以及工厂中的抓取放置和简单物品分拣等物流任务[2][8] * 这种务实的方法,结合运动控制的积极进展和快速迭代周期,正在提升机器人执行这些专门任务的能力,从而推动人形机器人公司实现出货量在2026-2027E实现数倍增长的目标[2] **出货量预测与增长驱动** * 预计2025年全球人形机器人出货量可能达到约1.5万-2万台,其中中国厂商贡献了大部分份额,需求来自科学研究、机器人AI训练、教育、娱乐/舞台表演和数据工厂[3] * 领先的人形机器人制造商预计2026-2027年出货量将实现数倍增长,目标设定在数千到数万台[3] * 这一加速增长预期由日益成熟的供应链、优化的成本曲线和不断扩大的应用机会支撑[3] * 实现这些目标预计将受到生产一致性的挑战以及该新兴行业固有的新型多阶段测试协议实施的影响[3] **技术进展** * 运动控制取得积极进展,现场演示显示轮式上半身平台和全双足系统的稳健性和灵活性均显著增强[7] * 有厂商宣称实现了“小脑级”全身控制,其评估标准是机器人能在未测绘地形导航并能进行全身远程控制,而非分割的上半身或下半身控制[7] * 人形平台的产品迭代周期加速至约6-8个月/代[7] * 快速迭代主要归因于80-90%的零部件内部设计能力,这对于确保软硬件无缝集成、在紧凑的研发和测试周期内优化性能“上限”至关重要[7] **人工智能与数据策略** * 目前依赖模拟和合成数据进行预训练,“模拟到现实”的差距仍然是一个挑战,模拟准确率80-90%在现实场景中常降至50%以下[8] * 领先的中国开发商正优先考虑“专用目的”商业部署,以规避高度灵巧操作的复杂性[8] * 短期内,制造商正通过集成阿里巴巴(通义千问)、豆包、腾讯等现有的大语言模型和视觉语言模型栈来标准化其方法[9] * 专有数据引擎被视为开发可部署机器人智能的关键差异化因素,高质量现实数据是连接成熟硬件技术与可扩展实际应用的主要瓶颈[9] * 公司们正在进行一场“数据配方”竞赛,数据输入主要来自三种方式的组合:(1) 遥操作人类或专家演示(控制度高但模仿学习成本高),(2) 模拟(单位样本成本低但真实性不完美),(3) 现实世界视频数据集(数据可用性最高但现实准确率转换可能较差)[9] * 越来越多地听到关于世界模型方法的提及,这可能赋予机器人对其环境的常识,使其超越反应性行为,成为能够进行复杂规划和适应的主动智能体[9][10] **商业模式与定价** * 盈利模式根据目标市场(2C和2B)出现分化[11] * 针对2C应用的公司,主要焦点是提供差异化的功能和增强的用户体验,强调“情感价值”并占领能产生溢价的特定垂直细分市场[12] * 针对2B应用的公司,其定价策略锚定客户的投资回报率,需证明机器人如何提高吞吐量、效率或降低劳动力成本[13] * 例如,优必选表示,在分拣和物流应用中,当机器人达到人类工人约50%的吞吐量时,客户就愿意投资,假设每天运行约10小时,投资回收期约为两年,在劳动力特别紧张的环境中,即使三年回收期也被客户接受[13] 投资建议与供应链观点 * 2026年可能成为关键的“验证销量与预期重置”之年,投资者可能继续根据以下两点评估关键供应链股票:(i) 里程碑式的销量预期(如“百万台机器人”叙事)是否会上调,这很可能由AI泛化能力或有效数据/模型策略的演进速度驱动;(ii) 单个供应链公司的市场份额和单台机器人价值量的演变[14] * 鉴于当前股价已反映了高度的市场乐观情绪和长期预期,建议保持选择性[14] * 在覆盖范围内,对三花智控(H股)、汇川技术、双环传动给予买入评级,对三花智控(A股)、绿的谐波、贝斯特给予中性评级,对鸣志电器给予卖出评级[14][23] 其他重要内容 * 纪要基于高盛中国AI机器人及动力实地调研的收获[1] * 当前人形机器人市场处于早期和新生阶段,确切的出货数字不如整体增长轨迹和技术发展速度关键[3] * 在工业应用中,需要灵巧手或抓具的人形机器人目前仅限于物流任务,如移动箱子和简单物品分拣,这主要归因于AI在应对工厂环境中不可预测的极端情况方面存在局限[8]
R1一周年,DeepSeek Model 1悄然现身
机器之心· 2026-01-21 08:32
模型发布与市场影响 - 2025年1月20日,DeepSeek正式发布DeepSeek-R1模型,开启了新的开源LLM时代[2] - 在Hugging Face发布的《「DeepSeek 时刻」一周年记》博客中,DeepSeek-R1是该平台上获赞最多的模型[2] - 一年后,DeepSeek的新模型在GitHub代码库中悄然现身,一个名为Model1的模型引起广泛关注[4][5] 代码库与项目状态 - Model1出现在DeepSeek的FlashMLA代码库更新中,该代码库名为“FlashMLA: Efficient Multi-head Latent Attention Kernels”[6] - 该项目在GitHub上拥有12k stars,102 watching,938 forks[6] - 项目采用MIT许可证,最近一次更新在7小时前[6] 技术架构分析 - 根据代码分析,Model1是DeepSeek下一代旗舰模型DeepSeek-V4的内部开发代号或首个工程版本[9] - 核心架构回归512维标准,而DeepSeek-V3.2沿用d_qk=576的非对称MLA设计(128维RoPE + 448维Latent)[9] - Model1切换到512维,表明在MLA架构上进行了“标准化”回归,可能是为了更好地匹配Blackwell架构的算力对齐或优化了Latent压缩比例[9] 硬件优化与性能 - 代码库出现大量针对NVIDIA下一代Blackwell GPU的专门优化[9] - 新增SM100接口(FMHACutlassSM100FwdRun),直接指向Blackwell架构的核心指令集优化[9] - 在B200上运行需要CUDA 12.9[9] - 在B200上,尚未完全优化的Sparse MLA算子能达到350 TFlops[10] - 在H800上,Dense MLA的计算吞吐量高达660 TFlops[10] 新特性与算子演进 - 引入“Token-level Sparse MLA”,这是Model1相比V3系列最显著的算子演进[11] - 测试脚本中同时出现test_flash_mla_sparse_decoding.py和test_flash_mla_dense_decoding.py,支持Sparse与Dense并行[12] - 采用FP8 KV Cache混合精度,Sparse算子使用FP8存储KV Cache,但在计算矩阵乘法时使用bfloat16以保证精度[12] - 引入新机制:Value Vector Position Awareness与Engram机制[11] - VVPA可能解决传统MLA在长文本下位置信息衰减的问题[12] - Engram机制被认为是公司在分布式存储或KV压缩上的新突破,用于配合Model1的高吞吐需求[12] 模型定位与命名推断 - 在代码中,MODEL1的定位是一个与V32并列且独立的分支,说明它不是V3系列的补丁,而是一个采用了不同架构参数的全新模型[11] - 按照公司的命名惯例,在V3.2之后的旗舰级架构跨越,逻辑上即为V4[11]
研报 | 预估2026年全球AI服务器出货年增逾28%,ASIC类别占比扩大
TrendForce集邦· 2026-01-20 17:01
全球服务器市场增长预测 - 2026年全球服务器(含AI服务器)出货量预计年增12.8%,成长幅度较2025年扩大 [2] - 2026年全球AI服务器出货量预计年增28%以上 [2][5] AI服务器市场驱动因素 - 北美云端服务供应商持续加强对AI基础设施投资,是主要增长动力 [2] - 2025年下半年起,AI Agents、LLaMA模型应用、Copilot升级等AI推理服务持续发展,云端服务供应商积极转向推理服务以发展变现及获利模式 [6] - 2026年AI服务器出货动能主要来自北美云端服务供应商、各地政府主权云项目,以及大型云端服务供应商加快自有ASIC研发、边缘AI推理方案的助力 [7] 通用型服务器需求变化 - AI推理服务产生的庞大运算负荷,将通用型服务器带入替换与扩张周期 [2] - 谷歌和微软将最积极提升通用型服务器采购量,以应对每日需实体提供的Copilot、Gemini推理流量需求 [5][7] - 北美五大云端服务供应商2026年的资本支出总额年增率高达40%,部分用于汰换2019至2021年云端投资热潮购置的通用型服务器 [7] AI服务器芯片技术趋势 - 从使用的AI芯片分析,预估GPU占69.7%,仍为最大宗 [7] - 搭载英伟达GB300的机种将成为出货主流,VR200则于下半年后逐步放量 [7] - 预计2026年ASIC AI服务器的出货占比将提升至27.8%,为2023年以来最高,出货增速也超越GPU AI服务器 [5][8] - 谷歌对自研ASIC的投资力道明显强于多数云端服务供应商,将成为ASIC市场领头羊,其TPU除了自用于Google Cloud Platform云端服务基础设施外,也积极对外销售于Anthropic等业者 [8]
推理之父走了,OpenAI七年元老离职:有些研究这里没法做
36氪· 2026-01-06 15:45
核心观点 - OpenAI研发副总裁、核心技术奠基人Jerry Tworek于2026年初离职,其离职理由“想做在OpenAI做不了的研究”引发对公司研究方向与内部文化的深度担忧 [1][6][7] - 此次离职是OpenAI核心人才持续流失的最新案例,此前已有多位联合创始人、研究副总裁、安全负责人等关键人物因理念不合、商业化压力或安全分歧而离开 [1][8][10][11][13] - 公司正面临从理想主义研究机构向商业化巨头转型所带来的内部撕裂,核心矛盾集中在商业化压力与前沿研究/安全优先的理念冲突上,这可能动摇其最核心的资产——人才基础 [14][20][21][23] 关键人物离职详情 - **Jerry Tworek离职**:作为OpenAI七年老兵、研发副总裁,其离职标志着一位“开国功臣”级别的人物离开 [1][6] - **Jerry Tworek的技术贡献**:他是公司两大核心技术路线的奠基人和掌舵者,具体贡献包括:1) 作为“推理模型”之父,是o1/o3系列项目的团队负责人;2) 作为“编程代码”之父,是Codex模型的核心研究员;3) 是GPT-4解决复杂编程能力的关键贡献者;4) 在2025年主导了GPT-5的部署及ChatGPT Agent的研发;5) 其论文是AI解决数学难题的关键研究,在“代码生成”和“强化学习(RLHF)”领域拥有极高的学术引用数 [2] - **历史核心人才流失**:近年来离职的关键人物包括:前研究副总裁Dario Amodei(2021年出走创立竞争对手Anthropic及Claude)、联合创始人兼首席科学家Ilya Sutskever(政变后离开)、强化学习大牛及ChatGPT核心技术推手John Schulman、超级对齐团队负责人Jan Leike(因安全理念不合离职),以及产品、政策、安全等多条线的副总裁级别人物 [8][10][11][13] 公司内部环境与挑战 - **商业化转型的冲击**:公司从确保AGI造福全人类的非营利研究组织,在ChatGPT爆火和微软百亿美金注入后,转变为需要不断推出产品、追求商业回报的赚钱机器,这导致研究文化发生变化 [14] - **研究方向与安全优先级的变化**:部分核心研究人员感到工作重心转向赶产品发布截止日期、卷产品化功能以及讨好投资人和用户,与最初的研究乌托邦理想相悖 [14] - **安全问题的分歧**:前安全团队负责人Jan Leike因公司“把安全放在了次要位置”而“摔门而出”,凸显了在AI安全治理上的内部撕裂 [14] - **领导层与团队稳定性**:Sam Altman在2023年底权力斗争后虽巩固了控制权,但导致反对其的董事被清洗,并与多位元老级研究员关系破裂,权力核心变得“越来越孤独” [15][17][23] 行业竞争格局 - **竞争对手的壮大**:Anthropic(Claude)在编程等领域紧逼OpenAI,谷歌的Gemini在多模态领域不断迭代,Meta、xAI以及开源势力也在后面穷追猛打,行业竞争日益激烈 [17] - **人才流向竞争对手**:OpenAI流失的核心人才(如Dario Amodei)直接加强了竞争对手的实力 [8][17] 公司现状与未来展望 - **冰火两重天的人才流动**:在核心老将持续流失的同时,公司也在吸引新鲜血液,例如AI图像搜索引擎Lexica的创始人Sharif Shameem近期宣布加入,认为OpenAI是“改变世界的最佳舞台” [18] - **市场观点的分歧**:看多观点认为公司拥有GPT系列的技术领先、微软的坚定盟友支持、增长的用户规模与商业收入以及雄厚的技术人才储备;看空观点则指出核心人才持续流失、安全问题悬而未决、商业化透支技术信用以及竞争对手日益逼近等风险 [19] - **根本性挑战**:文章指出,科技公司最核心的资产是“人”,当最聪明的大脑开始“用脚投票”,创始元老纷纷离去,这本身就是一个危险的信号,可能预示着更深层次的危机 [20][21][23]
看完才发现,AI 早已悄悄改变顶尖程序员的工作方式!Flask 之父:传统代码协作工具已经 Out 了
程序员的那些事· 2026-01-02 14:00
文章核心观点 - 资深开发者通过一整年深度使用AI编程工具,工作模式发生根本性转变,从亲自编码转变为管理和指导“虚拟程序员实习生”[6] - 2025年被视作“智能体元年”,以Claude Code为代表的工具结合了大型语言模型与工具执行功能,改变了编程范式[9][10] - 开发者与AI协作的关系引发复杂思考,包括无意识的拟人化倾向以及工具命名的伦理争议[12][13] - 现有的软件开发工具(如版本控制系统、代码审核平台)已无法适应AI生成代码的新工作流程,亟需创新[22][24] - AI编程的普及带来了新的行业挑战,如代码质量审核、开源项目贡献规范以及对外包与自研趋势的潜在影响[18][26][27] 不一样的2025年:工作模式的根本转变 - 开发者彻底改变了编程方式,从主要使用Cursor转变为几乎完全依赖Claude Code,无需亲手敲键盘[6] - 工作角色从编码者转变为工程负责人,管理一个“虚拟程序员实习生”[6] - 因深入探索AI领域,年度博客文章产出大幅增加,全年发布36篇文章,约占其自2007年开通博客以来总内容的18%[7] 智能体元年:工具生态与范式确立 - 核心工具体验:Amp被类比为高端精致的苹果或保时捷,Claude Code是经济实惠的大众,Pi则是黑客的开源首选[14] - Claude Code开创的模式被视为当前最顶尖的,其结合大型语言模型与工具执行的能力令人惊叹[9][10] - 文本用户界面强势回归,开发者常用的Amp、Claude Code和Pi均为命令行操作工具[9] - 大型语言模型的功能从年初的代码生成扩展到日常琐事处理和生活规划,预计2026年将涌现大量消费级AI产品[10] 我与机器:协作关系的困惑与思考 - 开发者容易对常用工具产生“拟社会关系”,这种感觉既奇怪又令人不安[12] - 尽管努力将模型视为字符处理工具,但发现此简化观点已站不住脚,系统已具备某些人的特质,但将其等同于人类是错误的[12] - 反对使用“智能体”一词,因为能动性和责任应属于人类,但缺乏更贴切的术语来描述这些机器[12] - 与坚决抵制AI系统的人共事时,会感到尴尬,行业普遍反对给机器赋予人格[13] 众说纷纭:主观感受与行业共识的动摇 - 关于AI工具的讨论,焦点常集中在使用“感觉”而非纯粹技术上,这挑战了半个世纪以来的软件工程经验[16] - 许多行业共识经不起推敲,但难以证伪,例如开发者认为MCP用起来不顺手,却只能以“对我不适用”作为理由[16] - 模型选择具有高度主观性,例如有人从Claude转向Codex并认为好用,而本文开发者则偏爱Claude,只因“感觉对了”[16] - 需注意网络观点的利益倾向,许多言论来自相关产品的投资者或收费推广博主,可能影响其客观性[16] 外包还是自研:AI对开发模式的影响 - 当前趋势是核心服务外包给专业公司,如使用Stainless、Fern、Mintlify、Clerk等现成服务,提高了用户体验门槛[18] - AI编程工具提供了自研能力,例如开发者让Claude制作了支持Python和TypeScript的SDK生成器,过程并不困难[18] - AI可能鼓励减少对第三方工具的依赖,转向自己动手开发,这与当前普遍的外包趋势形成对比,未来方向尚不确定[18] 心得体会与未来期许:亟待创新的领域 - **新型版本控制系统**:传统工具如Git和GitHub的PR模式无法满足需求,需要能记录每次修改对应提示词及失败尝试的系统,失败经验对机器至关重要[22][23] - **新型代码审核模式**:现有工具(如GitHub)的严格角色权限与AI工作模式不兼容,审核功能应成为版本控制系统的一部分,且需解决本地审核导致的团队协作不透明问题[24] - **新型可观测性方案**:大型语言模型降低了eBPF程序开发和复杂SQL查询的门槛,使得过去因操作复杂而未能落地的可观测性想法有望重生,该领域预计将迎来大量创新[25] - **应对冗余与混乱**:AI生成代码导致开源项目中未经充分审核的贡献增多,对传统开发者构成冒犯,需要行业建立新规范来界定智能体代码库中的合规行为,而非仅靠贡献指南[27][28]