人工智能推理
搜索文档
刚刚,又一位xAI华人离职,曾和马斯克并排坐发Grok 3
36氪· 2026-02-10 17:55
核心事件 - 马斯克旗下AI公司xAI的联合创始人吴宇怀宣布已从公司离职 [2] 离职人员背景 - 吴宇怀出生于1995年 拥有深厚的学术与行业背景 先后毕业于加拿大纽布伦斯威克大学和多伦多大学 师从“AI教父”杰弗里·辛顿获得博士学位 并在斯坦福大学完成博士后研究 [3] - 其工作经历包括在谷歌DeepMind AlphaGo团队和OpenAI实习 博士后在斯坦福期间加入谷歌工作至2023年 随后作为11位联合创始人之一共同创办了xAI [3] - 吴宇怀的主要研究方向是打造具备推理能力的机器 曾主导或深度参与自训练增强推理模型STAR、定理证明器Alpha Geometry及语言模型Minerva等项目 目标是创造自动化AI“数学家” [4] - 他在xAI的核心任务是将数学推理领域的积累应用于Grok模型开发 Grok 3在数学和逻辑推理上的表现是其带领团队取得的成果 [4] - 吴宇怀是xAI团队中5位华人创始成员之一 在2025年2月18日的Grok 3发布会上 他与另一位华人联创Jimmy Ba一同坐在C位 [6] 公司团队动态 - 自2024年初至今 xAI已有多位核心联合创始人相继离职 包括Kyle Kosic(2024年4月)、Christian Szegedy(2025年2月)和Igor Babuschkin(2025年8月) [8] - 就在上个月 Grok的核心架构师之一、华人联创杨格宣布因病离职 转为非正式顾问 其透露被诊断出患有莱姆病 可能因长期高强度工作透支身体导致症状显现 [8][9] - 在短短一年多时间里 这支由马斯克组建的创始“梦之队”已有近半创始成员离开 其中一个月内连续折损两位华人联创 [10] 事件背景与市场关注点 - 吴宇怀的离职时间点耐人寻味 在马斯克旗下SpaceX于2月3日正式官宣收购xAI仅一周后宣布 引发外界对其离职是否与收购有关的猜测 [10] - 连续流失创始成员 可能引发外界对xAI团队稳定性和未来发展的信任担忧 [10]
速递|a16z全程跟进:vLLM之父创AI推理Inferact,顶级投资阵容融资,估值达8亿美元
搜狐财经· 2026-01-23 12:46
公司融资与估值 - AI初创企业Inferact完成1.5亿美元种子轮融资,公司估值达到8亿美元 [2] - 本轮融资由安德森·霍洛维茨基金和光速创投领投,红杉资本、Altitude资本、红点创投及真格基金参与投资 [2] - 公司成立于2025年11月,并于近期正式对外公开 [3] 公司业务与技术核心 - Inferact专注于人工智能推理阶段,即AI模型完成训练后能够开始回答问题、解决任务的环节 [2] - 公司技术核心围绕开源项目vLLM构建,该项目于2023年发布,旨在帮助企业将AI模型高效部署在数据中心硬件上 [2] - vLLM项目最初由加州大学伯克利分校启动,现由PyTorch基金会监管,已吸引了来自AI产业数千名开发者的贡献 [2] - 公司首要任务是继续将vLLM作为独立的开源项目进行支持,所有改进都将回馈社区 [4] - 第二个目标是开发独立的商业产品,帮助企业更高效地在各类硬件上运行AI模型 [4] 行业背景与市场机遇 - AI行业面临的最大挑战将不再是构建新模型,而是如何经济高效且稳定可靠地运行现有模型 [2] - 过去企业需要等待数年才能迎来新模型发布,因为训练系统缓慢且昂贵,但随着现有模型足够强大,情况已发生改变 [3] - 开发者创建的AI产品必须持续与模型进行通信,这推高了成本并给系统带来压力,推理环节正成为瓶颈,且问题在未来几年可能愈发严峻 [3][4] - 此次大规模的种子轮融资反映出市场机遇的规模,以及即使微小的效率提升也能对成本产生显著影响 [4] 团队背景与投资者关系 - Inferact由首席执行官Simon Mo领导,他是vLLM项目的原始维护者之一 [3] - 安德森·霍洛维茨基金会参与可追溯至vLLM项目的早期阶段,vLLM在2023年成为其“AI开源资助计划”的首个受助项目 [3] - 在Inferact成立之前,安德森·霍洛维茨基金会还主办了该项目的首场社区聚会,为建立紧密联系奠定了早期基础 [3] 技术应用与市场认可 - 亚马逊公司不仅其云业务,连购物应用程序也依赖vLLM软件来运行内部人工智能系统,这证明了vLLM应用的广泛程度 [5]
速递|a16z全程跟进:vLLM之父创AI推理Inferact,顶级投资阵容融资,估值达8亿美元
Z Potentials· 2026-01-23 12:13
公司融资与估值 - AI初创企业Inferact已完成1.5亿美元种子轮融资,公司估值达8亿美元 [2] - 本轮融资由安德森·霍洛维茨基金和光速创投领投,红杉资本、Altitude资本、红点创投及真格基金参与投资 [2] - 公司成立于2025年11月,并于近期正式对外公开 [3] 公司背景与技术核心 - Inferact由vLLM项目的原始维护者之一Simon Mo领导 [3] - 公司技术核心围绕开源项目vLLM构建,该项目于2023年发布,旨在帮助企业将AI模型高效部署在数据中心硬件上 [2] - vLLM最初由加州大学伯克利分校启动,现由PyTorch基金会监管,已吸引了来自AI产业数千名开发者的贡献 [2] - 公司将自身创立渊源与伯克利分校孵化的其他成功软件项目(如Apache Spark和Ray)相类比 [3] 行业趋势与公司定位 - 公司专注于人工智能推理阶段,即AI模型完成训练后能够开始回答问题、解决任务的环节 [2] - 公司预判,未来AI行业面临的最大挑战将不再是构建新模型,而是如何经济高效且稳定可靠地运行现有模型 [2] - 投资者认为其兴趣反映了AI行业更广泛的转变:过去企业需等待数年迎来新模型发布,而现有模型已足够强大,开发者无需等待重大升级即可使用 [3] - 推理环节正成为瓶颈,因为开发者创建的AI产品必须持续与模型进行通信,这推高了成本并给系统带来压力,且该问题在未来几年可能会愈发严峻 [4] 公司战略与市场机遇 - 公司的首要任务是继续将vLLM作为独立的开源项目进行支持,所有改进都将回馈社区 [4] - 第二个目标是开发独立的商业产品,帮助企业更高效地在各类硬件上运行AI模型 [4] - 大规模的种子轮融资反映出市场机遇的规模,以及即使微小的效率提升也能对成本产生的显著影响 [4] - 公司并非试图取代或限制开源项目,而是旨在建立一项能够支持并拓展该项目的业务 [4] - vLLM应用广泛,例如亚马逊公司不仅其云业务,连购物应用程序也依赖该软件来运行内部人工智能系统 [4] 投资者关系 - 安德森·霍洛维茨基金会参与可追溯至vLLM项目的早期阶段,vLLM在2023年成为其“AI开源资助计划”的首个受助项目 [3] - 在Inferact成立之前,安德森·霍洛维茨基金会还主办了该项目的首场社区聚会,为与团队建立紧密联系奠定了早期基础 [3]
SambaNova收购,陷入僵局
半导体行业观察· 2026-01-22 12:05
文章核心观点 - 人工智能芯片初创公司SambaNova Systems在与英特尔的收购谈判陷入僵局后,正寻求从科技公司和半导体制造商处筹集3亿至5亿美元的新资金 [1] - 英特尔此前曾讨论以约16亿美元(含债务)的估值收购SambaNova,但谈判破裂,目前仍在考虑是否追加投资 [1] - 英特尔新任首席执行官陈立武(也是SambaNova的董事长)的战略重心与SambaNova的专长高度重合,都聚焦于人工智能推理,这为双方未来的潜在合作或交易奠定了基础 [3][4][5][6] SambaNova的融资与估值动态 - SambaNova正寻求筹集3亿至5亿美元新资金 [1] - 公司迄今已筹集11.4亿美元资金,在2021年一轮融资中估值达到51亿美元 [6] - 但据彭博社报道,任何潜在交易对SambaNova的估值都可能低于其2021年融资轮中获得的50亿美元估值 [6] - 公司的重要投资者包括:软银愿景基金(2021年投资6.76亿美元)、Walden International(领投2018年5600万美元A轮融资)、英特尔资本、贝莱德、SK Telecom等 [5] SambaNova的业务与技术专长 - 公司专注于人工智能硬件和全栈软件解决方案,业务重心已从训练转向推理设计 [3] - 核心技术采用可重构数据流单元芯片,与英伟达GPU不同,其拥有丰富的片上内存,并将整个神经网络图直接映射到硬件,避免了内存移动开销,提高了效率,尤其适合大规模推理工作负载 [3] - 基于其第四代RDU处理器SN40L,公司构建了针对运行已训练AI模型优化的系统,产品包括:SambaRack(基于多个含16个SN40L RDU的模块构建)、SambaCloud(支持DeepSeek、Llama和Qwen等推理模型)、SambaManaged(完全托管的推理云平台) [4] - 为进行业务重心调整,公司曾裁员77人,约占其500名员工总数的15% [3] 英特尔的战略动向与AI布局 - 英特尔正在调整其人工智能路线图,计划重返人工智能市场 [2] - 公司取消了原定今年发布的Falcon Shores人工智能加速芯片计划,转而专注于开发“机架级系统解决方案” [2] - 作为回归计划的一部分,英特尔发布了代号为“Crescent Island”的160GB节能型GPU,专为风冷企业服务器上的推理工作负载设计,预计2026年下半年出货 [2] - 英特尔首席技术官Sachin Katti强调了人工智能应用中从静态训练向实时推理的转型,以及针对特定任务定制异构系统的必要性 [3] - 英特尔此前旨在提供更高性价比GPU以对抗英伟达的策略未奏效,而AMD已迅速占据追赶者位置 [3] - 通过收购SambaNova,英特尔可以获得一家专注于人工智能推理的芯片、系统和云开发商,这与英特尔当前以推理为核心的人工智能路线图高度契合 [4] - 公司近期“不进行收购”的战略在首席执行官陈立武上任后受到质疑,可能发生转变 [5] 英特尔与SambaNova的关联及潜在交易 - 英特尔与SambaNova的收购谈判曾对这家人工智能初创公司给出约16亿美元(含债务)的估值 [1] - 英特尔首席执行官陈立武同时担任SambaNova的董事长,其风险投资公司Walden International是SambaNova的创始投资者之一,这引发了一些业内人士关于利益冲突的讨论 [1][5] - 陈立武在就任英特尔首席执行官后表示,目标是开发全栈式人工智能解决方案,提高准确性和能效,并推动以推理模型、智能体人工智能和物理人工智能为核心的下一代计算 [6] - 这表明陈立武非常了解SambaNova,且其战略规划与SambaNova的业务专长一致,预示着英特尔在人工智能领域的下一步战略可能与之相关 [6]
速递|AI推理服务商Baseten Labs再融3亿美元,英伟达、Alphabet联手下注
Z Potentials· 2026-01-21 13:52
公司融资与估值 - 人工智能初创公司Baseten Labs以50亿美元的估值筹集了3亿美元资金 [3] - 此轮融资使公司估值较不到六个月前的上一轮融资翻了一倍多,上一轮融资于去年9月以21.5亿美元的估值筹集了1.5亿美元 [3] 融资轮次详情 - 本轮3亿美元的新融资由风险投资公司IVP与谷歌母公司Alphabet的增长投资部门CapitalG共同领投 [3] - 英伟达公司也参与了此轮融资,投资金额达1.5亿美元 [3] 公司业务聚焦 - 公司专注于人工智能推理,即AI系统训练完成后运行它们的过程 [3]
英伟达向人工智能推理初创公司Baseten投资1.5亿美元
新浪财经· 2026-01-21 05:54
公司融资与估值 - 人工智能推理初创公司Baseten完成3亿美元融资 [1] - 公司本轮融资后估值达到50亿美元 [1] - 当前估值几乎是上一轮估值的两倍 [1] 投资方构成 - 本轮融资由风险投资公司IVP和Alphabet独立增长基金CapitalG领投 [1] - 芯片巨头英伟达参与投资 [1] - 英伟达作为交易的一部分向Baseten注资1.5亿美元 [1] 行业趋势与战略布局 - 此交易凸显了英伟达在人工智能推理领域对初创公司的积极布局 [1] - 行业关注点正从训练模型转向大规模运行和推理(即AI模型根据输入生成输出) [1] - 英伟达正加大对人工智能推理相关初创公司的投资力度 [1] - 英伟达在向自身AI芯片客户投资的同时,也继续投资外部初创公司 [1]
这项技术,颠覆芯片堆叠
半导体行业观察· 2026-01-09 09:53
文章核心观点 麻省理工学院的研究团队提出并演示了一种创新的芯片制造方法,通过在传统CMOS芯片的后端工艺(BEOL)区域低温堆叠有源器件层,将逻辑晶体管和存储器晶体管垂直集成,从而显著减少数据在逻辑与内存之间传输的能耗和时间,为人工智能推理、深度学习等以数据为中心的计算工作负载提供高能效解决方案 [1][6][8] 技术原理与架构创新 - 研究团队颠覆传统制造顺序,在芯片后端工艺(BEOL,传统上用于布线的区域)添加有源晶体管层和存储元件,避免了高温前端工艺对底层已完成电路的损坏 [1][2][10] - 该技术创造了一个垂直集成的器件堆叠结构,缩短了计算、嵌入式存储器和互连之间的物理路径,从而减少了传统布局中因数据移动造成的能量浪费 [2][6] - 该方法并非取代先进节点的硅器件,而是在现有芯片主要用于布线的区域添加新的功能层,以提高集成密度和能效 [6][10] 关键材料与工艺突破 - 使用非晶氧化铟作为BEOL晶体管的有源沟道层,因其独特性质,可在约150°C的低温下生长极薄的氧化铟层,不会损坏下方电路 [2][10] - 氧化铟薄膜厚度仅约2纳米,团队通过优化制造工艺,最大限度地减少了材料缺陷(氧空位),使晶体管能够快速且干净地切换,降低了开关所需的额外能量 [4][11] - 集成铁电铪锆氧化物(HZO)层以实现存储器功能,这是一种CMOS兼容的实用材料选择 [4][7] 器件性能与成果 - 制造的BEOL逻辑晶体管开关迅速且缺陷少,降低了开关能耗 [4][11] - 集成的存储器BEOL晶体管尺寸约为20纳米,开关速度达到10纳秒(达到测量极限),且工作电压低于同类器件,功耗更低 [4][11] - 该研究提供了一个可堆叠平台,并完成了从独立器件到电路级集成所需的性能建模(与滑铁卢大学合作) [6][12] 应用前景与影响 - 该技术最直接的受益者是内存流量占主导地位的工作负载,包括人工智能推理、深度学习以及需要反复传输激活值和权重的计算机视觉任务 [6][9] - BEOL中的存储晶体管能够实现存储和计算之间更紧密的耦合,支持内存内和近内存计算方案 [7] - 铁电器件缩小到纳米级为研究单个铁电单元的物理特性提供了平台,可能影响未来存储和计算单元的设计 [7][11] - 该技术有望帮助减少生成式人工智能、深度学习等高要求应用日益增长的计算电力消耗 [9] 后续计划 - 短期计划是将后端存储晶体管集成到单个电路中 [7][12] - 未来将致力于提高晶体管性能,并进一步优化对铁电层特性的控制 [7][12]
大佬就是大佬!黄仁勋一句话引爆市场,牛股飙涨1080%,这类股集体闪崩
新浪财经· 2026-01-07 13:37
文章核心观点 - 英伟达首席执行官黄仁勋在CES 2026的演讲对美股市场产生显著影响 其关于人工智能存储需求的言论推动存储类股票集体大涨 而其关于下一代芯片冷却技术的言论则引发数据中心冷却类股票下跌 [1][4][14] 存储类股票市场反应 - 闪迪股价在周二飙升近28% 报349.63美元/股 创历史新高 自去年2月以来已暴涨10倍 总市值达512.4亿美元 [2] - 闪迪在2026年前三个交易日涨幅超过47% 自去年4月22日触底以来累计飙升1080% [4] - 西部数据股价上涨16.77% 报219.38美元/股 总市值750.1亿美元 自去年4月以来涨幅近700% [7] - 希捷科技股价上涨14% 报330.42美元/股 总市值705.6亿美元 自去年4月以来涨幅超过400% [7] - 美光科技股价上涨10% 报343.43美元/股 总市值3865亿美元 自去年4月以来涨幅超过400% [7] - 闪迪、西部数据、希捷科技和美光科技在周二均创下历史新高 其中闪迪是标普500指数中表现最佳的股票 [6] 存储需求增长驱动因素 - 黄仁勋强调人工智能相关的存储需求已超过现有基础设施能力 待处理数据量“现在实在是太大了” [4] - 黄仁勋称人工智能存储是一个“完全未被开发的市场” 很可能成为全球最大的存储市场 将承载全球人工智能的工作记忆 [4] - 彭博行业研究指出 人工智能训练和推理需求增长导致内存供应紧张和价格飙升 从而推高数字存储股票 [12] - 三星电子和SK海力士计划在2026年第一季度将服务器DRAM价格较去年第四季度上涨60%至70% [12] - 美国银行分析师认为 闪迪等存储设备公司是2026年“人工智能推理和边缘人工智能”发展趋势的“主要受益者” [14] - 企业将因训练、分析和合规等目的保留更多数据 存储需求将“同步飙升” 无人机、监控、车辆和体育科技等领域需求不断增长 [14] - 人工智能投资主题正从模型训练引发的资本支出 转向以人工智能推理为主导的下一波硬件支出浪潮 [14] 数据中心冷却类股票市场反应 - 黄仁勋的演讲引发对数据中心冷却产品需求的担忧 导致相关股票下跌 [14] - 江森自控国际公司股价下跌6.24% 盘中最高跌超10% 创下7月以来最大单日跌幅 总市值696.4亿美元 [15] - 摩丁制造公司股价收跌7.46% 盘中最高跌超20% 总市值68.43亿美元 [15] - 特灵科技公司股价下跌2.52% 盘中最高跌超10% 总市值845亿美元 [15] - Vertiv Holdings Co 股价周二盘中跌超6% 但收盘上涨0.57% 总市值668.9亿美元 [21] 冷却技术变革与行业观点 - 黄仁勋表示 使用特殊技术可为搭载英伟达下一代Rubin芯片的机架降温 而无需使用水冷机组 [18] - 彭博行业研究指出 水冷机组是江森自控和特灵等公司为数据中心提供的“主要”设备 [18] - 贝尔德分析师认为 该言论引发了对冷水机组在数据中心长期定位的疑问 尤其是在液冷技术日益普及的背景下 [19] - 花旗分析师认为投资者“过度”抛售了冷却系统相关股票 冷却系统制造商与芯片商及数据中心运营商联系密切 其风险可控 [21] - 巴克莱银行分析师指出 Vertiv在液冷领域拥有“强大地位” 可能受益于该技术发展 但其冷水机业务可能受影响 [21] - 尽管英伟达言论影响重大 但花旗分析师认为冷却技术的快速发展并未让相关公司感到意外 [21]
谷歌AI论文趋势:推理为王
华福证券· 2025-12-31 10:43
行业投资评级 - 传媒行业评级为“强于大市”(维持)[7] 报告核心观点 - 报告核心观点是看好AI推理端算力的爆发,认为通过专注AI推理过程的算法优化并给予大模型充足的推理算力,能使模型表现变得更快、更好、更有效[6] - 报告认为谷歌的动向揭示了行业新趋势:从训练推理模型转向关注推理过程本身,推理过程正成为获取智能、处理复杂信息的关键环节,算力价值从后台训练转移到了前台实时推理[5] 行业动态跟踪:谷歌前沿产品进展 - 2025年12月4日,谷歌向Google AI Ultra订阅用户推送Gemini 3 Deep Think模式,运用并行思维技术推动思维能力前沿[3] - 其上一代模型Gemini2.5 Deep Think鼓励模型利用扩展推理路径,使深度思维随时间推移成为更优秀、更直观的问题解决者[3] - 通过延长推理或思考时间,让AI有更多时间去探索不同假设,并对复杂问题提出创造性解决方案[3] 行业技术趋势:推理算法进步 - 谷歌论文《Titans: Learning to Memorize at Test Time》提出新的神经长时记忆模块,能学习记忆历史上下文,并运用遥远历史信息协助注意力机制聚焦当前上下文[4] - 该神经记忆模块兼具快速并行化训练与高效推理优势,注意力机制被视为短期记忆,而神经记忆则发挥长期、更持久记忆的作用[4] - 论文提出同时具备注意力机制和元上下文记忆的结构“Titans”,能在测试时学习记忆[4] - 谷歌论文《Nested Learning: The Illusion of Deep Learning Architecture》提出全新机器学习范式“嵌套学习NL”,模仿人脑认知机制路径[5] - “嵌套学习”将短期内记忆快速更新、长期记忆缓慢沉淀的过程逻辑数字化,每个层级拥有独立上下文流和更新频率[5] - 从嵌套学习视角提出连续记忆系统CMS,每次更新仅包含少量参数,减少算力需求,使大语言模型能在不断学习新技能的同时不遗忘旧技能,计算效率将大幅提升[5] - 谷歌团队试图打破现有大模型训练即固化的静态模式,让学习不再仅限于训练过程,而是发生在推理现场[5] - 现有Transformer模型通过Attention机制处理长文本计算成本高,且本质上是短期记忆,一旦超出上下文窗口信息就被丢弃[5]
伯恩斯坦:英伟达与Groq交易具有战略意义
新浪财经· 2025-12-29 20:39
分析师评级与目标价 - 伯恩斯坦分析师Stacy A Rasgon重申对英伟达的跑赢大盘评级,并维持275美元的目标股价 [1] 公司与Groq的合作协议 - 英伟达与人工智能芯片初创企业Groq达成一项价值200亿美元的合作协议,后被证实为Groq推理技术的非独家授权协议 [1] - Groq核心管理团队将加盟英伟达,而Groq本身将在新任首席执行官西蒙・爱德华兹的领导下保持独立运营,同时继续开展其云端业务 [1] 合作战略意义与市场影响 - 此项合作具有战略意义,能够巩固英伟达在人工智能推理领域的市场地位 [1] - 相较于模型训练领域,人工智能推理市场的竞争更为激烈 [1] - 随着推理需求的持续增长,此举将进一步强化英伟达的行业龙头地位 [1]