Workflow
Meta Platforms(META)
icon
搜索文档
放弃元宇宙?Meta大幅削减VR业务岗位,全力转向AI
证券时报网· 2026-01-14 21:14
元宇宙业务战略收缩与调整 - 公司启动对Reality Labs部门内虚拟现实相关业务的裁员计划,关闭多家VR内容开发工作室,裁员涉及约10%的硬件部门及Horizon Worlds员工,总人数超1000人 [2] - 被关闭的工作室包括Armature Studio、Twisted Pixel、Sanzaru以及Oculus Studios Central Technology,2023年以4亿美元收购的VR健身应用Supernatural已进入维护模式 [2] - Horizon Worlds月活跃用户从未超过数十万人,远不及Roblox的1.5亿日活用户,公司正积极吸引Roblox开发者并专注于为Horizon Worlds打造移动端体验 [3] - 公司于2025年2月推出5000万美元的创作者基金,鼓励开发者尤其侧重为Horizon Worlds移动端打造游戏体验,并计划让Meta和Instagram用户无缝接入该平台 [3] - 自2020年末以来,Reality Labs部门累计亏损已超700亿美元,2025年最新季度财报显示该部门当季营收4.7亿美元,亏损却高达44亿美元 [4] - 公司开始引导第三方开发者打造适合儿童的简约游戏,效仿Roblox和Minecraft,瞄准13至24岁及更年轻的用户群体 [4] - 公司在元宇宙的最大竞争对手罗布乐思股价大幅上涨10%,显示投资者对竞争终局的态度 [5] 人工智能成为新战略焦点 - 公司战略从元宇宙大幅收缩,转而全力聚焦人工智能业务 [2] - 2024年6月,公司以143亿美元收购Scale AI,并聘请其创始人主导AI战略 [6] - 2025年10月,主导元宇宙业务4年的维沙尔·沙阿被任命为AI产品副总裁 [6] - 公司将2025年资本支出范围上调至700亿至720亿美元,并预告2026年投入将显著扩大 [7] - 公司正式推出名为Meta Compute的新基础设施部门,专门负责监督其激进的人工智能数据中心建设计划 [7] - 公司计划在2030年末前建设数十千兆瓦的数据中心容量,并随时间推移达到数百千兆瓦或更多 [7] - 公司最先进的AI模型Llama 4反响相对平淡,被广泛认为不如谷歌和OpenAI的领先基础模型强大 [7] - 公司首席科学家杨立昆离职,并对公司战略表示不满 [7] - 公司2025年股价表现落后于Alphabet,且未能跑赢纳斯达克指数,2026年初至今股价已下跌超4% [7] 智能穿戴设备业务表现亮眼 - 与依视路陆逊梯卡合作推出的Ray-Ban Meta智能眼镜因美国市场需求空前旺盛,库存短缺导致全球首发推迟 [8] - 该智能眼镜具备地图导航、实时字幕与翻译、摄影、视频通话等功能,并配置可通过细微手势操控的神经腕带,售价799美元 [8] - 该眼镜的产能有望提前达到原计划2026年底实现的1000万副目标,公司已建议到2026年底将年产能提升至2000万副或以上 [8] - 据Counterpoint数据,公司在2025年上半年智能眼镜全球市场份额约为73%,处于领先地位 [8] - 该研究机构预计,到2029年智能眼镜品类将实现超过60%的复合年增长率 [8] - 公司认为眼镜是个人超级智能的理想形态,是唯一能让人工智能看见用户所见、听见用户所听的设备形态,未来甚至能生成用户想要的图像或视频内容 [9]
Meta开年最大元宇宙裁员,来了
36氪· 2026-01-14 21:13
Meta对Reality Labs部门进行裁员与战略调整 - 公司计划对元宇宙业务所在的Reality Labs部门裁员10%,涉及约1500人[3] - 裁员最早将于当地时间周二官宣,部门员工总数约为15000人[3][7] - 公司总员工数为78000人,此次裁员总体比例不高[7] Reality Labs部门的财务表现与历史亏损 - 从2020年第四季度至2025年第三季度,该部门累计亏损已超过700亿美元(约合人民币4880亿元)[3] - 元宇宙业务一直惨淡经营[13] 公司资源向AI业务倾斜 - 公司要优先发展AI相关业务,以在大模型竞赛中保持优势[4] - 管理层曾考虑削减元宇宙板块30%的预算,将资金用于AI研究及AI眼镜和可穿戴业务[3] - 公司计划投资数百亿美元打造数据中心[4] - 为吸引AI人才,公司开出了丰厚的薪酬[4] - 在AI竞赛中,公司持续将资源倾斜于AI相关业务,包括AI模型研发、AI数据中心建造以及AI眼镜的打造[13] 可穿戴与AI眼镜业务成为新焦点 - 公司要增加可穿戴部门预算,让AI眼镜产品获得更多资源[6] - 公司CEO认为AI眼镜将是“将超级智能融入日常生活的主要方式”[6] - AI眼镜是公司AI战略中的关键一环[6] - 公司AR部门负责的Meta Ray-Ban产品过去几年卖出了200多万副[10] - 该部门还将负责带显示的AI眼镜Ray-Ban Display,因库存有限和需求高涨,已推迟其在国际市场的发售[10] - 随着新一轮AI眼镜竞争来临,公司面临复制Ray-Ban成功及应对中国厂商竞争压力的挑战[13] 部门重组与裁员影响范围 - 2025年10月重组后,Reality Labs主要包括Horizon OS、元宇宙和可穿戴三大部门[7] - VR头显归属Horizon OS部门,AI眼镜属于可穿戴业务[7] - 与VR头显和VR社交网络相关的人员受裁员影响更大[8] - 负责AI眼镜和腕带等产品的AR部门大概率不会受到裁员影响[10] VR业务发展状况与挑战 - 自2014年收购VR创企Oculus以来,公司一直致力于元宇宙愿景[8] - 公司的VR头显一直销量平平[8] - 在AI眼镜为王的今天,VR头显的重要性已大幅降低[13] 公司对元宇宙业务的未来定位 - 尽管AI竞赛激烈,但公司并不会放弃元宇宙业务[12] - 公司似乎正在重新定义元宇宙可能呈现的样子[12] 内部沟通与会议安排 - 公司首席技术官安德鲁·博斯沃思负责监督Reality Labs部门[11] - 他已安排周三的会议,并敦促员工亲自参加,称此次会议是今年“最重要的”[11]
巨头加速入局,AI眼镜2026年打响新一轮排位赛
21世纪经济报道· 2026-01-14 21:13
行业概览与竞争格局 - 2025年中国AI眼镜市场经历了“百镜大战”,众多厂商登场,但部分新品面临量产难题和体验提升空间[1][2] - 2026年市场将迎来新一轮竞争排位赛,行业在供应链和产品综合沉淀后,发展脉络逐渐清晰[1] - 全球市场由Meta主导,其2025年市场份额高达84%,排名第二和第三的厂商Rokid和华为分别占4%和3%[5] - 全球AI智能眼镜市场预计在2026年进入爆发增长阶段,主要驱动力来自Ray-Ban Meta的商业化成功,以及苹果、三星等生态巨头即将入市的预期[5] 市场参与者与资本动态 - 中国厂商雷鸟创新和闪极科技近期先后完成新一轮融资,显示资本市场持续关注[1][3] - 雷鸟创新获得超10亿元人民币融资,由中国移动链长基金与中信金石领投[3] - 闪极科技完成近亿元人民币融资,用于新一代AI眼镜产品定制产线和AI技术基础设施推进[3] - 百度、夸克、字节等互联网大厂以及国内手机巨头已加入战局,行业未来确定性逐渐成为共识[1][2][8] - 谷歌携新款眼镜和生态卷土重来,并与中国厂商Xreal达成长期战略合作,将其作为安卓XR生态系统的主要硬件合作伙伴[1][6] 产品技术与发展趋势 - 产品正探索更独立的运行方式,例如雷鸟创新展示了配备eSIM功能的新一代产品X3 Pro Project,为独立终端形态打下基础[3] - 2026年新品普遍在轻量化、显示技术和AI能力上重点升级,更关注佩戴舒适性、日常化和显示效果提升[9] - AI功能集成度更高,主动服务和多模态交互成为后续产品迭代方向[9] - 当前限制更多在于算力芯片层面,需平衡轻量化、AI算法与发热问题[5] - 即时翻译、会议纪要整理等应用场景已有较好突破,但体验仍需提升[8] 供应链与市场表现 - 2025年行业处于初期,许多品牌在供应链管理、备货和流转控制方面面临较大挑战[4] - 随着2026年市场出货和需求趋于稳定,供应链上下游协同能力预计提升,关键环节优化将带来更好交付保障[4] - 品控成为用户留存的关键标准,厂商预计将针对核心痛点进行重点优化[4] - 调研机构SAG预测,全球AI智能眼镜销量将从2025年的600万台提升至2026年的2000万台,增长超过3倍[9] - 全球市场规模(收入)将从2025年的12亿美元扩大至2026年的56亿美元,实现约4.7倍增长[9] - 美国与中国将是2026年最大的两个市场,合计贡献接近80%的全球需求[9] 生态建设与行业影响 - 谷歌通过开放部分开发工具和接口,与合作伙伴共建Android XR生态,但其生态建设仍处于起步和完善阶段[6][7] - 互联网与手机大厂入局加剧了行业竞争,可能挤压原有厂商市场份额并加速行业洗牌[8] - 大厂入局也为新创公司和产业链企业带来更多合作与生态共建机会,有助于推动技术创新和应用落地[8] - 苹果预计在2027年左右入局,有望凭借工业设计、时尚属性与生态整合能力,推动行业迎来关键拐点[9]
Meta to reportedly lay off 10% of Reality Labs staff
TechCrunch· 2026-01-14 20:51
公司战略与资源分配 - Meta正在其负责VR和元宇宙产品开发的核心部门Reality Labs裁员10% 该部门约有15000名员工 因此裁员可能影响超过1000人 [1] - 公司计划关闭包括Armature Studio Twisted Pixel和Sanzaru在内的工作室 以及一个名为Oculus Studios Central Technology的技术部门 该部门曾致力于VR游戏开发 [2] - 公司首席技术官兼Reality Labs负责人Andrew Bosworth召集了年度“最重要”的面对面会议 会议定于1月14日举行 [2] 业务重点转移 - 此次裁员不会影响从事增强现实工作的员工 因为公司在开发AR眼镜和控制器方面有宏大计划 [3] - 通过裁员节省的资金将被重新分配用于增强现实开发 [3] - 公司将资源大量投入人工智能开发 例如在去年10月将元宇宙负责人Vishal Shah调任为负责AI产品的副总裁 [4] - 公司去年重组并成立了Superintelligence Labs 此前从Scale AI挖来了Alexandr Wang [4] - 公司向其他实验室的研究人员提供顶级薪酬方案 以吸引他们加入Meta [4] 背景信息 - Meta在2021年将整个品牌更名为Meta 以专注于元宇宙 [4]
罗森布拉特维持Meta Platforms的目标价,为每股1117.00美元。
新浪财经· 2026-01-14 20:48
分析师评级与目标价 - 罗森布拉特维持Meta Platforms的目标价为每股1117.00美元 [1]
韦德布什:Meta被视为采取有纪律且审慎的支出策略
新浪财经· 2026-01-14 20:43
核心观点 - Wedbush分析师认为,Meta Platforms大规模投资人工智能的计划虽然曾引发投资者不安,但其支出是负责任的,且公司当前的投资周期比四年前更具纪律性和目的性 [1][1] 成本控制与运营纪律 - 公司部分部门的裁员表明,其正在采取一种更具目的性的做法,并且此轮投资周期比四年前的投资理念更有纪律性 [1][1] - 分析师对管理层的成本削减努力感到鼓舞 [1][1] 人工智能投资与效益 - 增加在人工智能方面的资本支出是合理的,因为人工智能能力“已经在带来切实的益处” [1][1] - 这种激进的预期资本支出水平表明,其核心业务拥有健康的内在需求,同时也体现了公司对长期战略目标的承诺 [1][1]
Meta Platforms (NASDAQ: META) Price Prediction and Forecast 2026-2030 for January 14
247Wallst· 2026-01-14 20:00
股价表现 - Meta Platforms Inc 股票在过去五个交易日下跌了3.76% [1] - 在此之前的五个交易日,该股票曾上涨0.32% [1]
Meta元宇宙部门狂裁千人:一醒来就收到邮件,刚入职也未能幸免
量子位· 2026-01-14 19:19
元宇宙业务战略收缩与裁员 - 公司正在调整其元宇宙业务,对Reality Labs部门进行大规模裁员,涉及超过1000个工作岗位,约占该部门员工的10% [2][5] - 公司已确认削减对元宇宙的资源投入,此次裁员是具体实践,节省的资源将被重新分配到AI硬件和可穿戴设备等新兴领域 [3] - 公司正式关闭了三家重要的VR游戏工作室:Twisted Pixel、Sanzaru Games和Armature Studio,并暂停了VR健身应用Supernatural的新内容开发 [11][12] 业务模式与组织架构调整 - VR内容策略发生根本变化,投资重心将从重度自研全面转向生态合作,未来将依赖第三方开发者和合作伙伴来支撑平台内容,以降低成本和分散风险 [12] - VR硬件部门得以保留,但运营逻辑彻底改变,将改组为通过更精简、扁平的组织架构运行,不再追求激进的扩张性投入 [13][14] - 曾被视作元宇宙专属领地的Horizon软件团队和开发资源,将几乎完全转移至移动端,不再固守VR头显 [17] 战略调整的财务与市场动因 - 自2021年全力押注元宇宙以来,Reality Labs部门已累计亏损超过700亿美元,始终未能建立覆盖巨额研发成本的营收模型,财务压力是此次调整的首要根源 [18][19] - 行业预想的“技术军备竞赛”并未成型,主要竞争对手如微软和迪士尼已收缩或退出相关业务,导致公司陷入“独木难支”的境地,独自承担市场教育成本与技术探索风险 [22][23][24] - 生成式AI浪潮的爆发,促使公司将资源从回报遥遥无期的元宇宙,转向具备即时商业价值和技术爆发力的AI及移动端业务 [26] 资源重新分配与AI战略转向 - 裁员节省的资金将明确用于高增长领域,鉴于Ray-Ban Meta智能眼镜市场表现超出预期,公司计划激进扩大产能,目标是在2026年底前将年产能提升至2000万台以上 [15] - 公司战略核心从元宇宙优先转向全面押注AI,明确将AGI(通用人工智能)作为未来核心目标,并新成立了“Meta计算”部门以统筹基础设施建设 [29] - 生成式AI技术正被深度整合进核心应用,以提升广告系统效率,为算力设施和硬件长期投入提供现金流支持 [30] 硬件与交互逻辑的重新定义 - 硬件的定位发生根本变化,智能眼镜被重新定义为AI助手的“感官”,旨在利用现有轻量化设备快速占领用户面部关键位置 [32] - 交互方式正在更新,逐步放弃以手柄操作和虚拟空间漫游为主的逻辑,转而确立以“视觉识别加语音指令”为核心的新标准,目标是打造可全天候佩戴、通过自然语言调用的随身智能助理 [33][34] - 公司当前的重心是确保智能技术渗透进各个业务环节,让AI成为推动未来发展的核心动力 [36][37]
200亿美元!马斯克用养老金盖了一座未来工厂,但被投诉扰民
创业邦· 2026-01-14 18:10
文章核心观点 - AI数据中心建设规模空前,但其巨额融资通过复杂的表外金融结构(如SPV)实现,将风险转移至以养老金等为代表的长期资本,而建设和运营的实际成本(如能源、环境、社区影响)则由项目所在地的公众承担,形成了一种“风险转移与成本社会化”的模式 [6][7][10] AI数据中心的规模与影响 - 马斯克旗下xAI在孟菲斯建设的超算集群Colossus,初期用电负荷达150兆瓦,远期规划总容量突破1.2吉瓦,接近孟菲斯市峰值用电需求的四成 [6] - OpenAI规划的算力总价值高达1.4万亿美元 [6] - 数据中心建设为当地带来短暂繁荣,如创造数千建筑岗位和增加税收,但运营后导致电价上涨、水资源紧张及环境污染等持久问题 [7] - 2025年田纳西州居民平均电价为每度13.88美分,较上年上涨约12%,数据中心密集区域的批发电价出现数倍波动 [7] 数据中心作为金融产品的融资模式 - 科技公司通过设立特殊目的实体(SPV)进行表外融资,将数据中心资产装入SPV,由外部资本(主要是私人信贷市场)提供资金,再通过长期租赁或算力合同回售给母公司使用 [7][12] - 该模式吸引了寻求安全、长期、稳定回报的养老金、保险公司和年金基金等资本 [7] - 截至目前,Meta、xAI、甲骨文和CoreWeave等公司已通过此类复杂融资交易筹集超过1200亿美元的数据中心资金 [12] - 融资结构通常包含债务与股权组合,例如Meta的路易斯安那州Hyperion数据中心项目融资300亿美元,其中债务270亿美元,股权30亿美元 [12] - SPV机制保证贷款人在违约时只能对数据中心资产追索,而非向科技母公司追索 [12] - 截至2025年底,科技公司从私人基金借款约4500亿美元,同比增长约1000亿美元,其中约1250亿美元流入长期项目融资交易 [13] - 为实现当前的AI计划,科技公司估计需要约15万亿美元的外部融资 [13] 表外融资的历史与风险 - 表外融资的目的并非使项目更安全,而是让风险在账面上隐形,历史上有安然事件和2000年互联网泡沫作为前车之鉴 [15] - 安然通过SPV将高风险资产置于表外,营造低负债假象,最终风险爆发 [15] - 2000年互联网泡沫破裂时,纳斯达克指数从约5000点暴跌,超过5万亿美元市值蒸发,其机制与当前AI数据中心融资类似,都是资金追逐表象增长而风险由大众承担 [15] - 当技术扩张建立在“看不见的债务”和“被假定的长期需求”上,问题在于最终后果的承担者 [15] AI数据中心选址的社区影响 - AI数据中心倾向于建在电价低、土地充裕、财政依赖外来投资的小城镇,而非硅谷 [17] - 社区需要承担数据中心带来的长期成本:电网升级导致居民电价上涨,冷却系统抽取地下水导致水质下降和水压降低,备用天然气涡轮机产生噪音、热污染和氮氧化物排放,甚至与当地哮喘急诊病例上升相关 [7][17] - 当地居民同时作为养老金持有人和保单缴费者,既是AI数据中心融资的间接资金来源,也是其负面影响的直接承压者 [10][17]
中美AI巨头都在描述哪种AGI叙事?
腾讯研究院· 2026-01-14 16:33
文章核心观点 - 2025年人工智能领域的技术发展标志着“暴力美学”时代的终结,行业从单纯依赖堆砌参数转向深化基础研究,以突破通用人工智能的瓶颈 [5] - 技术进步主要集中在流体推理、长期记忆、空间智能和元学习四大领域,旨在解决模型在即时推理、长期记忆和视觉处理等方面的能力偏科问题 [6] - 通过测试时计算、新型记忆架构、世界模型和元学习等方向的突破,行业在“补短板”方面取得了显著成功,为模型能力的整体提升和未来演进奠定了基础 [7] 流体推理的进化 - **测试时计算的范式革新**:智能被重新定义为不仅是参数的函数,也是时间的函数,以OpenAI o1和DeepSeek R1为代表的模型通过在推理阶段投入更多计算资源进行“慢思考”,实现了推理能力从0到8的质变 [11][12][13] - **强化学习工程优化**:强化学习在提升推理能力中扮演关键角色,其工程可拆分为探索策略、评分系统和参数更新算法三部分,2025年后两部分有明显发展 [15] - **评分系统革新**:基于可验证奖励的强化学习和稀疏奖励指标全面崛起,通过给予模型对错结论作为奖励信号,使其能自发探索推理过程,大幅提升了在数学、代码等领域的能力 [16][17] - **参数更新算法革新**:GPRO算法流行,它通过让模型生成一组答案并计算平均分来替代传统的评论家模型,节省了50%的显存,成为国内各家公司在2025年延展的基础框架 [19] - **强化学习存在天花板**:研究发现强化学习的性能增长符合S型曲线而非幂律,存在性能天花板,但其工程实践(如使用长思维链和大批量大小)已变得更加精确和可预测 [21][23] 记忆与学习 - **记忆能力是短板**:长期记忆存储是通往通用人工智能得分中仍为0的能力分支,缺乏记忆导致模型无法在现实中自我学习,且个性化体验难以实现 [25][26] - **Titans架构突破**:这是一个深度的神经长期记忆模块,能在推理时实时更新自身参数,根据输入信息的“惊奇度”决定存储内容,并引入遗忘机制,从根本上挑战了Transformer的无状态假设 [28][29][30][31] - **Nested Learning架构**:将模型参数按低、中、高频率分层更新,使整个模型参数非冻结,能够持续学习和保有长期记忆,其成本低于传统的监督微调和强化学习方法 [31][33] - **RAG的模型化演进**:检索增强生成系统从静态资料库演变为具备反思与进化能力的系统,例如ReMem引入了“行动-思考-记忆-优化”的全链路处理,能对记忆进行修剪、重组和清理,实现经验复用 [35][36][38] - **克服灾难性遗忘**:通过稀疏记忆微调等方法,模型在注入新知识时仅更新部分参数槽位,在TriviaQA任务中仅导致11%的旧知识遗忘,远优于全量微调的89% [39][40] - **策略蒸馏进步**:在策略蒸馏结合了强化学习的采样和监督微调的密集反馈,让学生模型在自己的“犯错分布”中学习,提供了一种低成本且避免遗忘的参数更新方式 [42] 空间智能与世界模型 - **视觉处理能力提升**:在Sora 2、Veo 3等视频生成模型爆发的推动下,视觉处理能力从2024年的0分提升至2025年的5分,模型开始展现出对物理规律的掌握 [45] - **自监督生成模型的缩放定律**:视觉自回归模型和扩散Transformer被证实遵循特定的缩放定律,例如DiT模型对批量大小和学习率高度敏感,但遵循特定定律后能力可大幅提升 [46][47] - **原生多模态的优势**:研究发现,尽管训练效率较低,但原生多模态架构在参数利用率上可能比晚期融合架构有更高的性能上限 [49] - **VAE的替代方案**:SVG模型通过直接用图像理解模型代替变分自编码器,统一了语义空间,据称训练效率提升6200%,并在多项指标上击败了扩散Transformer和SDXL [50] - **符号主义的世界构建**:以李飞飞团队Marble平台为代表,其基于3D高斯泼溅等技术,从多模态输入生成可探索的3D空间表示,追求更稳定和可控的生成效果 [53][55][56] - **预测即理解的路径**:Meta的V-JEPA 2通过预测被遮挡的视觉内容来学习物理规则的表征,在使用超100万小时视频训练后,模型展现出了反事实预测的能力 [57][58][59] 元学习 - **元学习的核心价值**:赋予模型“学习如何学习”的能力,使其能通过少量样本快速适应新问题,是实现低成本快速适应和应对未知世界的关键 [62][63] - **对上下文学习的重新审视**:有研究认为上下文学习可能只是激活了预训练知识而非真正学习,这与元学习理念不同,但2025年出现了利用改进的上下文框架进行元学习的新尝试 [64][65] - **测试时计算催生隐式元学习**:研究证明模型在推理时的长思维链探索本质上是寻找最优路径,通过优化探索策略(如最小化累积遗憾)可以引导模型学会如何分配算力进行有效思考 [66][69] - **显式元学习系统的探索**:例如DiscoRL系统,通过内外双层循环让AI自主发现学习算法,其发现的Disco57算法在雅达利基准上击败了人类设计的顶级算法,并展现出强大的泛化能力 [70][72] - **中训练路径**:介于预训练和强化学习之间,让智能体通过自主探索产生后果并反思,以建立因果模型,在复杂环境中的成功率平均提升9.6% [72][73] 其他关键技术进展 - **对抗数据与算力瓶颈**:行业通过混合专家模型、合成数据与强化学习结合来突破瓶颈,例如利用DeepSeek-R1生成的长思维链数据对小模型微调,效果优于人类专家编写的数据 [81][82] - **数据质量重于数量**:研究表明数据达到一定规模后存在冗余,筛选前10%最长、最复杂的推理路径样本进行训练,其效果可匹配甚至超越全量数据集 [83] - **合成数据与模型崩溃**:大规模使用合成数据可能导致模型崩溃,但通过自我验证机制过滤(如设定置信度阈值)或使用另一个模型作为裁判进行清洗,可以有效缓解此问题 [85][86] - **小模型能力的飞跃**:蒸馏技术的进步是关键,包括针对混合专家模型的特化蒸馏方案(学习所有专家的“暗知识”)以及思维融合蒸馏(提取多个教师模型的稳健推理逻辑) [88][90][92] - **注意力机制演进**:多头潜在注意力及其变体普及,用于降低显存占用;线性注意力通过混合架构(如Kimi Linear的3:1设计)在性能上首次全面超越全注意力,并在1M上下文解码时吞吐量达到全注意力的6.3倍 [94][96] - **连续空间建模**:大型概念模型和连续自回归语言模型等尝试打破离散词元的限制,通过预测连续概念向量来提升语义带宽和推理速度 [97][100] 2026年可能的技术方向 - **记忆工程化实践**:记忆技术预计将在2026年迎来大规模工程化落地,涉及架构层革新或现有RAG、监督微调技术的精修,以实现持续学习和个性化智能体 [103][104] - **标准架构变革**:模型架构可能向分区、分层、增加功能层(如记忆层)的混合架构演进,以更贴近人脑运作模式,补齐能力短板 [105][106] - **自进化AI的探索**:在记忆、合成数据和元学习等技术完善的基础上,能够让AI进行自我对弈、自我算法优化的自进化研究将在2026年产生更多可能性 [107][112]