通用人工智能(AGI)
搜索文档
AI加速“上车” 智能汽车操作系统迈向千亿级市场
新华财经· 2025-12-18 09:09
行业核心战略转向 - 各大车企将AI智能化作为未来发展的核心战略,例如小鹏宣布成为“全球AI汽车公司”并计划AI单项年投入45亿元,理想自研AI基座大模型MindGPT已进入第三阶段,蔚来在NOMI GPT架构中引入多智能体架构,吉利发布“智能汽车全域AI”技术体系并与DeepSeek-R1完成技术融合 [1] - 行业共识认为软件定义汽车、数据驱动设计、AI重塑体验已成为不可逆转的潮流,AI技术正推动汽车产业步入AIDV(人工智能定义汽车)时代 [1] 汽车软件产业的结构性变化 - 产业链价值重心从传统硬件制造向软件与服务迁移,利润结构从“单次交付型”向“全周期服务”转变 数据显示,硬件利润占比从2020年的79%降至2025年的69%,软件则从6%升至17%,预计2030年硬件占比约59%,软件为25% [2] - 软件作为产业融合的桥梁,催生了跨界新生态,衔接整车企业、芯片厂商、基础软件与操作系统提供商及科研机构等各方优势,实现资源高效整合与系统层级性能提升 [3] - 车载操作系统的商业价值日益凸显,是持续优化用户体验的关键 2025年中国智能汽车操作系统市场规模约为600亿元,预计2030年将超过1000亿元 [3] 汽车软件发展的未来趋势 - 首要趋势是融合化,发展路径从各功能域独立走向跨域初步融合、整车级阶段融合,并最终指向高度自适应的智能操作系统 未来的操作系统将作为协同中枢,支持车、路、云、边端一体化资源调度与共享 [4] - 手车互联功能在新车中的搭载率持续提升,目前已成为多数前装车型的标配,预计到2027年其前装内置率将超过70%,年新增搭载量将突破2000万辆 [4] - 其次是操作系统的AI化趋势,在大型模型与智能体等技术驱动下,AI能力将更深地融入操作系统,从应用层简单集成到提供标准化AI服务,最终实现原生融合,形成能理解用户意图的智能操作系统 [4] - 开源化已成为行业普遍认可并践行的重要技术路径,多家企业如理想、东风、英伟达及欧洲主流车企已开源操作系统或自动驾驶软件,旨在通过共建基础平台解决跨企业协作挑战 [5] AI定义汽车面临的挑战 - AI自动驾驶方案市场规模快速增长,2024年中国软件自动驾驶方案市场规模为3.5亿元,2025年预计将突破190亿元,2030年将突破600亿元 [6] - AI系统具有“黑箱”特性,如功能追溯链条松散、行为表现难以预测、故障和失效模式与传统控制系统差异显著,这给系统验证与量化评估带来困难,需在可解释性、验证方法和安全工程等方面突破关键问题 [6][7] - 汽车软件生态面临多重挑战:生态体系尚不完整,行业未建立统一、开放的软硬件平台生态,开发不同车型需适配多种芯片,厂商开放程度与接口标准不一导致协同适配困难 [7] - 跨企业间的协同机制不顺畅,在芯片平台、内核、中间件、基础软件等多个层面需大量定制化适配与调试,企业间难以在成本、进度与技术路线上达成一致 [7] - 装车落地难度大,国产芯片与软件方案在首台套应用阶段效益不明显,量产认证门槛高、周期长,从成熟方案切换到新国产化平台前期投入大、验证复杂、整车验证周期长导致切换成本高昂 [7] - 其他问题包括行业复合型人才培养体系有待完善、有限的车规算力功耗与复杂AI模型之间难以平衡、数据标准缺失与质量不足等 [7] 行业未来的共同行动方向 - 通过开源共建形成统一的技术底座,降低全行业成本、避免重复投入 完善开源机制,鼓励整车、芯片、软件及科研机构等各方参与车用操作系统、中间件、算法等开源项目,通过社区共建、资源共享、风险共担加快技术突破与转化 [8][9] - 建立国内广泛采用的统一基础软件平台,减少行业重复投入,针对关键核心技术设立专项进行攻关,整车厂发挥示范带动作用推进国产芯片、操作系统与算法融合落地,借助生态共建将技术优势转化为国际标准与话语权 [9] - 建立统一的标准与接口是加速技术上车、缩短开发周期的关键前提 行业需共同定义一套覆盖芯片、操作系统到中间件的标准架构和接口规范,以解决接口不统一、无法复用导致每个项目都需重新适配与验证的问题 [10] - 未来将聚焦基础软件接口、AI算法应用、数据与功能安全等重点领域明确技术标准与应用规范,确保标准的实用性、可操作性与高效性,同时积极参与国际标准制定 [10] - 在生态共建中嵌入前瞻性安全功能,提前布局如“量子安全”等新技术,将安全能力从初始阶段融入研发流程 [11] - 将行业协同生态从“车、路、云”延伸到“车、路、云、星”的范畴 积极探索加入卫星维度,利用中国低轨卫星通信网络等基础设施条件,打通卫星通信与现有“车路云”系统,构建空天地一体的数据和算力网络以拓展应用场景 [11][12] - 汽车是AI发展的重要载体,当前中国智能网联汽车渗透率超过75%,每年新增超千万辆,汽车是最大规模的具身智能应用载体,AI需要通过汽车和物理世界互动以消除幻觉并最终走向AGI(通用人工智能) [12]
早报 | 国家医保局发文回应生娃不花钱;芬兰总理正式向中韩日民众道歉;南京博物院回应名作现身拍卖市场;“AI才女”罗福莉完成首秀
虎嗅APP· 2025-12-18 08:09
美股市场与科技股动态 - 美东时间周三,美股三大指数集体收跌,道琼斯指数跌0.47%至47,885.97点,标普500指数跌1.16%至6,721.43点,纳斯达克指数跌1.81%至22,693.32点,投资者继续从AI概念股撤资 [3] - 甲骨文股价下跌5.4%,主要因市场担忧其债务水平和支出规模,此前有报道称其主要投资方Blue Owl Capital退出了其在密歇根州的100亿美元数据中心项目融资计划 [3] - 多家AI相关股票大幅下跌,博通下跌超过4%,英伟达下跌近4%,AMD跌幅超过5%,谷歌下跌逾3% [4] - 亚马逊年内涨幅仅约1%,表现明显落后于科技“七巨头”中的其他公司 [9] 人工智能行业竞争 - 谷歌发布Gemini 3家族新成员Flash模型,该模型主打快速高效,发布当天即取代Gemini 2.5 Flash成为Gemini App和谷歌搜索AI模式的默认驱动系统 [7] - 亚马逊重组AI团队,将通用人工智能团队、芯片研发部门和量子计算研究团队整合,由AWS老将彼得·德桑蒂斯领导新业务单元 [8] - 马斯克表示,其旗下人工智能公司xAI最早可能在2026年实现通用人工智能,并认为只要挺过未来两到三年,xAI就将战胜竞争对手 [23] - 小米公司发布开源Xiaomi MiMo-V2-Flash大模型,据称在大部分评测基准上超过DeepSeek V3.2和K2-Thinking,实现了低成本和高速度 [11] 中国新能源汽车与科技公司 - 烟台公安打掉一个炒作新能源汽车负面信息的“网络水军”团伙,抓获12人,查扣资金100余万元,关停账号8000余个,该团伙利用AI技术批量生产针对小米、华为、理想汽车的负面文章 [5][6] - 马斯克评论福特汽车收缩电动汽车战略,认为传统汽车行业已无可救药地走向衰落,并重申非自主内燃机汽车将面临淘汰 [20] 中国资本市场与公司事件 - 万科针对“22万科MTN004”中期票据提出新的展期方案,将本金兑付时间展期12个月至2026年12月15日,并计划在宽限期内支付6000万元到期利息,展期期间票面利率维持3.00% [14] - 阿里创投通过大宗交易减持华谊兄弟2952.68万股,其与一致行动人马云合计持股比例由6.064215%降至4.999996%,不再是公司持股5%以上股东 [16] - 中金公司计划通过换股方式吸收合并东兴证券和信达证券,以增强资源整合能力和行业竞争力 [23] 其他行业与市场新闻 - 国际足联宣布,2026年美加墨世界杯总奖金和补贴达7.27亿美元,较2022年卡塔尔世界杯增加50%,冠军奖金为5000万美元,每支参赛球队还可获得150万美元备战补贴,确保至少1050万美元收入 [13] - 海南自由贸易港正式启动全岛封关,零关税商品税目比例提升至74% [23] - 字节跳动火山引擎FORCE原动力大会于12月18日至19日在上海举办,将发布AI、云相关重要产品或战略,预计吸引超4000家企业参与 [23] - 水羊股份与若羽臣就西班牙美容品牌美斯蒂克在中国的独家经营权表述出现冲突,水羊股份称其仍在合约期内,是品牌在中国的“独家经销商” [22]
马斯克:xAI最早2026年实现AGI,公司挺过未来两三年将战胜对手
美股IPO· 2025-12-18 06:52
公司发展前景与战略 - 公司对自身未来前景感到相当乐观,只要挺过未来两到三年,就将战胜竞争对手 [1][2] - 公司有可能在未来几年内实现通用人工智能,甚至最早可能在2026年实现 [1][2] - 公司相较于其他AI公司的一大优势在于其每年可获得约200亿至300亿美元的资金支持,并能受益于旗下其他公司的协同效应 [3] 技术发展路径与规划 - 在迈向“超级智能”的竞争中,快速扩展算力和数据能力将是关键因素 [2] - 公司计划将GPU规模从现有的约20万块扩展至100万块,该项目被命名为“Colossus” [4] - 公司负责人演示了多项现有产品的更新,包括Grok Voice、面向特斯拉车主的应用、智能代理agents,涵盖了结果预测能力提升、更强的语音监听功能以及视频编辑能力等 [6] 产品进展与协同 - Grok 5模型计划于明年初发布,马斯克曾表示该模型实现AGI的概率约为10% [3] - 特斯拉今年早些时候已将Grok集成进其车辆中 [3] - 公司设想在太空建设数据中心,并认为特斯拉的人形机器人Optimus未来或可负责这些地外数据中心的运维工作 [4] 行业竞争格局 - 公司是众多竞逐通用人工智能、并试图支撑数千亿美元估值的公司之一,但在由OpenAI和谷歌等巨头主导的竞争中,仍是相对较新的参与者 [6] - AI竞赛没有放缓迹象,OpenAI为加快推出最新模型进入“紧急状态”,谷歌在11月发布了新的Gemini模型,而公司也在短时间内连续推出新版Grok [6]
智驾人才涌入具身智能,热钱有了新叙事
晚点Auto· 2025-12-18 00:01
行业概况与投资热潮 - 具身智能成为2024年风险投资追逐的新风口,投资机构抢投项目现象显著[3] - 中国活跃在AI和具身智能领域的投资机构至少有上百家,早期投资资金总和超过百亿美元[4] - 二级市场已流露出悲观情绪,有观点认为具身智能最好的行情已经结束[11] - 国内政策制定机构首次对具身智能发出风险提示,指出国内人形机器人企业已超过150家,需防范产品扎堆与研发空间挤压等风险[11] 创业团队背景演变 - 创业团队背景从海归教授、传统机器人产业,转变为拥有智能驾驶产业背景和产品化经验的人才[4] - 智能驾驶背景的团队因拥有量产、大模型训练和调动庞大资源的经验而受到资本青睐[6] - 投资机构对创业者背景的接纳更广,从偏好海外名校背景转向更接地气的本土化、产业化背景[5] - 具身智能领域涌现一批“智驾系”创业者,如来自华为、理想、小鹏、地平线等公司的高管[5] 典型创业公司与融资案例 - 宇树科技在2024年春晚后完成C轮融资,估值超百亿元[3] - 它石智航(由华为前首席科学家陈亦伦等创立)上线数月内融资超10亿元人民币[5] - 至简动力(由理想汽车前CTO王凯等创立)获得约5000万美元天使轮投资[5] - 无界动力(由地平线前副总裁张玉峰创立)完成首轮3亿元天使融资[5] - 星海图(高继扬创立)完成近15亿元Pre-A轮及A轮融资[7] - 逐尔动力(张力创立)完成超5亿元A轮及战略轮融资[7] - 美国具身公司Figure AI在2024年9月以390亿美元估值完成超10亿美元C轮融资,成为全球最贵的具身智能公司[11] 技术路径与挑战 - 视觉-语言-动作模型是目前具身智能领域的主流模型路线[8] - 智能驾驶的技术演进经验(从规则工程转向Transformer架构和端到端训练)被认为可迁移至具身智能领域[9] - 高质量的真实交互数据极度匮乏是技术路径缺乏验证的根本原因[10] - 算法路线尚未明朗,基于规则的小模型泛化能力差,而VLA模型效果相对不可控[10] - 机器人与智能驾驶在控制层面存在本质差异,机器人需控制全身超过20个关节电机与灵巧手,依靠力觉反馈实现精细操作[9] 商业化与成本困境 - 有公司研发的用于汽车总装车间的机器人目前售价约60万元/台,预计2027年规模量产后能降至35万至40万元,与两名工人18个月的薪酬及社保支出相当[10] - 成本模型中未计入机器人的使用寿命和故障损耗成本,例如特斯拉机器人Optimus灵巧手的使用寿命不超过2个月,规模量产难以接受这种损耗[10] - 量产问题是行业普遍忽视但实际存在的重大挑战,现场演示核心功能且表现稳定的团队屈指可数[9] 投资逻辑与市场泡沫 - 投资逻辑高度相似,优先投资具身智能大脑、小脑、机器人本体,然后是触觉传感器、机械臂/灵巧手等[12] - 投资人坦言,95%的时间都在投共识,拿着相似度极高的产业图谱去寻找项目[12] - 一级市场上数百万美元级的小额投资常见,但单笔超过2000万美元的大额投资并不多见,而后者是决定创业公司能否走远的关键[12][13] - 市场存在噪音和泡沫,但热钱仍需寻找出口,部分投资人保持着复杂的乐观态度[4][11] - 部分投资人更倾向押注年轻的“少壮派”团队,对缺乏硬核差异化技术和突出商业模式的资深高管创业持保留态度[9]
何小鹏谈AI:当前没泡沫,物理AI未来三年将迎来关键突破
南方都市报· 2025-12-17 18:35
小鹏汽车CEO何小鹏对AI及机器人行业的观察与公司战略 - 小鹏汽车董事长兼CEO何小鹏分享了赴美与近30位AI领域专家交流后的观察与思考 [2] - 何小鹏判断人形机器人将成为巨头竞争的战场 而专用机器人领域将涌现大量成功机会 [2][3] - 何小鹏预测未来三年最有可能取得重大突破的领域是物理AI 自动驾驶有望直接进入准L4或完整L4阶段 [2][4][5] - 何小鹏认为物理AI的发展速度可能慢于数字AI 但其改变现实生活的力度将更大 [5] - 何小鹏宣布小鹏汽车定位升级为“物理AI世界的出行探索者” 并发布了第二代VLA大模型、Robotaxi、全新一代IRON机器人及飞行汽车等多项物理AI应用 [5][7] 中美AI机器人发展路径差异 - 美国在AI、生物和金融领域的创业较为集中 硅谷特别聚焦于SaaS与物理AI机器人赛道 这些领域的创业项目数量多且估值普遍偏高 [3] - 从技术路线看 中国机器人公司倾向于从硬件角度切入 更多关注关节与控制技术 而美国公司则更倾向于从模型层面入手 注重软件和算法的突破 [3] - 从估值角度看 何小鹏感觉中国估值相对合理 美国估值偏高 这种差异背后是两国不同的发展重点 中国企业更关注市场应用 而美国企业更聚焦前沿研究 [6] 对AI泡沫与AGI发展的看法 - 针对AI泡沫问题 何小鹏持理性态度 认为任何科技时代都存在阶段性或局部性泡沫 这是市场从混沌走向有序的必然竞争过程 [6] - 何小鹏表示AI必然推动社会巨大变革 但目前仍处于“0到0.1”的最初阶段 整体认为当前没有AI泡沫 未来AI市场有着巨大机遇 [6] - 关于通用人工智能(AGI) 何小鹏指出当前AI主要基于模仿学习与强化学习 并以自动驾驶为例说明AI通过海量数据学习可超越人类表现并展现涌现能力 但非真正创造力 [6] - 何小鹏认为真正的AGI仍需突破多项关键技术 包括从多模态到世界模型的构建、持续学习能力以及长时序规划能力等 这些能力的成熟可能需要数年时间 [6] 行业认可与公司进展 - 华为创始人任正非在座谈会上称赞小鹏机器人“敢闯敢试” 这一评价让小鹏科技布局赢得广泛关注 [7] - 小鹏汽车已宣布公司定位升级并发布多项物理AI应用 随着2026年小鹏机器人量产目标的临近 这些技术愿景将迎来实践检验 [7]
汽车视点 | AI加速“上车” 智能汽车操作系统迈向千亿级市场
新华财经· 2025-12-17 16:16
行业核心战略转向 - 各大车企纷纷将AI智能化作为未来发展的核心战略,例如小鹏宣布成为“全球AI汽车公司”并计划AI单项年投入45亿元,理想自研AI基座大模型MindGPT已进入第三阶段,蔚来为NOMI GPT引入多智能体架构,吉利发布“智能汽车全域AI”技术体系 [1] - 行业共识认为软件定义汽车、数据驱动设计、AI重塑体验已成为不可逆转的潮流,AI技术正推动汽车产业步入人工智能定义汽车时代 [1] 汽车软件产业的结构性变化 - 产业链价值重心从传统硬件制造向软件与服务迁移,利润结构从“单次交付型”向“全周期服务”转变 [2] - 具体数据显示,硬件在车企的利润收入占比从2020年的79%降至2025年的69%,预计2030年将降至约59%;同期软件利润占比从6%升至17%,预计2030年将达到25% [2] - 软件成为产业融合的桥梁,衔接整车企业、芯片厂商、基础软件提供商及科研机构等各方优势,实现资源高效整合与系统层级性能提升 [3] - 车载操作系统的商业价值日益凸显,2025年中国智能汽车操作系统市场规模约为600亿元,预计2030年将超过1000亿元 [3] 汽车软件发展的未来趋势 - 首要趋势是融合化,发展路径从各功能域独立走向跨域初步融合、整车级阶段融合,并最终指向高度自适应的智能操作系统 [4] - 操作系统将作为协同中枢,支持车、路、云、边端的一体化资源调度与共享 [4] - 手车互联功能在新车中的前装搭载率持续提升,预计到2027年其前装内置率将超过70%,年新增搭载量将突破2000万辆 [4] - 其次是操作系统的AI化趋势,AI能力将从应用层简单集成,到为上层应用提供标准化服务,最终实现与操作系统的原生融合,形成能理解用户意图的智能操作系统 [4] - 最后,开源化已成为行业普遍认可并践行的重要技术路径,多家企业及欧洲主流车企已通过开源项目共建基础平台以解决跨企业协作挑战 [5] AI技术应用与市场规模 - AI技术正加速在汽车领域应用落地,2024年中国软件自动驾驶方案市场规模为3.5亿元,2025年预计将突破190亿元,2030年将突破600亿元 [6] AIDV规模化落地面临的挑战 - AI系统具有“黑箱”特性,如功能追溯链条松散、行为难以预测、故障模式与传统系统不同,给系统验证与量化评估带来困难,需在可解释性、验证方法和安全工程等方面突破 [6][7] - 生态体系尚不完整,行业缺乏统一、开放的软硬件平台生态,开发不同车型常需适配多种芯片,各芯片厂商开放程度与接口标准不一,导致软硬件协同适配困难 [7] - 跨企业间的协同机制不顺畅,在芯片平台、内核、中间件、基础软件等多个层面需大量定制化适配,企业间难以在成本、进度与技术路线上达成一致 [7] - 装车落地难度大,国产芯片与软件方案在首台套应用阶段效益不明显,量产认证门槛高、周期长,从成熟方案切换到新国产化平台前期投入大、验证复杂且整车验证周期长 [7] - 其他问题包括行业复合型人才培养体系有待完善、有限的车规算力功耗与复杂AI模型之间难以平衡、数据标准缺失与质量不足等 [7] 行业未来的共同行动方向 - 通过开源共建形成统一的技术底座,降低全行业成本,鼓励整车、芯片、软件及科研机构等各方参与车用操作系统、中间件、算法等开源项目,构建共赢生态 [8][9] - 建立国内广泛采用的统一基础软件平台,减少行业重复投入,并针对关键核心技术设立专项进行攻关,整车厂发挥示范作用推进国产芯片、操作系统与算法融合落地 [9] - 建立统一的标准与接口是加速技术上车、缩短开发周期的关键前提,行业需共同定义一套覆盖芯片、操作系统到中间件的标准架构和接口规范 [10] - 未来将聚焦基础软件接口、AI算法应用、数据与功能安全等重点领域明确技术标准与应用规范,并积极参与国际标准制定 [10] - 在生态共建中嵌入前瞻性安全功能,提前布局如“量子安全”等新技术,并将安全能力从初始阶段融入研发流程 [11] - 建议将行业协同生态从“车、路、云”延伸到“车、路、云、星”的范畴,利用中国低轨卫星通信网络建设基础,打通卫星通信与现有系统,构建空天地一体的数据和算力网络 [12] - 汽车是当今最大规模的具身智能应用载体,中国智能网联汽车渗透率已超过75%,每年新增超千万辆,AI需要通过汽车和物理世界互动以消除幻觉并最终走向通用人工智能 [12]
AI智能体时代中的记忆:形式、功能与动态综述
新浪财经· 2025-12-17 12:42
智能体记忆研究的核心观点 - 记忆是AI智能体实现从静态大语言模型到自适应智能体转变的核心能力,支撑长程推理、持续适应及与复杂环境的交互 [1][5] - 当前智能体记忆研究领域呈现碎片化,术语定义松散且传统分类法(如长/短期记忆)已不足以捕捉当代系统的多样性和动态性,亟需新的系统性框架进行统一 [1][6] - 该综述旨在通过“形式-功能-动态”三维视角,提供一个最新且全面的智能体记忆研究图景,并区分其与大型语言模型记忆、检索增强生成(RAG)等相关概念 [1][7] 智能体记忆的定义与范畴 - 智能体记忆被明确定义为促成AI智能体通过环境交互实现持续适应的关键能力,区别于静态大语言模型的参数化记忆 [5][7] - 其应用场景广泛,包括个性化聊天机器人、推荐系统、社会模拟及金融调查等领域,这些应用均依赖于智能体处理、存储和管理历史信息的能力 [5] - 从发展角度看,赋予智能体持续演化能力是AGI研究的核心目标,而这根本上依赖于其记忆能力 [5] 智能体记忆的形式(架构与表示) - 从形式视角,智能体记忆主要有三种实现方式:标记级记忆、参数化记忆和潜在记忆 [10][18] - 这些不同的架构形式是第3节讨论的重点,旨在解答“智能体记忆可以采取哪些架构或表示形式”这一关键问题 [7][19] 智能体记忆的功能(角色与目的) - 从功能视角,提出了超越时间分类的细粒度分类法,区分了三种功能类型:事实性记忆、经验性记忆和工作记忆 [10][18] - 事实性记忆记录智能体与用户及环境交互中获得的知识;经验性记忆通过执行任务逐步增强智能体解决问题的能力;工作记忆在单个任务实例中管理工作区信息 [7][19] - 第4节将详细阐述这些功能类型,以解答“为何需要智能体记忆以及它服务于哪些角色或目的” [7][19] 智能体记忆的动态性(生命周期与运作) - 从动态视角,分析了在智能体与环境交互过程中,记忆如何随时间被形成、检索和演化 [10][18] - 第5节将按记忆形成、检索和演化的顺序进行阐述,聚焦于智能体记忆的生命周期与运作动态 [7][19] 研究资源与新兴前沿 - 为支持实证研究和实际开发,汇编了关于代表性基准测试和开源记忆框架的全面总结 [2][12] - 阐明了数个新兴研究前沿,包括面向自动化的记忆设计、强化学习(RL)与记忆系统的深度融合、多模态记忆、多智能体系统的共享记忆以及可信度问题 [2][12][20] - 这些方向在早期的分类方案中尚未得到充分体现,例如2025年出现的从过往经验中提炼可复用工具的记忆框架或基于记忆增强的测试时缩放方法 [6][16] 综述结构与贡献 - 综述结构包括:第2节形式化定义与概念厘清;第3、4、5节分别审视形式、功能和动态性;第6节总结基准与框架;第7节讨论未来方向;第8节总结 [9][21] - 主要贡献包括:提出了一个基于“形式-功能-动态”视角的最新多维度分类法;探讨了不同记忆形式与功能的适用性及相互作用;勾勒了未来研究方向;汇编了综合资源集以支持研究与开发 [8][20]
AI天才少女首秀 罗福莉称小米开源模型能力全球前二
搜狐财经· 2025-12-17 12:25
公司动态与人事任命 - 小米于12月17日召开2025人车家全生态合作伙伴大会,MiMo大模型负责人罗福莉首次公开亮相 [1] - 罗福莉于2024年11月正式加入小米并执掌MiMo大模型团队,此次为其首次公开演讲 [3] - 罗福莉为95后技术专家,曾任职于阿里、幻方量化,是DeepSeek-V2的关键开发者,其加盟被视为小米在通用人工智能(AGI)赛道发力的重要信号 [3] 产品发布与技术进展 - 小米正式发布并开源最新的混合专家大模型 MiMo-V2-Flash [5] - MiMo-V2-Flash模型总参数量达3090亿,激活参数量为150亿,专为智能体设计,在保持高性能的同时大幅提升推理效率 [5] - 该模型在多个智能体测评基准上已进入全球开源模型的前两名,其代码能力超过了所有开源模型,性能接近顶尖闭源模型,而推理成本仅为其极小一部分 [5] 技术实力与行业地位 - 小米开源模型在代码能力和智能体能力上,凭借“世界级非常公开公正的评估榜单”成绩,已经进入了全球前两名 [1] - 早在2024年4月,小米开源的首个推理大模型“Xiaomi MiMo”就曾在数学推理和代码竞赛的公开测评集上,以70亿的参数量超越了部分更大规模的知名模型 [5]
Alex Wang“没资格接替我”,Yann LeCun揭露Meta AI“内斗”真相,直言AGI是“彻头彻尾的胡扯”
36氪· 2025-12-17 10:45
对当前主流AI发展路径的批判 - 图灵奖得主Yann LeCun尖锐批评当前硅谷主流的人工智能发展路径,认为单纯依靠扩大语言模型规模、喂更多合成数据、雇佣数千人进行后训练以及强化学习微调,是一条“完全胡扯”且“根本行不通”的死胡同[1] - 其观点挑战了行业以语言能力和知识覆盖面为中心的评估体系,指出现实世界中的理解、预测和行动能力远比生成流畅文本复杂,而现有以语言为核心的模型并未触及问题本质[2] - 业界对大语言模型规模化的执念,正将人工智能引向一条看似高速、实则封闭的死胡同[1] 对AI发展关键瓶颈的判断 - 真正制约AI进步的关键,并非如何更快逼近“人类级智能”,而是如何跨越一个常被低估却极其困难的门槛——让机器具备“狗的智能水平”[2] - 从“狗水平智能”到“人类水平智能”的跨越相对容易,最难的部分是达到“狗水平”,一旦达到该阶段,绝大多数核心要素就已具备[34] - 从灵长类到人类,新增的关键能力可能主要是语言,而语言在大脑中只占据极小的区域,当前技术在这方面已做得相当不错[34] 关于AGI(通用人工智能)的见解 - “通用智能”这个概念本身站不住脚,它本质是以“人类智能”为参照定义的,但人类智能本身高度专用化[30] - 与其讨论“通用智能”,不如讨论“人类水平智能”,即机器在所有人类擅长的领域达到或超过人类,这个过程将是渐进而非突发的[31] - 如果一切顺利且无根本性障碍,最乐观估计在5到10年内,或许能看到接近人类或至少接近“狗水平”的智能系统,但历史表明AI发展中总会出现新瓶颈,可能需要20年甚至更久才能突破[32][33] 新公司AMI的技术路线与愿景 - 结束在Meta长达12年的职业生涯后,LeCun通过其新公司AMI(先进机器智能)推动构建“世界模型”的技术路线,旨在让机器理解和预测世界[2][5] - 与主流生成模型在像素或文本层面输出不同,AMI的核心思路是在抽象表征空间中对世界运行规律进行建模和预测,关注“世界将如何演化”而非“生成看起来像什么”[2] - 公司最终目标是推出围绕世界模型和规划等核心技术的实际产品,并希望未来成为智能系统的主要供应商之一[7] - 公司计划以开放的方式进行上游研究,认为公开发表成果是取得突破的必要途径[5][6] 世界模型的技术原理与优势 - 世界模型旨在处理高维度、连续且含噪声的数据模态(如图像、视频),而大语言模型对此完全无能为力[9] - 有效方法是学习一个抽象的表征空间,滤除输入中大量无法预测的细节(包括噪声),然后在该表征空间内进行预测,这是JEPA(联合嵌入预测架构)的核心思想[9] - 世界模型不需要是现实的逐像素模拟器,而是在抽象表征空间中,只模拟与任务相关的那部分现实,这类似于计算流体力学等科学模拟中使用的抽象层级[20][21][22] - 视频等真实世界数据在字节层面更冗余,这种冗余结构使得自监督学习成为可能,其结构远比文本丰富,仅靠文本训练永远不可能达到人类水平的智能[18][19] 对大语言模型局限性的分析 - 当前基于大语言模型的架构构建的智能体系统并不理想,需要海量数据模仿人类行为且可靠性有限[8] - 要训练一个性能尚可的大语言模型,需使用几乎整个互联网中所有可获取的文本数据,一个典型模型的预训练规模大约是30万亿token(约10¹⁴字节),模型需要极大存储能力来记忆并复述这些事实[18] - 大语言模型并不真正理解基础世界规律(如物体会下落),它们只是被微调到给出“看起来正确”的答案,这是复述而非理解[25] - 通过微调语言模型来解决安全问题存在根本缺陷,因为它们总可以被“越狱”绕过限制[37] 对合成数据与模拟环境的看法 - 合成数据具有价值,例如孩子通过游戏在受控模拟环境中学习[24] - 需警惕某些模拟的失真(如视频游戏中为“好看”而非真实的物理效果),不加控制可能会影响模型在现实世界中的泛化能力[24] - 关键不在于是否使用模拟,而在于在哪个抽象层级上训练模型,很多基础世界规律是在非常抽象的层面上学到的[24] 对AI安全与治理的立场 - 安全必须与发展同步进行,而不是先停下来等“绝对安全”,可类比喷气发动机通过不断工程改进达到高可靠性的发展路径[37] - 应转向以目标驱动为核心的AI架构,该系统拥有世界模型预测行为后果,可规划行动序列,并受到一整套硬性约束限制,在设计层面就是安全的[38][39] - 当前LLM领域通过生成大量候选输出再进行过滤排序来限制输出的方法,计算成本高得离谱,昂贵、低效且不可规模化[39] - 强大技术必然伴随风险(如汽车早期),但那是工程和治理问题,而非不可逾越的根本障碍,AI已在医疗影像等领域挽救大量生命[35][36][50] 对行业生态与竞争格局的观察 - 当前AI投资热潮让长期研究型创业成为可能,而以前这类研究只能依托于大企业或大公司的研究院[5] - 包括谷歌、OpenAI甚至Meta在内的许多实验室正从开放研究转向封闭[5] - 硅谷因竞争极端激烈,所有公司都被迫做同一件事(大语言模型),催生了技术单一化现象,OpenAI、Meta、Google、Anthropic几乎所有公司都在做同样的事情[47] - 这种环境导致公司拼命在同一条战壕里竞争,却很容易被来自“完全不同方向”的技术突破所颠覆[48] - 在硅谷大公司内部,也有不少人私下认同当前主流路径错误,LeCun的新公司正在招募这些人[49] 对其他相关公司与技术的评价 - 对大多数试图构建世界模型的公司(如SSI)具体在做什么不太清楚,SSI甚至成了行业笑话[44] - Physical Intelligence主要做几何一致的视频生成,但这仍是“生成像素”的思路,LeCun认为这是错误方向[44] - 认可Wayve公司在自动驾驶领域构建的世界模型,认为其做对了一半(预测发生在表示空间),但问题在于其表示空间仍主要通过重建训练得到[45] - 认可NVIDIA和Sandbox AQ的类似方向,Sandbox AQ提出的“大型定量模型”与LeCun的主张高度一致[46] - Google做了很多世界模型,但主要仍是生成式路径,Danijar Hafner的Dreamer系列模型走在正确道路上,但其已离开Google创业[47] 关于Meta内部AI方向的变动 - Alex Wang负责Meta所有AI相关的研发与产品整体运作,而非科研本身,他并不是在“接替”LeCun的科研角色[40] - Meta的“超级智能实验室”体系下分为四部分:FAIR(长期基础研究)、TBD Lab(前沿大语言模型)、AI基础设施、产品部门,Alex Wang统管这四个方向[40] - FAIR目前被明显推向更短期、更偏应用的研究方向,发表论文的重要性下降,更多是为TBD Lab的大模型工作提供支持,这意味着Meta整体正在变得更“封闭”[42] - 一些研究团队(如做SAM的团队)已被重新归类到产品部门[43]
万字拆解371页HBM路线图
半导体行业观察· 2025-12-17 09:38
文章核心观点 - 高带宽内存是AI算力发展的关键基础设施,其性能直接决定了AI模型训练和推理的速度与效率 [1] - 韩国KAIST大学发布的HBM技术路线图详细规划了从HBM4到HBM8的未来发展蓝图,揭示了HBM技术将持续突破带宽、容量和能效极限,以支撑未来AGI等高级AI应用的需求 [1][15] - HBM通过3D堆叠等核心技术解决了传统内存的带宽瓶颈、高延迟和高功耗问题,已成为AI服务器不可或缺的组件 [4][7][14] HBM技术定义与核心优势 - **技术定义**:HBM是一种采用“三明治式”3D堆叠技术的“超级内存”,通过硅通孔实现数据在堆叠芯片层间的垂直高速传输,解决了传统平面内存的带宽和延迟瓶颈 [7][8][59] - **带宽碾压**:HBM带宽远超传统内存,HBM3带宽为819GB/s,HBM4将达2TB/s,HBM8更将飙升至64TB/s,相当于每秒传输16万部高清电影,这是AI训练速度的关键 [12] - **功耗减半**:HBM的垂直传输设计更省电,传输1TB数据,HBM3功耗是DDR5的60%,HBM4将进一步降至50%,有助于数据中心大幅降低电费 [13] - **体积迷你**:HBM模块体积小,可直接集成在GPU封装旁,使AI服务器能容纳更多GPU,算力密度提升3倍,是高密度AI服务器的必然选择 [10][14] HBM技术发展路线图(2026-2038) - **HBM4**:预计2026年推出,核心创新在于定制化Base Die,可直连低成本LPDDR内存以扩展容量,带宽提升至2TB/s,单模块容量达36-48GB,采用直触液冷散热应对75W功耗 [17][18][22][24] - **HBM5**:预计2029年推出,引入近内存计算技术,在内存堆叠中集成计算单元,可减少GPU 40%的工作量,带宽达4TB/s,容量80GB,采用浸没式冷却应对100W功耗 [27][28][29] - **HBM6**:预计2032年推出,采用“多塔架构”提升吞吐量,使LLM推理吞吐量较HBM5提升126%,带宽达8TB/s,容量96-120GB,并集成L3缓存专门存储KV缓存以降低延迟 [32][35][36][38][40] - **HBM7**:预计2035年推出,实现内存与高带宽闪存的融合,集成容量达2TB的HBF作为低成本大容量存储,系统总内存容量可达17.6TB,带宽24TB/s,采用嵌入式冷却 [41][42][44][46][47] - **HBM8**:预计2038年推出,采用全3D集成技术,将GPU裸片垂直堆叠在HBM之上,实现“算力无瓶颈、数据零等待”,带宽达64TB/s,容量200-240GB,采用双面嵌入式冷却 [49][52][54][56][57] 支撑HBM性能的关键技术 - **硅通孔**:在芯片上制造微米级垂直孔道,使数据能在堆叠芯片层间直接传输,路径缩短90%以上,是3D堆叠的基础,其布局从对称演进到同轴以降低干扰 [59][63][66][67] - **混合键合**:采用铜-铜直接键合工艺连接芯片,相比早期的微凸点技术,电阻降至1/10,连接更牢固密集,使堆叠层数增至24层、I/O数量达16384个成为可能 [68][70][71] - **AI辅助设计**:利用AI模型大幅缩短HBM复杂结构的设计周期,如PDNFormer模型可在1毫秒内完成电源阻抗分析,将设计周期从数月缩短至数周 [72][74][76][77][79] HBM产业格局与挑战 - **市场格局**:2025年全球HBM市场规模达300亿美元,2030年预计突破980亿美元,SK海力士、三星、美光三巨头垄断90%以上产能,订单已排至2026年 [80][81] - SK海力士为行业龙头,占全球HBM3E出货量的55%,其M15X新工厂投产后月产能将提升至17.8万片 [81] -三星的HBM3E产能已被谷歌、博通等头部客户包圆,并与OpenAI签署了713亿美元的四年供应大单 [84] -美光增速快,其HBM3E已通过英伟达认证,目标是在2026年将市场份额从7%提升至24% [85] - **主要挑战**: - **成本**:HBM3每GB成本约为DDR5的5倍,HBM4因工艺复杂成本预计再增30%,需通过提升良率、扩大产能和技术创新来降本 [87] - **散热**:未来HBM8功率可能突破200W,需研发新型散热材料、芯片级冷却方案和智能温控系统来应对 [88] - **生态协同**:需要GPU/CPU硬件接口、AI软件框架及行业标准进行深度适配与优化,以充分发挥HBM性能并降低应用门槛 [88][89]