从Foundation Model到Physical AI，三星「杀入」大模型核心战场

文章核心观点 - 大模型竞争正从数字世界向真实设备与物理世界扩展，竞争逻辑发生变化 [1] - 三星作为拥有全球最大消费电子生态之一的科技巨头，正快速进入大模型核心战场，其路线与多数互联网公司不同 [2][3] - 三星正在全面构建自己的基础模型体系，并利用其独特的软硬件生态优势，推动AI从“聊天助手”进入“真实世界交互”阶段 [4][5] 三星的战略布局与投入 - 三星连续发布多篇大模型相关工作，覆盖模型架构、强化学习、Physical AI等多个方向，释放全面构建自身基础模型体系的信号 [4] - 三星已采购数万张GPU用于AI基础设施建设，其在HBM等高带宽存储领域的优势在AI训练需求爆发背景下被重新认识 [4] - 三星成立了由集团CTO直接推动的“AI Model TF”作为核心技术攻坚组织，于2025年成立，旨在打造先进的基础模型能力并向物理智能方向演进，这标志着其以前所未有的战略力度加速投入下一代AI能力建设 [16][17][18] - AI Model TF正快速聚集基础模型、强化学习等方向的核心人才，被视为三星下一代AI战略最关键的技术组织之一 [18] 模型架构创新：Meki - 三星提出名为Meki的Memory-Based大模型新架构，旨在资源受限条件下重新定义模型扩展方式 [6] - 传统Transformer在端侧设备（如移动设备、智能家居、机器人）上面临RAM、带宽与功耗限制，模型规模难以持续扩大 [8] - Meki架构利用设备上远大于RAM的ROM存储空间，通过参数化Memory Bank将大量知识存储在ROM中，并在推理时动态读取，使RAM负责实时计算，ROM负责知识存储，从而突破端侧容量限制 [9] - 该架构更适合长期运行的端侧AI与Physical AI场景，尤其是在需要满足低延迟、实时交互与长期在线运行的机器人等系统中 [9] 训练范式探索：M2RL - 三星提出M2RL，探索多领域强化学习的训练范式 [10] - 随着AI进入真实设备与现实世界，下一代基础模型正从“静态语言模型”演化为“交互式智能系统”，需要与环境持续交互、感知设备状态、学习长任务并适应动态世界 [13] - M2RL系统研究了不同领域强化学习能力（如数学、代码、科学推理）之间的协同演化，发现高密度推理任务间不存在明显冲突，反而能形成协同增强效应，这意味着强化学习正在推动基础模型获得更强的推理、规划与复杂环境交互能力 [13] 评测体系创新：LiveClawBench - 三星提出LiveClawBench评测体系，旨在解决传统基准测试难以有效评测下一代模型在物理世界场景中能力的问题 [13] - 传统大模型评测基于静态任务、固定环境与标准答案，而真实世界中的AI系统需要持续感知、规划、执行与调整，仅靠“刷题式 Benchmark”已不够 [15] - LiveClawBench提出了一个“三维复杂度框架”，从环境复杂度、认知复杂度以及运行时适应能力三个维度，系统评测模型在真实复杂环境中的长期任务执行能力，更强调真实任务链路、多环境协同以及复杂长期任务 [15] 生态与人才优势 - 相比多数互联网公司，三星拥有全球最完整的软硬件生态之一，覆盖手机、智能家居到机器人设备，几乎覆盖用户生活中的全部核心场景，这使其在AI进入“真实世界交互”阶段具备独特优势 [5][18] - 三星近期在基础模型、端侧智能与Physical AI等方向的突破，与其快速搭建的高水平AI人才体系密切相关 [19] - AI Model TF负责人唐业辉（三星高级技术总监）负责大模型训练与核心技术方向推进，在超大规模模型训练、模型架构与系统优化等方向拥有深厚积累，并拥有基于万卡集群开展超大规模模型训练的丰富经验 [18] - 唐业辉博士毕业于北京大学，Google Scholar引用超过1.3万次，并长期担任NeurIPS、ICML等国际顶级AI会议的领域主席 [20]