Workflow
世界模型
icon
搜索文档
那个固执的法国老头走了,带走了硅谷最后的理想主义
AI科技大本营· 2026-01-05 18:12
公司战略与文化变迁 - 2013年,公司为探索智能本质,打破商业公司规矩,以优厚条件聘请Yann LeCun并成立FAIR研究部门,营造了不计成本、不问产出的纯研究象牙塔环境 [4][8][9][12][13] - FAIR的黄金时代在2025-2026年宣告终结,标志是LeCun离职以及Alexandr Wang空降,公司战略转向强调商业变现、算力堆叠和暴力美学的实用主义路线 [2][4][5][44][47][56] - 公司内部文化发生剧烈碰撞,从LeCun推崇的工程师直觉优于KPI、开放开源的“保护区”文化,转变为由年轻管理层主导、强调保密协议和KPI考核的商业化文化 [14][23][44][49][50] 关键人物贡献与影响 - Yann LeCun作为首席AI科学家,其核心贡献并非直接写代码,而是利用政治资本为PyTorch等研究项目提供保护伞,并坚持默认开源策略,最终使PyTorch反噬TensorFlow,成为学术界主流框架 [17][20][21][22][24] - LeCun在2023年公司AI战略落后时,推动Llama大模型采用开源策略,成功让公司重回AI竞争中心,但其技术路线(世界模型)与主流大语言模型路线存在根本分歧 [40][41][52] - Alexandr Wang于2025年空降成为公司首席AI官,其哲学是“规模就是一切”,代表硅谷新一代强调数据、算力堆叠和快速商业化的技术路线 [5][44][48][49] 技术路线分歧与竞争格局 - LeCun是坚定的“物理主义者”,认为智能基石是理解物理规律和因果关系的“世界模型”,并多次批评大语言模型只是基于统计预测下一个词,并未真正理解世界 [29][30][32][33][36] - 以Transformer架构和预测下一个词为核心的大语言模型路线,自ChatGPT发布后成为行业主流和资本焦点,与LeCun主张的路线形成鲜明对立 [31][34][35][37][55] - 2025年行业竞争白热化,焦点集中于AGI竞赛,开源优势被稀释,行业讨论重点从“AI向善”、“可解释性”转向纯粹的AGI竞赛和商业化 [44][45] 标志性产品与项目 - PyTorch起源于FAIR内部研究员对灵活研究工具的需求,在LeCun的保护和开源策略下,最终在顶级学术会议上占据80%的论文使用率,击败了Google的TensorFlow [18][19][22] - Llama大模型系列是公司应对竞争的关键产品,尽管其技术基础与LeCun的理念相悖,但凭借开源策略成功吸引了全球开发者,帮助公司重获市场地位 [40][41] - LeCun在任期间还推动了如RoBERTa、DINO等体现科研严谨性和前瞻性(如自监督学习)的项目 [63] 行业象征与历史意义 - FAIR的十三年被视为AI时代的贝尔实验室或施乐帕罗奥多研究中心,代表了不计商业回报、追求科学发现的理想主义时代,其产出的开源火种和生态影响了整个行业 [4][58][59][60] - LeCun的离职被视为一个时代的终结,象征硅谷最后理想主义的消退,其留下的关于智能本质的不同路径思考,可能在未来行业遇到瓶颈时被重新审视 [4][57][60][62]
拆解理想在世界模型方向的工作
自动驾驶之心· 2026-01-05 17:30
理想汽车的世界模型技术布局 - 公司对世界模型的定义是“重建+生成”,利用3DGS技术重建自动驾驶场景,再通过生成方法实现闭环仿真或场景生成 [2] - 公司已有一系列相关研究成果,包括中稿ICCV 2025的Hierarchy UGP(场景重建)、StyledStreets(多风格场景生成)、World4Drive(结合驾驶意图的规划)以及中稿ACMMM 2025的OmniGen(统一生成视觉与激光雷达)等 [2] - 公司目前未深入利用世界模型的预测能力直接输出车辆轨迹,但已进行相关探索(如World4Drive)[3] 行业对世界模型的共识与现状 - 业内普遍认为世界模型是围绕视频搭建的时空认知系统,通过跨模态预测和重建学习时空与物理规律 [3] - 行业内的世界模型技术主要围绕3DGS重建、视频/OCC生成以及激光雷达点云生成展开 [3] - 特斯拉等领先公司及许多中游厂商均在布局世界模型的预研和落地 [3] - 但行业对世界模型的定义仍较模糊,存在“生成即世界模型”或“生成+重建即世界模型”等不同理解 [4] 自动驾驶世界模型课程内容框架 - 课程第一章介绍世界模型与端到端自动驾驶的联系、发展历史、应用案例及不同技术流派(如纯仿真、仿真+规划、生成传感器输入等)[7] - 第二章讲解世界模型的基础知识,包括场景表征、Transformer、BEV感知等,这些是求职面试的高频技术关键词 [7][8] - 第三章探讨通用世界模型,涵盖Marble、Genie 3、JEPA、DriveVLA-W0及特斯拉的世界模型模拟器等热门工作 [8] - 第四章聚焦视频生成类世界模型,讲解GAIA-1 & GAIA-2、UniScene、OpenDWM、InstaDrive等经典与前沿工作,并以商汤OpenDWM进行实战 [9] - 第五章聚焦OCC生成类世界模型,讲解OccWorld、OccLLaMA、HERMES、II-World等论文并进行项目实战,此类方法易于扩展至轨迹规划 [10][14] - 第六章分享工业界应用经验,包括行业痛点、期望解决的问题以及相关岗位的面试准备 [11] 课程的技术基础与学习目标 - 课程技术背景知识涵盖Transformer、CLIP、LLaVA、BEV感知、占用网络、扩散模型、闭环仿真、NeRF、3DGS以及VAE、GAN等其他生成式模型 [13] - 课程面向具备一定自动驾驶基础、了解Transformer/扩散模型/BEV等概念、有概率论与线性代数基础以及Python/PyTorch编程能力的学员 [15] - 课程期望学员学完后能达到约1年经验的自动驾驶算法工程师水平,掌握世界模型技术进展,能复现II-World、OpenDWM等主流框架,并应用于实际项目设计 [15] - 课程为离线视频教学,开课时间为1月1日,预计两个半月结课,提供VIP群答疑及三次线上答疑,答疑服务截止2026年12月31日 [16] - 各章节按计划解锁,例如第一章于12月10日解锁,第六章于3月1日解锁 [17]
杨立昆自曝离开Meta内幕:与扎克伯格不合,对29岁新上司不满,力挺“世界模型”遭冷落
搜狐财经· 2026-01-05 17:02
核心观点 - 杨立昆因技术路线分歧、公司战略转型及管理文化冲突离开Meta,并创立AMI Labs以继续其基础研究愿景 [1][12] Meta AI战略转型与内部动荡 - 2025年4月,Meta发布的Llama 4系列中代号“Maverick”的模型在Chatbot Arena排行榜以1417分位列第二,一度超越GPT-4o的1410分 [2][4] - 开源社区发现提交测试的模型是经过特殊微调的“针对对话场景优化的实验性版本”,该版本通过生成冗长回答和使用表情符号在当时的评分算法中获取高分 [4][5] - 在平台引入“风格控制”机制后,Llama 4 Maverick的真实排名从第二跌至第五 [5] - 杨立昆承认Llama 4的测试结果“确实被修饰了一点”,团队采用了用不同模型应对不同测试的策略以博取更好账面成绩 [5] Meta高层人事与权力更迭 - 2025年6月,Meta首席执行官扎克伯格决定斥资约143亿美元收购数据标注巨头Scale AI 49%的股份,目标直指其当时28岁的创始人Alexandr Wang [6] - 作为交易的一部分,Alexandr Wang空降Meta,出任公司首位“首席AI官”,全面接管包括FAIR在内的所有AI研究与产品部门 [8] - Meta成立了新的“超级智能实验室”,将分散的研究力量统一收归Alexandr Wang麾下 [8] - 此次调整后,65岁的杨立昆需要向比自己年轻37岁的Alexandr Wang汇报工作 [8] 技术路线与管理文化冲突 - Alexandr Wang上任后将Meta的AI战略锁定在“大语言模型驱动的超级智能”这一单一路径上,扎克伯格提出“为每个人构建个人超级智能”的激进目标,要求全公司资源向LLM倾斜 [8] - 杨立昆对主流LLM技术路径持怀疑态度,认为其本质是“自回归的预测机”,缺乏对物理世界的真正理解,无法通向真正的超级智能,并将其比作“通向超级智能路上的死胡同” [9] - 在一次高层会议上,当杨立昆阐述长期基础研究的重要性时,Alexandr Wang粗鲁地打断并称“我们是在开发超级智能,不是在辩论哲学”,标志着“学术派”与“工程落地派”的决裂 [10] - 杨立昆表示Meta管理层和新团队已经完全“被大语言模型洗脑了”,只顾在基准测试分数上追赶竞争对手 [10] Meta内部科研文化的剧变 - 在Alexandr Wang主导下,FAIR实验室的学术自由受到限制,研究人员在发表学术论文前需先提交给Wang领导的核心产品部门TBD Lab审查 [10] - 只有被认定具有“重大商业价值”的研究才被允许发表,且研究人员需先协助将成果转化到产品中才能回归日常研究 [10] - 2025年10月,Meta启动针对AI部门的裁员,约600名员工被解雇,受影响最严重的是FAIR及相关基础设施团队,而Alexandr Wang亲自组建的TBD Lab则毫发无损并继续扩招 [11] - 杨立昆形容其在Meta的最后日子里感到“政治上越来越困难”,尽管扎克伯格个人仍支持其研究,但在公司急功近利的氛围下支持显得苍白无力 [11] 杨立昆的离职与创业 - 杨立昆因不愿为保住职位而改变科学观点,最终选择离开Meta [11][12] - 杨立昆在巴黎创办了初创公司AMI Labs,致力于“增加这个世界的智能”,探索在科技巨头商业化竞争中被搁置的科学路径 [12] - AMI Labs预计首轮融资5亿欧元,估值高达30亿欧元 [12] - 杨立昆在新公司担任执行主席,将管理运营交给法国AI创业老兵Alex LeBrun,自己回归纯粹的科学家角色 [12][14]
高德布局世界模型 即将发布相关新产品
新浪财经· 2026-01-05 12:16
公司战略与产品布局 - 阿里巴巴旗下高德已布局世界模型技术领域 [1] - 公司计划基于世界模型推出一项新的产品应用 [1] - 该世界模型将于近期开源 [1] 技术实力与行业地位 - 根据斯坦福大学教授李飞飞团队发布的WorldScore官网显示,高德世界模型目前综合得分位列第一 [1] 组织架构与人才招聘 - 高德内部已成立具身业务部 [1] - 公司招聘官网显示,除了具身业务部的招聘外,还有诸多世界模型相关岗位正在招聘 [1]
独家!高德布局世界模型,即将开源!
新华网财经· 2026-01-05 12:06
高德布局世界模型 - 阿里巴巴旗下高德已布局世界模型 并计划基于该模型推出一项新的产品应用 且该模型将于近期开源[1] - 根据斯坦福大学李飞飞团队发布的WorldScore官网显示 高德世界模型目前综合得分位列第一[1] 世界模型性能评估 - 在WorldScore评估体系中 高德世界模型(FantasyWorld-0.1)的静态世界评分(WorldScore-Static)为78.55分[2] - 该模型在动态相机控制与物体控制(WorldScore-Dynamic Camera Control Object Control)方面得分为54.99分[2] - 在内容对齐(Content Alignment)方面得分为75.55分 在3D一致性(3D Consistency)方面得分为87.75分[2] - 在光度一致性(Photometric Consistency)方面得分为63.37分 在风格一致性(Style Consistency)方面得分为81.10分[2]
高德布局世界模型,即将开源!
上海证券报· 2026-01-05 12:04
公司动态 - 阿里巴巴旗下高德已布局世界模型 并计划基于该模型推出一项新的产品应用[1] - 高德的世界模型将于近期开源[1] 技术实力 - 根据斯坦福大学李飞飞团队发布的WorldScore官网显示 高德世界模型目前综合得分位列第一[2]
高德布局世界模型即将开源!
上海证券报· 2026-01-05 11:45
公司动态 - 阿里巴巴旗下高德已布局世界模型 并计划基于该模型推出一项新的产品应用[1] - 高德世界模型将于近期开源[1] - 根据斯坦福大学李飞飞团队发布的WorldScore官网 高德世界模型目前综合得分位列第一[1] 行业技术 - 世界模型评估体系包含WorldScore-Static、WorldScore-Dynamic、Camera Control、Object Control、Content Alignment 3D Consistency、Photometric Consistency、Style Consistency等多个维度[2] - 在评估榜单中 名为“FantasyWorld-0.1”的模型在WorldScore-Static维度得分为78.55 在WorldScore-Dynamic维度得分为66.89[2]
独家!高德布局世界模型,即将开源!
上海证券报· 2026-01-05 11:40
公司动态 - 阿里巴巴旗下高德已布局世界模型 并计划基于该模型推出一项新的产品应用[1] - 高德世界模型将于近期开源[1] - 在斯坦福大学李飞飞团队发布的WorldScore评测中 高德世界模型目前综合得分位列第一[1] 行业技术 - 世界模型是人工智能领域的前沿方向 涉及静态世界评分、动态世界评分、相机控制、物体控制、内容对齐、3D一致性、光度一致性及风格一致性等多个技术维度[2]
2026年,AI将从炒作走向务实
新浪财经· 2026-01-05 11:29
行业核心观点 - 2026年将是AI技术从规模扩张和概念演示转向实用化、针对性部署和与人类工作流协作的关键过渡之年 [2] - 行业焦点从构建庞大语言模型转向让AI真正可用,实践包括部署轻量模型、嵌入实体设备和设计无缝工作流系统 [2][17] AI发展范式转变:超越规模化 - 自2012年ImageNet论文和2020年GPT-3发布以来,AI产业经历了约十年的“规模化时代”,其核心信念是更多算力、数据和更大的Transformer模型能推动突破 [4][21] - 目前许多研究者认为产业正接近Scaling Law的极限,模型性能进入平台期,预训练成果趋于停滞,需要寻找全新的架构思路 [4][5][21] - Meta前首席AI科学家Yann LeCun和OpenAI联合创始人Ilya Sutskever均强调开发更优架构的必要性,预计未来五年内可能找到比Transformer有显著改进的新架构 [5][21] 小型专业化模型(SLM)崛起 - 下一波企业AI应用的驱动力将是更小巧、灵活的语言模型,它们能针对特定领域微调以提供解决方案 [5][21] - 经过微调的SLMs预计在2026年成为成熟AI企业的标配工具,因其在针对企业业务应用的准确度上可媲美更大的通用模型,且在成本和速度方面表现出色 [5][22] - 法国开源AI初创公司Mistral声称其小型模型经微调后在多项基准测试中表现优于大型模型 [5][22] - SLM的精密度、成本效益和适应性使其成为定制应用的理想选择,且更适合部署在本地设备上,这一趋势因边缘计算进步而加速 [6][22] 世界模型成为新前沿 - 许多研究者认为下一个重大突破将来自“世界模型”,这类系统通过学习物体在三维空间中的运动与交互来进行预测和行动,而非仅预测文本 [8][24] - 2026年被视为世界模型发展的关键年份,LeCun离开Meta创办世界模型实验室(据报道寻求50亿美元估值),谷歌DeepMind推进Genie项目,李飞飞的世界实验室推出商业化模型Marble,初创公司Decart、Odyssey等亮相 [9][25] - 2023年10月,初创公司General Intuition获得1.34亿美元种子轮融资用于训练智能体的空间推理能力;2023年12月,Runway发布其首款世界模型GWM-1 [9][25] - PitchBook预测,游戏领域的世界模型市场规模将从2022-2025年间的12亿美元增长至2030年的2760亿美元,得益于其生成交互式世界和更逼真非玩家角色的能力 [9][25] - 虚拟环境不仅可能重塑游戏产业,还有望成为下一代基础模型关键的测试场 [10][25] 智能体(Agent)走向实用化 - 2025年智能体未能达到市场预期,主要原因是难以与真实工作系统对接,多数被困在试点工作流中 [11][27] - Anthropic公司推出的Model Context Protocol(MCP)被誉为“AI领域的USB-C接口”,能让AI智能体与数据库、搜索引擎及API等外部工具交互,正迅速成为行业标准 [11][27] - OpenAI、微软已公开表示支持MCP,Anthropic将其捐赠给Linux基金会新成立的智能体人工智能基金会,谷歌也开始部署自家的托管式MCP服务器 [11][27] - 随着MCP降低连接阻力,2026年可能成为智能体工作流从演示真正融入日常实践的元年 [12][28] - 技术进步将推动智能体优先解决方案在各行业承担“记录系统核心角色”,渗透到家庭服务、房地产科技、医疗保健以及销售、IT和支持等横向职能中 [12][29] AI与人类协作及就业影响 - 2026年可能成为“人类之年”,讨论重点将从AI取代人类转向AI如何辅助人类工作流程 [14][31] - 预计很多公司将开始招聘,特别是在人工智能治理、透明度、安全性以及数据管理领域,并看好明年失业率平均值低于4% [14][31] - 趋势是人们希望能够驾驭API而非受制于它,2026年将是实现这一目标的关键年份 [14][31] 物理人工智能(实体化)成为主流 - 小型模型、世界模型和边缘计算等技术的进步将推动机器学习在更多物理场景中落地应用 [16][34] - 随着机器人、自动驾驶车辆、无人机和可穿戴设备等新型AI设备进入市场,物理人工智能将在2026年成为主流 [16][34] - 自动驾驶车辆和机器人虽是典型应用且将持续增长,但培训与部署成本高昂;可穿戴设备凭借消费者接受度成为更具成本效益的切入点,如雷朋Meta智能眼镜配备实时视觉助手,AI健康指环与智能手表推动全天候机身推断成为常态 [17][34] - 连接服务提供商将致力于优化网络基础设施以支持新设备浪潮,在提供连接方式上具备灵活性的运营商将占据优势 [17][34]
传高德布局世界模型并成立具身业务部 计划推出相关产品应用
智通财经· 2026-01-05 11:11
公司战略与产品布局 - 阿里巴巴旗下高德地图已布局世界模型 并计划基于该模型推出一项新的产品应用 [1] - 高德内部已成立具身业务部 正在招聘具身智能产品专家、数据/算法工程师等多个岗位 [1] - 高德计划将世界模型作为底层大脑 探索包括人形机器人、机器狗在内的多元化产品形态 实现从数字导航到实体行动的跨越 [1] - 高德在2025年8月宣布全面AI化 全方位转向空间智能 并于同年9月推出了本地生活产品“高德扫街榜” [1] 技术能力与行业地位 - 高德的世界模型在空间智能评测基准WorldScore中取得多项指标第一的成绩 [1] - WorldScore由斯坦福大学教授李飞飞团队提出 是首个支持多模态世界生成模型统一评估的开源基准检验 为目前评估多模态世界生成模型最权威的开源标准 [1] - 这意味着高德已具备理解并模拟复杂物理世界规律的顶尖能力 [1] 生态协同与业务联动 - 高德的布局与阿里集团的AI生态紧密联动 [1] - 阿里集团最新AI旗舰应用“千问”已率先接入高德及“高德扫街榜” [1] - 通过空间智能技术大幅提升了本地生活服务的交互体验 [1]