Workflow
世界模型
icon
搜索文档
传高德布局世界模型并成立具身业务部 计划推出相关产品应用
智通财经· 2026-01-05 11:11
公司战略与产品布局 - 阿里巴巴旗下高德地图已布局世界模型 并计划基于该模型推出一项新的产品应用 [1] - 高德内部已成立具身业务部 正在招聘具身智能产品专家、数据/算法工程师等多个岗位 [1] - 高德计划将世界模型作为底层大脑 探索包括人形机器人、机器狗在内的多元化产品形态 实现从数字导航到实体行动的跨越 [1] - 高德在2025年8月宣布全面AI化 全方位转向空间智能 并于同年9月推出了本地生活产品“高德扫街榜” [1] 技术能力与行业地位 - 高德的世界模型在空间智能评测基准WorldScore中取得多项指标第一的成绩 [1] - WorldScore由斯坦福大学教授李飞飞团队提出 是首个支持多模态世界生成模型统一评估的开源基准检验 为目前评估多模态世界生成模型最权威的开源标准 [1] - 这意味着高德已具备理解并模拟复杂物理世界规律的顶尖能力 [1] 生态协同与业务联动 - 高德的布局与阿里集团的AI生态紧密联动 [1] - 阿里集团最新AI旗舰应用“千问”已率先接入高德及“高德扫街榜” [1] - 通过空间智能技术大幅提升了本地生活服务的交互体验 [1]
深度|2026年,AI将从炒作走向务实
Z Potentials· 2026-01-05 11:08
文章核心观点 - 2026年将是AI技术从炒作转向实用化的关键一年 行业焦点从构建庞大模型转向让AI真正可用 包括部署轻量模型 嵌入实体设备以及设计无缝工作流系统 标志着行业从粗放扩张转向新架构研究 从演示转向针对性部署 从空谈自主转向赋能人类的协作工具 行业开始回归理性 [3][4] Scaling Law的极限与架构创新 - 自2012年ImageNet论文和2020年GPT-3发布后 AI进入“规模化时代” 其核心信念是更多算力、数据和更大的Transformer模型将推动突破 [7][8] - 当前许多研究者认为AI产业正在接近Scaling Law的极限 性能进入平台期 预训练成果趋于停滞 需要全新的思路和比Transformer有显著改进的新架构 [9] - Meta前首席AI科学家Yann LeCun长期反对过度依赖规模化 OpenAI联合创始人Ilya Sutskever也指出当前模型性能已进入平台期 [9] 小型专用语言模型的崛起 - 下一波企业AI应用的驱动力将是更小巧、更灵活的小型语言模型 它们能针对特定领域进行微调以提供解决方案 [9] - 经过微调的SLMs将成为大趋势 并在2026年成为成熟AI企业的标配工具 因其在针对企业业务应用的准确度上能够媲美更大的通用模型 且在成本和速度方面表现出色 [10] - SLM的精密度、成本效益和适应性使其成为定制应用的理想选择 其特性也意味着更适合部署在本地设备上 这一趋势因边缘计算的进步而加速 [11] 世界模型成为关键突破方向 - 许多研究者认为下一个重大突破将来自“世界模型” 这类AI系统通过学习物体在三维空间中的运动与交互 从而能够进行预测并采取行动 而非仅仅预测下一个词语 [14] - 越来越多迹象表明2026年将成为世界模型的关键年份 包括LeCun创办世界模型实验室并寻求50亿美元估值 谷歌DeepMind持续深耕Genie项目 李飞飞的世界实验室推出首个商业化世界模型Marble 以及多家初创公司获得融资或发布产品 [15][16] - 游戏领域的世界模型市场规模预计将从2022至2025年间的12亿美元 增长至2030年的2760亿美元 得益于该技术生成交互式世界和更逼真非玩家角色的能力 虚拟环境有望成为下一代基础模型关键的检测场 [16][17] 智能体从演示走向实践 - 2025年智能体未能达到市场预期 主要原因是难以将其与真实工作系统对接 缺乏获取工具与场景信息的途径 [18] - Anthropic公司推出的Model Context Protocol被誉为“AI领域的USB-C接口” 它让AI智能体能够与数据库、搜索引擎及API等外部工具进行交互 正迅速成为行业标准 并获得OpenAI、微软、谷歌等巨头的支持 [18] - 随着MCP降低连接实际系统的摩擦阻力 2026年很可能成为智能体工作流从演示阶段真正融入日常实践的元年 技术进步将推动智能体在各行业承担起“记录系统核心角色” [19][20] AI增强人类而非简单替代 - 2026年的讨论重点将更多地转向AI如何辅助人类工作流程 而非取代人类 预计人工智能治理、透明度、安全性以及数据管理领域会出现新的职位 [21] - 有观点认为2026年失业率平均值会低于4% 表明AI的发展将更多地与人类工作协同 [21] AI走向实体化与物理场景 - 小型模型、世界模型和边缘计算等技术的进步将推动机器学习在更多物理场景中落地应用 物理人工智能将在2026年成为主流 [24] - 新型人工智能设备如机器人、自动驾驶车辆、无人机和可穿戴设备开始进入市场 其中可穿戴设备凭借消费者接受度成为更具成本效益的切入点 例如配备AI助手的智能眼镜和AI健康指环等 [24] - 连接服务提供商将致力于优化其网络基础设施以支持这波新设备浪潮 在提供连接方式上具备灵活性的运营商将占据优势 [24]
消息称高德正式布局世界模型,即将发布相关新产品
新浪科技· 2026-01-05 10:52
公司战略与产品布局 - 阿里巴巴旗下高德已布局世界模型,并计划基于世界模型推出一项新的产品应用 [1] - 高德内部已成立具身业务部,探索方向包括机器人、机器狗等产品形态 [1] - 2025年8月,高德宣布全面AI化,全方位转向空间智能 [1] - 2025年9月,高德推出了本地生活产品“高德扫街榜” [1] 技术进展与生态协同 - 高德的世界模型已在空间智能评测基准WorldScore中取得多项指标第一的成绩 [1] - WorldScore由斯坦福大学教授李飞飞团队提出,是首个支持多模态世界生成模型统一评估的开源基准测试 [1] - 阿里集团最新AI旗舰应用“千问”首个接入的阿里生态场景即是高德和高德扫街榜 [1] 组织与人才 - 高德在招聘平台上为具身业务部放出了多个招聘岗位,包括具身智能产品专家、数据/算法工程师等方向 [1]
独家丨高德正式布局世界模型 即将发布相关新产品
新浪财经· 2026-01-05 09:33
公司战略与产品布局 - 阿里巴巴旗下高德已布局世界模型,并计划基于该模型推出一项新的产品应用[1][2] - 高德内部已成立具身业务部,正在招聘具身智能产品专家、数据/算法工程师等岗位[1][3] - 具身业务部的探索方向包括机器人、机器狗等产品形态[1][3] - 高德于2025年8月宣布全面AI化,全方位转向空间智能[1][3] - 高德于2025年9月推出了本地生活产品“高德扫街榜”[1][3] 技术进展与行业地位 - 高德的世界模型在空间智能评测基准WorldScore中,取得多项指标第一的成绩[1][3] - WorldScore是由著名华裔人工智能科学家、斯坦福大学教授李飞飞团队提出的首个支持多模态世界生成模型统一评估的开源基准测试[1][3] - 在WorldScore榜单中,模型“FantasyWorld-0.1”在“WorldScore-Static”指标上得分为78.55,在“WorldScore-Dynamic”指标上得分为54.99,在“Camera Control”指标上得分为75.55,在“Object Control”指标上得分为87.75,在“Content Alignment”指标上得分为63.37,在“3D Consistency”指标上得分为81.10,在“Photometric Consistency”指标上得分为93.50,在“Style Consistency”指标上得分为85.43[2][4] 生态协同与整合 - 阿里集团最新AI旗舰应用“千问”首个接入的阿里生态场景即是高德和高德扫街榜[1][3]
宇树科技回应“上市绿色通道被叫停”;苹果回应国行版AI上线;段永平再晒部分苹果持仓,累计收益率超16倍;巴菲特退休后最新发声丨邦早报
搜狐财经· 2026-01-05 08:33
宇树科技IPO相关澄清 - 公司针对媒体报道发布严正声明,否认涉及申请IPO“绿色通道”相关事宜,称报道内容与事实不符,误导公众并侵害公司权益 [1] - 公司表示已向主管部门反映情况,并督促相关方撤回不实报道,保留通过法律手段追责的权利 [1] - 公司明确其上市工作正常推进,相关进展将依法依规进行披露 [1] 苹果AI功能与相关动态 - 有博主透露苹果已针对部分国行设备启动“Apple智能与Siri”功能灰度测试,获测试资格用户可开启功能并下载更新 [1] - 部分用户反馈AI回答基于百度现有答案,疑似功能被阉割 [1] - 苹果技术顾问回应称,截至1月4日苹果AI尚未正式上线,后续将在官网发布,仅兼容iPhone15Pro及以上机型,并警告强行通过第三方软件开启可能影响资金和账号安全 [1] - 知名投资人段永平晒出部分苹果持仓,其账号自2011年11月开始买入苹果股票,累计收益率达1623.48%,收益金额约为3426万美元 [1] - 该账号两次买入苹果股票,第一次购入13.1万股,平均价13.75美元/股,带来3392万美元收益,收益率1881.8%;第二次购入2388股,平均价128.94美元/股,带来34.27万美元收益,收益率111.3% [1] 公司股权与治理纠纷 - 北京三快在线科技有限公司新增一则股权冻结信息,冻结其持有的北京三快信息科技有限公司股权数额325万人民币,冻结期限为3年 [2] - 双星名人集团创始人汪海发布公开声明,宣布与儿子汪军、儿媳徐英断绝父子及姻亲关系 [2] - 2022年,汪海儿媳徐英控股80%的青岛星迈达工贸有限公司通过增资,获得双星名人56.96%股份,成为第一大股东 [3] - 2025年5月,汪海指控其子、儿媳及孙子企图抢夺公章、威逼交出管理权,质疑公司搬迁、人事任命等行为 [3] - 2025年12月2日,徐英以“双星名人董事长”及控股股东名义发布声明称,董事会已免去汪海董事长及法定代表人职务,选举徐英接任 [3] - 汪海在声明中强调汪军与徐英均为美国身份,称民族品牌绝不能由外籍人士接班,并痛斥对方搞“去创始人化” [3] - 汪海表示将成立“双星名人品牌接班委员会”,推行“能人接班”和“职业经理人接班” [3] 企业高管变动与业务调整 - 小鹏产品中心副总裁陈永海已于2025年12月离职,其职务暂由总裁王凤英接替 [4] - 罗马仕在内部启动名为“重生计划”的重组方案,力争在2026年第一季度完成资金引入与重组工作,并重新获取新3C认证 [4] - 罗马仕已与红杉资本、金沙江创投等知名投资机构展开洽谈,部分机构已表达投资意向 [4] - 罗马仕也与多家供应商协商债转股解决方案,并承诺在公司实现盈利后逐步清偿欠款 [4] - 广汽本田汽车有限公司已完成收购,成为原东风本田发动机有限公司的全资股东,企业名称变更为广汽本田发动机有限公司 [4] - 法国院线护肤品牌Filorga菲洛嘉官方旗舰店发布公告,将于2026年1月31日正式停止运营并闭店,该店铺拥有303万粉丝 [4] - 菲洛嘉明星单品“十全大补面膜”已累计售出超3万件,其微信小程序会员中心已于2025年12月31日停止运营 [4] - 特斯拉餐厅开业不到半年,客流锐减,明星主厨埃里克・格林斯潘已离职,擎天柱机器人不见,招牌培根下架 [4] 商标注册与品牌运营事件 - 宏胜饮料集团有限公司的两个“娃小宗”商标注册成功,国际分类分别为“社会服务”和“医疗园艺”,注册公告日期为2025年12月21日 [7] - 宏胜饮料系杭州恒泽食品饮料有限公司注册的“KELLYONE 凯壹”商标通过,国际分类为“30-方便食品” [7] - 面部清洁护理连锁品牌“洗脸熊”被多地消费者投诉门店跑路,涉及广东、浙江、湖北、上海等地,消费者反映退款难、会员卡无法通用 [8] - 洗脸熊创始人唐华波回应称,对监管不到位深感自责,将切实维护消费者权益 [9] - 公司官方声明称,门店“跑路”系个别门店擅自停业所致,正要求相关门店逐一联系并落实退款,并启动法律追责程序 [9] - 公司表示全国2600余家店均正常运营 [8] 消费与科技行业事件 - 汉堡王官方小程序、APP及支付宝等第三方接入端口在1月4日上午出现集中故障,导致线上点餐系统完全停滞 [11] - 汉堡王中国在11时12分发文致歉,称由于瞬时访问量巨大,系统承载能力不足,正在紧急修复 [11] - 约一小时后,汉堡王中国再次发文致歉,称部分用户未能买到2026代言人元旦礼盒套餐,并计划近期在天猫官方旗舰店开放该套餐预订 [11] - 前Meta首席AI科学家杨立昆谈及离职原因,表示公司新招募的一批人“满脑子都是大语言模型”,而他认为大语言模型是实现超级智能的一条死胡同 [12] - 杨立昆表示,他在世界模型与自主智能体领域的研究成果已展现出诸多潜在应用场景,但这些领域均非Meta的关注重点 [12] - 深圳云豹智能有限公司在深圳证监局办理上市辅导备案登记,启动A股IPO进程,有望冲刺“国产DPU第一股” [12] - 云豹智能是一家专注于DPU芯片和解决方案的半导体公司,其DPU芯片已量产并进入中国移动等企业供应链 [12] - 有报道称,截至2025年11月底最新一轮融资,云豹智能估值已超过140亿元 [12] - 伯镭科技完成新一轮融资,2025年累计融资金额超10亿元,创下矿区无人驾驶赛道在一级市场的最大融资纪录 [12] - 术锐机器人于2025年12月完成1亿美元D轮融资 [12] - 马斯克在社交媒体表示,Grok的新版本已发布,本次更新主要优化了Imagine视频生成等功能 [15] 汽车行业动态与数据 - 吉利雷达金刚PHEV四驱山地版、雷达地平线PHEV四驱高寒版正式上市,官方指导价分别为13.98万元、15.18万元 [13] - 两款新车基于吉利雷神EM-P超级电混系统开发,系统最大功率260千瓦,峰值扭矩914牛・米 [13] - 乘联分会秘书长崔东树提供的数据显示,2025年1~11月,中国对委内瑞拉出口的汽车达到了17099辆,增速130% [18] - 其中,乘用车出口10201辆,增速166%;货车出口1481辆,增速99% [18] - 据此前报道,江淮汽车委内瑞拉公司总裁预计2025年委新车市场销量有望升至3万辆,同比增长70% [18] - 长安汽车委内瑞拉经销商预计2025年在委销量增至2500辆,同比增长15%~20% [18] - 江淮品牌在当时占委新车市场份额约27%,95%的江淮汽车在委本地组装,月组装能力约500台 [18] - 中国汽车工业协会数据显示,2025年11月,汽车整车出口81.8万辆,同比增长49.2%,出口金额达138.7亿美元,同比增长53% [19] - 2025年1-11月,汽车整车出口733.1万辆,同比增长25.7%;出口金额达1253.2亿美元,同比增长16.7% [19] 宏观经济与消费数据 - 经文化和旅游部数据中心测算,2026年元旦假期3天,全国国内出游1.42亿人次,国内出游总花费847.89亿元 [18]
AI"教父"放狠话,大语言模型走不通
文章核心观点 - 人工智能领域先驱杨立昆因与Meta在技术路线和公司战略上存在根本分歧而离职 其认为大语言模型无法实现超级智能 并计划创办新公司推进其“世界模型”架构以实现高级机器智能 [8][9][18][21][95][96][98] - ChatGPT的发布打乱了Meta的阵脚 公司转向全力开发大语言模型Llama 但后续版本表现不佳及数据操纵丑闻导致内部重组 并引入年轻高管 这加剧了与坚持开放研究路线的LeCun之间的冲突 [70][72][73][82][84][86][89][90] - 杨立昆倡导的“世界模型”技术路线旨在让AI通过视频学习理解物理世界 具备规划、推理和记忆能力 他认为这是实现超级智能的正确路径 并预计相关技术将在短期内取得可见进展 [22][23][24][25][102][104][105] 杨立昆的职业轨迹与成就 - 作为深度学习奠基人之一 与Geoffrey Hinton和Yoshua Bengio共同获得2018年图灵奖 [44][45] - 在AT&T贝尔实验室期间开发了卷积神经网络 该技术后被广泛应用于图像识别和银行支票读取系统 [51][52] - 2013年应扎克伯格邀请加入Facebook 主导创建了Facebook人工智能研究院 并保留了在纽约大学的职位且无需搬迁 其研究成果坚持公开 [63][65][66][67] Meta内部AI战略的演变与动荡 - ChatGPT发布后 Meta决定全力开发大语言模型Llama 并通过发布开放权重的Llama 2试图改变行业格局 [73][74][75][76] - 2025年4月发布的Llama 4被指控操纵测试数据以美化结果 导致扎克伯格对团队失去信心 生成式AI部门被边缘化 人员流失严重 [82][83][84] - 2024年6月 Meta投资150亿美元于数据标注公司Scale AI 并聘请其28岁的联合创始人Alexandr Wang来领导新的AI研究部门TBD实验室 [85][86] - 公司试图以1亿美元签约费从竞争对手处挖角顶尖研究员 这一激进策略的效果存疑 [87][88] 技术路线分歧:大语言模型 vs 世界模型 - 杨立昆认为大语言模型本质受限于语言 无法达到理解物理世界的人类水平智能 因而不是实现超级智能的路径 [21][22] - 他提出的替代方案是V-JEPA“世界模型”架构 通过视频和空间数据学习 使AI具备理解物理世界、规划、推理和持久记忆的能力 即高级机器智能 [23][24][25] - 他认为Meta新招募的专注于超级智能的团队“完全被大语言模型洗脑了” 这导致他在公司内部政治上处境困难 [96][97] 杨立昆的离职与新事业规划 - 离职的直接原因包括与公司新战略和管理层(如年轻且无研究经验的新上司)的不合 以及其研究兴趣与Meta商业重点的错位 [89][90][95][99] - 他计划创办新公司并担任执行主席 以推进其世界模型和高级机器智能的研究 并已获得投资人关注 [9][14][100] - 他认为由OpenAI前高管创立的“Thinking Machines”和“Safe Superintelligence”等新型基础研究创业公司代表了行业新趋势 [101] - 预计其世界模型技术的“婴儿版”将在12个月内面世 更大规模版本则在几年内 [104]
独家对话前华为天才少年李元庆:首款规模化具身智能产品中国造!多机异构是未来方向
新浪财经· 2026-01-04 20:25
核心人事动态 - 前华为云具身智能核心负责人李元庆已正式加入乐享科技,将重点负责公司的创新业务战略规划与核心技术攻关 [2][36] - 李元庆在2024年作为华为云具身智能主要负责人,主导了明星具身智能项目落地,使其成为行业顶尖人才 [2][36] - 其加入乐享科技的核心原因是双方在具身智能赛道技术理念高度契合 [3][37] 行业发展趋势与驱动因素 - 2025年机器人领域投融资活跃,热潮由未来发展的确定性倒推而来,资本市场遵循长期逻辑 [5][40] - 热潮典型特征是一二级市场联动,二级市场上市公司布局旨在市值管理及打造第二增长曲线 [5][40] - 技术成熟度取得关键突破,2025年机器人稳定性、可靠性显著提升,正从技术演示向产品化推进 [6][41] - 与2024年相比,2025年机器人更“抗造”,能完成跳舞、打武术等复杂动作,软硬件在局部运动控制层面趋于成熟 [7][42] 2025年关键技术突破 - **局部运动控制**:LocoFormer技术实现跨本体局部运动控制,价值巨大 [8][42] - **远程操作**:AnyTracker应用使机器人能像“身外化身”一样精准复刻人动作,时延和稳定性好 [8][42] - **整体鲁棒性**:机器人安全性与可靠性提升,可在人员密集场景活动,交付市场规模扩大,成本更可控 [9][43] - **大模型赋能**:机器人简单任务成功率从60%-90%提升至100%,复杂任务成功率也在稳步提升 [10][43] - **视觉语言导航(VLN)**:策略收敛,机器人开始能理解并遵守无法穷尽编写的规则(如绕开草坪) [11][44] - **操作控制**:单点任务成功率实现100%突破,多任务成功率稳步提升 [11][44] - **技术架构**:出现VG-EPA、VG-1/2等新路径,VLA与RL结合使机器人能完成穿鞋带、榨橙汁等高难任务(榨橙汁成功率论文展示接近100%) [12][45] 世界模型与数据瓶颈 - 世界模型核心价值在于能极快、极大规模生成“数据金字塔”第一层的有效数据(如视频、3D建模),解决具身智能模型需要百万级小时视频数据的采集成本与速度难题 [13][46] - 世界模型有潜力替代部分物理仿真引擎,解决仿真环境到真实机器人部署的操作控制(Manipulation)问题,对构建基础模型非常重要 [14][47] - 仿真合成数据意义在于补充数据多样性,支撑基础模型训练,即使牺牲部分精度也值得 [14][47] - 数据工厂聚焦真机数据,服务于数据金字塔第二、三层,用于模仿学习等场景,与仿真数据方案解决不同问题 [15][48] - 行业核心困境是缺少优质基础模型,而好模型离不开海量数据支撑 [16][49] 硬件发展现状与制约 - 需重点发展的硬件方向包括:球形关节、耐磨与抗蠕变材料、非永磁体高密度电机 [18][50] - 灵巧手主要有腱绳传动、连杆传动、齿轮传动、软体驱动等六种技术路径 [18][51] - 球形关节优势是用一个关节替代三个电机,实现轻量化、缩小尺寸并降低成本 [18][51] - 抗蠕变材料是腱绳传动(如Optimus Gen 3采用)路线的刚需,目前材料发展仍需时间 [18][51] - 非永磁体高密度电机核心痛点是发热和热衰减,传统永磁体电机温度超过70度会出现磁性减弱和扭矩失效 [19][52] - 传感器存在噪声、蠕变和热稳定性问题,且面临成本高、产量未规模化及电机热干扰等挑战 [19][52] - 抗蠕变材料如钨丝绳成本高达一米100元,聚乙烯则易变形,仍需创新 [20][53] - 高密度电机领域已有突破,轴向磁通电机正逐步成熟爬坡,传感器精度、成本和产量在逐年提升 [20][53] 大规模落地面临的挑战 - **成本高昂**:高性能工控电脑需几万元,优质灵巧手价格在1万至5万元区间 [21][54] - **产品定义不清**:工厂等场景投入产出比、效率优势未经过核算,陪伴类机器人也因成本高导致用户价值感知模糊 [21][54] - **技术路径未收敛**:软硬件结合、模型架构与数据飞轮迭代设计未整合,导致供应链难以针对性配套 [22][55] - **市场与运维体系缺失**:用户价值感知模糊,产品易出故障且缺乏完善维修服务 [22][55] 公司战略与未来技术路线 - 乐享科技团队核心发力点是打造面向家庭用户的功能性产品 [24][38][57] - 战略思路是将家庭当作工厂,通过先进空间感知技术构建家庭信息化体系,再整合自动化控制,最终过渡到智能化 [24][57] - 该时代下具身智能领域最应抓住落地和数据两件事,通过产品实现技术落地并低成本回收数据形成闭环 [24][57] - 不认同“通用智能体统一天下”或大量“专用智能体”组成的生态系统,更看好“多机异构”技术路线,即多个不同类型机器人协同工作 [25][28][58][60] 商业模式创新 - **机器人即服务(RAAS)**:按使用次数或任务量收费,在工厂、中央厨房、机器狗/无人机送货演出等场景已成熟落地 [29][61] - **租赁模式**:按天、月或年租赁,可盘活科研实验室等场景的闲置机器人设备 [29][61] - **软件费加服务费**:以极低成本价出售机器人整机作为“低价入口”,核心利润来自软件授权和后续OTA升级服务费,例如Tech 1x以2万美金价格让机器人进入家庭以回收数据 [30][62] 全球竞争格局与中国公司展望 - 国际巨头优势在于算力、芯片、模型算法研究、全球人才虹吸及更大的初创公司融资规模 [31][62] - 中国优势集中在能源、硬件制造、市场活力、极强的落地和工程能力以及完备的制造业链条 [31][63] - 2026年竞争,中国公司核心赛点在于产品落地与数据闭环,通过产品进入用户场景获取低成本真实数据反哺模型 [32][63] - 相信世界上第一款能大面积铺开的具身智能落地产品很可能在中国出现 [32][37][63] 对从业者的建议 - 当前是投身具身智能领域的最佳时机,赛道处于成长期,技术路线未定,充满机会 [33][64] - 建议找到热爱方向,大胆尝试,以极高执行速度快速迭代,遵循“尽早测试、快速试错、更快学习”策略 [33][64]
独家对话前华为天才少年李元庆:首款规模化具身智能产品中国造!多机异构是未来方向
AI前线· 2026-01-04 18:23
核心观点 - 前华为天才少年、具身智能领域顶尖人才李元庆已正式加入乐享科技,将负责创新业务战略规划与核心技术攻关 [2] - 李元庆认为,具身智能领域最应抓住“落地”和“数据”两件事,其团队核心发力点是打造一款面向家庭用户的功能性产品 [3] - 李元庆判断,世界上第一款能大面积铺开的具身智能落地产品很可能在中国出现,并认为“多机异构”技术路线是具身智能未来的发展方向 [3][29] 行业发展趋势与驱动因素 - 2025年机器人领域投资热潮持续,其核心驱动因素是市场对未来确定性的预期,以及一二级市场的联动 [6] - 二级市场公司布局机器人领域,旨在为传统制造业赋能、进行市值管理打造第二增长曲线,以及盘活现有团队 [6][7] - 技术成熟度取得关键突破,与2024年相比,2025年机器人在稳定性、可靠性上显著提升,正从技术演示阶段向产品化方向推进 [7][8] - 机器人局部运动控制技术已越来越成熟,发展速度快,正朝着产品化落地方向推进 [11] 2025年关键技术突破 - **局部运动控制**:LocoFormer技术能让机器人实现跨本体的局部运动控制,价值巨大 [8] - **远程操作**:AnyTracker相关应用能让机器人像“身外化身”一样精准复刻人类动作,时延和稳定性表现突出 [8] - **任务成功率**:机器人已具备简单任务100%完成的能力,复杂任务成功率也在稳步提升,证明了落地应用的可行性 [10][11] - **视觉语言导航**:VLN策略在收敛,机器人开始能理解规则(如绕开草坪),这得益于大模型的灌输 [11] - **操作控制**:单点任务成功率从过去的60%-90%提升至100%,多任务成功率也在稳步提升 [11] - **技术架构融合**:行业开始将视觉语言动作模型与强化学习结合,使机器人能完成穿鞋带、榨橙汁等高难度任务,其中榨橙汁成功率在论文展示场景中已接近100% [12] 世界模型与数据瓶颈 - **世界模型的核心价值**:能极快、极大规模地生成数据金字塔第一层(视频、网络数据)的有效数据,用于构建基础模型所需的数据资产库,解决百万级小时视频数据采集成本高、速度慢的问题 [14] - **世界模型的潜力**:有潜力替代部分物理仿真引擎,模拟摩擦力学、动力学等,但目前操作控制层面的效果尚未完全显现 [15] - **仿真合成数据的意义**:能补充数据多样性,对训练基础模型至关重要,是许多技术方向探索的前提 [15] - **数据工厂的定位**:聚焦于采集真机数据,服务于数据金字塔的第二层和第三层,用于模仿学习等场景,以解决仿真拟合不准确的问题 [16] - **行业核心困境**:缺少优质的基础模型,而好的基础模型又离不开海量数据的支撑,目前技术远未满足规模化应用需求 [17] 硬件发展现状与挑战 - **关键发展方向**:球形关节、耐磨抗蠕变材料、非永磁体的高密度电机是亟待突破的方向 [18] - **球形关节优势**:用一个球形关节可替代三个电机,有助于实现机器人轻量化、缩小整机尺寸并降低成本 [19] - **灵巧手技术路径**:主要有腱绳传动、连杆传动、齿轮传动、软体驱动等六种路径,李元庆个人更看好三指灵巧手方案 [18][20] - **电机核心痛点**:传统永磁体电机存在热衰减问题,温度超过70度会导致磁性减弱、扭矩传导失效,行业正在探索轴向磁通电机等新路线 [19] - **传感器现状**:已有能达到精度要求的产品,但面临成本高、产量未规模化、以及电机发热带来的热干扰等挑战 [20] - **材料成本难题**:例如,抗蠕变材料中尝试的钨丝绳成本高达一米100元人民币,而聚乙烯材料则容易变形拉长 [21] 大规模落地的主要制约 - **成本高昂**:核心部件价格居高不下,如高性能工控电脑需数万元,优质灵巧手价格在1万至5万元人民币之间 [22] - **产品定义模糊**:场景化的产品定义不清晰,例如工厂场景中,人形机器人的投入产出比、工作效率等优势尚未明确 [23] - **技术路径未收敛**:软硬件技术路径结合尚未完全收敛,模型架构与数据的迭代设计也未做好整合 [23] - **供应链配套困难**:由于技术路线不清晰,导致供应链难以针对性地满足电机等部件多样化、定制化的需求 [23] - **市场与运维体系缺失**:产品完整生命周期的市场和运维体系尚未建立,用户价值感知模糊,且缺乏完善的维修服务 [23] 未来战略与产品方向 - **核心发力点**:团队将打造一款面向家庭用户的功能性产品,通过产品落地实现技术落地和数据低成本回收闭环 [3][26] - **家庭场景信息化**:思路是将家庭视为工厂,先通过空间感知技术搭建家庭信息化体系,再结合自动化控制实现操作与导航,最终过渡到智能化 [26] - **未来形态判断**:不认同“通用智能体统一天下”或大量“专用智能体”的路径,更倾向于《机器人总动员》式的多机异构协作模式,即多个各有所长的机器人协同工作 [26][27][28] - **理论支撑**:从自然生态系统和人类社会分工协作的规律推论,多机异构是更稳定、高效的未来形态 [28] 商业模式创新 - **机器人即服务**:RAAS模式已成熟落地,按使用次数或任务量收费,应用于工厂、中央厨房、机器狗送货等场景 [29] - **租赁模式**:按天、月或年租赁机器人,已在闲鱼等平台出现,用于盘活科研设备在商场表演等闲置时段 [29] - **软硬件组合模式**:以极低的硬件成本价作为入口,核心利润来自软件授权和后续OTA升级服务费,例如Tech 1x以2万美元价格让人形机器人进入家庭,旨在回收场景数据 [30] 全球竞争格局与中国优势 - **国际巨头优势**:在算力、芯片、模型算法研究上领先,能虹吸全球人才,初创公司融资规模远大于国内 [31] - **中国公司优势**:集中在能源、硬件制造、市场活力以及强大的工程落地和制造业链条上,能快速将技术转化为产品 [31] - **2026年核心赛点**:对中国公司而言,关键在于产品落地与数据闭环,通过产品进入用户场景沉淀真实数据,反哺模型迭代 [32] - **长期信心**:中国在基础设施和能源建设上全球领先,相信第一款能大面积铺开的具身智能落地产品很可能在中国出现 [32] 对从业者的建议 - **时代机遇**:当前是投身具身智能领域的绝佳时机,赛道处于成长期,技术路线未定,处处是机会 [33] - **行动策略**:建议找到热爱方向,大胆尝试,以极高执行速度快速迭代,遵循“尽早测试、快速试错、更快学习”的原则 [33]
李飞飞踢馆游戏圈:Unity们,该退场了
36氪· 2026-01-04 17:35
行业现状与挑战 - 全球游戏行业产值高达1900亿美元,但正面临发展僵局[1] - 3A大作的研发成本动辄几十亿美元,开发周期漫长,例如《原神》研发4年且年运营成本超2亿美元,《GTA6》距前作发布已过去12年[1] - 高成本与长周期给开发者带来重负,导致灵感枯竭[1] AI技术带来的效率革命 - AI技术正大幅提升游戏开发效率,Game Gears公司首席执行官证实,在开发《Aliens vs Zombies: Invasion》等作品时,AI将开发速度提升了4倍[3][4] - 原本需要数月完成的建模和关卡设计,被压缩至以“周”甚至“天”为单位[4] - 这种效率提升使得小型团队有望达到千人工作室的产出水平,预示着游戏行业“重工业时代”的终结[8] 世界模型的核心原理与优势 - 以Google DeepMind的Genie 3和李飞飞World Labs的Marble模型为代表的世界模型,能够通过观察海量视频数据学习“物理直觉”,理解并重构3D物理空间[3][6][11] - 与传统游戏引擎(如Unreal/Unity)依赖预设规则和复杂代码不同,世界模型能自上而下地理解重力、摩擦力、光线折射等物理现象,无需人工定义[9][11] - 世界模型生成的3D环境不仅具有视觉深度,更拥有内在逻辑,使得物理模拟变得自然,大幅减少了所需的代码量和算力[6][8] 技术应用与行业范式转变 - Genie 3能根据一张照片生成拥有实时物理交互能力的3D环境,其生成内容的分辨率达720p,交互可持续数分钟,且延迟为实时[15][16] - 相比前代Genie 2,Genie 3在一致性、真实性和交互能力上均有显著提升[16][17] - 技术使游戏引擎从复杂软件转变为能听懂人类意图的“数字容器”,将开发者从繁琐的重复性工作中解放出来,使其能更专注于创意和“寻找乐趣”[12][14][21] 行业影响与未来展望 - AI技术降低了游戏创作门槛,使个性化游戏生产变得简单,未来游戏可能从标准化商品转变为随心生长、具备物理灵魂的生命体[17][22] - 技术有潜力让用户成为“造物主”,利用想象力在3D空间中复刻记忆或创造世界,使游戏成为个人情感的延伸[19] - 该变革也引发争议,欧洲部分工会担忧AI工具会威胁艺术家生计,并可能导致游戏世界被低质量的“AI废料”淹没[20]
LeCun曝Meta作弊刷榜,田渊栋:我没想到这个结局
量子位· 2026-01-04 13:21
Meta内部管理与Llama 4事件 - 公司为应对竞争压力,要求GenAI部门加速AI开发和部署,并调派原FAIR团队人员参与Llama 4项目[6] - 团队内部沟通破裂,管理层倾向于已验证的、可直接落地的技术,而研究团队希望探索新方向[7] - Llama 4在基准测试中存在结果被篡改的问题,团队对不同基准测试使用了不同的模型以获取更好结果[1] - Llama 4项目表现不佳且涉及排行榜造假,导致管理层对团队失去信心,并将相关人员边缘化[10] - 事件引发公司团队大换血,一方面天价从外部挖人,另一方面大刀阔斧裁减老员工[11] 关键人物动态:田渊栋 - 田渊栋及其团队在一月份被临时调入Llama 4项目救火,十月份在Llama 4.5训练完成后即被裁撤[13] - 团队被迫放下原有工作,在距离发布截止日期仅剩2个月的情况下接手项目并处理所有棘手工作[14] - 田渊栋曾预想四种可能结局,但最终遭遇第五种结局:未被问责,但整个团队被裁撤[15][16] - 田渊栋在Meta工作十多年,近年已抱有“公司快把我开了吧”的心态,此次变动为其小说创作提供了新素材[18] - 在强化学习与大模型推理方面取得新探索,包括连续隐空间推理(coconut)、Token Assorted、DeepConf、ThreadWeaver等方法提升推理效率,并在可解释性方面研究Grokking现象[19] - 田渊栋已正式宣布创业,将担任一家新初创公司的联合创始人,并拒绝了其他大厂的邀请[33] 关键人物动态:LeCun - LeCun离职后批评公司对大语言模型(LLM)过度沉迷,尤其点名批评新挖来的超级智能实验室成员年轻且缺乏经验[22][23] - LeCun认为LLM本质受限于语言,是实现人类水平智能的“死胡同”,强调需通过世界模型理解物理世界规律[25][26] - LeCun创立新公司Advanced Machine Intelligence (AMI),全力投入开源世界模型研发,其本人担任执行主席而非CEO[27][28][29] - 新公司研究聚焦于V-JEPA架构,旨在通过视频和空间数据学习理解物理世界,使AI具备规划、推理和长期记忆能力[32] - LeCun预计将在12个月内见证该技术的初始版本,并在近几年内实现大规模进展[32] 行业竞争与影响 - DeepSeek的横空出世给公司带来巨大压力,导致Llama 4在发布前即被视为落后,促使公司疯狂加码AI投资[4][5] - 公司内部因竞争压力和高层决策,引发了核心研究人员离职并转向创业的浪潮[3]