Workflow
世界模型
icon
搜索文档
腾讯研究院AI速递 20260126
腾讯研究院· 2026-01-26 00:01
OpenAI Codex技术进展 - OpenAI预告下周起将发布Codex相关重磅内容,并发布技术博客揭秘其CLI核心架构——智能体循环 [1] - 智能体循环通过Responses API协调用户指令、模型推理与本地工具执行,采用“提示词前缀一致”策略触发缓存以优化性能 [1] - Codex支持零数据保留配置以保障隐私,并利用自动压缩技术管理上下文窗口 [1] 谷歌DeepMind动态4D重建技术突破 - 谷歌DeepMind发布D4RT,将3D重建、相机追踪、动态物体捕捉统一成“查询”动作,速度比现有SOTA快18至300倍 [2] - 核心技术是统一的时空查询接口,AI先全局“阅读”视频生成场景表征,再按需搜索任意像素的3D轨迹、深度和位姿 [2] - 该技术对具身智能、自动驾驶和AR意义重大,但训练仍需10亿参数模型和64个TPU [2] Claude产品功能升级 - Claude Code将内部“Todos”升级为“Tasks”,支持多会话或子代理协作完成跨越多个上下文窗口的长期复杂项目 [2] - Tasks存储在文件系统中便于多个会话协同,当一个会话更新Task时会广播给所有处理同一任务列表的会话 [2] - Anthropic推出Claude in Excel插件,支持Pro、Max、Team、Enterprise用户,基于Opus 4.5模型,能联网搜索并自动填充表格,支持读取公式、Debug错误、从零建模、制作透视表等功能 [6] 百度文心大模型发布 - 百度文心5.0正式版上线,参数量达2.4万亿,采用原生全模态统一建模技术,支持文本、图像、音频、视频的理解与生成 [3] - 在LMArena文本和视觉理解榜单五次登顶,进入全球第一梯队,语言与多模态理解能力稳居国际领先 [3] - 实测显示模型在复杂情感理解、弦外之音分析、创意写作等文科任务表现突出 [3] AI智能体与开源项目动态 - 开源项目Clawdbot在硅谷爆火,可在Mac mini上运行,兼具本地AI智能体和聊天网关双重身份,通过WhatsApp、iMessage等随时对话 [4] - Clawdbot解决了大模型记忆力痛点,能记住两周前的对话,还会主动推送邮件、日程提醒,并可直接操控电脑执行任务 [4] - 项目GitHub获9.2k星,最低月成本约25美元,用户反馈它能自动管理生意、写代码替代Zapier等付费服务 [4] AI研究新范式与行业观点 - 图灵奖得主LeCun创立的AMI Labs官宣核心方向为“世界模型”,旨在构建理解现实世界、具备持久记忆和推理规划能力的智能系统 [5] - 该路线认为仅靠预测下一个token无法真正理解现实,需在更高层次表征空间进行预测与推理,过滤不可预测的噪声信息 [5] - 谷歌云AI总监Addy Osmani警告“氛围编程”已撞南墙,AI能完成70%前期工作但剩余30%只有经验丰富的工程师能搞定,2026年真正核心竞争力是把模糊问题转化为明确执行意图、设计好上下文结构 [7] 科技巨头对AI发展的预测 - 马斯克预测2026年底前AI将超越人类智慧,到2030年AI将比全人类集体智慧更聪明,特斯拉明年底将开售人形机器人Optimus [8] - 微软CEO纳德拉警告若AI只消耗资源不改善结果社会会失去容忍,黄仁勋称具身智能是“一代人一次的机会” [9] - DeepMind CEO哈萨比斯认为AGI还需5-10年,Anthropic CEO达里奥称只差6-12个月模型就能端到端完成软件开发 [9]
2026北京两会|对话市政协委员王仲远:北京形成了人工智能闭环式产业生态
北京商报· 2026-01-25 19:17
行业发展阶段与核心趋势 - 人工智能产业经过三年快速发展,已从初期的技术探索与概念热潮,进入聚焦落地效能的务实发展阶段 [2] - 大语言模型等基础模型的研发步伐趋于平缓,产业重心正加速向应用端转移 [2][3] - 行业一个突出趋势是从单智能体向多智能体系统演进,通过多个智能体协同处理具体场景任务,其效果显著优于单一智能体,被视为技术深度融入实体经济的关键路径 [2][5] - 人工智能正加速突破数字世界边界,向物理世界延伸,技术从语言模型向多模态模型、世界模型升级,着力攻克时间空间认知、物理常识推理等核心难题 [2][5] 北京人工智能产业生态与优势 - 北京作为人工智能发展的核心阵地,凭借全栈式生态布局,形成了从底层算力芯片、中间层技术研发到顶层场景应用的完整闭环式产业生态 [2][3][5] - 2025年预计北京市人工智能核心产业规模达4500亿元,集聚企业超2500家,两项指标均约占全国半数 [3] - 北京人工智能领域有近60家上市企业和约40家独角兽企业,国内首个上市的国产AI芯片企业、大模型企业以及估值最高的AI独角兽企业均诞生于此 [3] - 人才优势突出,北京有148人入围“AI 2000全球最具影响力学者榜单”,占全国超40%,AI学者总量达1.5万人,占全国30% [3][5] - 拥有从顶尖高校到新型研发机构再到企业的完整人才培养与发展全链条,为人才提供了多样化的成长平台 [7] 政策支持与产业引导 - 北京的政策支持接地气且布局全面,既支持从0到1的颠覆式创新,也扶持前瞻性技术研发,同时助力企业推进场景落地,形成了全方位的支撑体系 [3][6] - 科研机构、企业与政策层面形成的合力,正推动多智能体等新技术加速突破场景壁垒、迈向商业闭环 [3] 未来发展方向与预期 - 行业当前更聚焦于务实解决问题,实现大模型的商业闭环被视为技术与产业实现高质量发展的关键 [9] - 未来核心方向是促进大模型落地应用,多智能体系统是重要抓手,有真实案例显示18个智能体组成的系统远超客户满意度 [8] - 对2026年成为中国智能体爆发的关键之年充满期待,建议通过开放政务等领域智能体技能库、开展竞赛等方式推动多智能体落地 [3][8] - 当大模型基础能力提升进入平缓期,便迎来了应用落地爆发的绝佳阶段 [9]
科学与健康丨AI时代,职业生态如何变化?
新华网· 2026-01-25 18:21
文章核心观点 - 人工智能正在加速重塑职业图景,创造新职业与新就业机会,同时对劳动者的复合型、应用型技能提出新要求,推动形成以人机协同、智能赋能为特征的就业新范式 [1][3][4] AI催生的新职业与新岗位 - AI训练师、AI产品经理、AI伦理审核员、借助AI生成内容的动画师等新岗位持续出现 [1][3] - 普华永道2025年全球AI就业晴雨表显示,全球几乎所有涉及AI应用的岗位数量都在增加 [3] - 58同城报告指出,平台已涌现近50类“人机协作”新岗位与40种智能新服务 [3] - 人形机器人产业的规模化发展,将在设计研发、生产制造、检测认证、保养维修、场景应用等产业链各环节创造大量新就业岗位 [5] AI带来的就业质量与薪酬变化 - 拥有AI技能的从业人员平均工资溢价达56%,是上年的两倍 [3] - AI通过赋能传统行业、催生新业态,为提升就业质量提供新支点 [4] AI驱动的创业与工作模式变革 - AI降低了创业门槛,“一人公司(OPC)”借助AI工具即可完成内容生产、产品运营和服务交付的模式逐渐兴起 [7] - 多地推出OPC相关社区和支持政策,“单人+AI”的创业模式正加速走向主流 [7] - OPC正从个体创作转向具备规模化能力的“超级个体”,未来五年有望成为数字经济的重要组成部分 [8] - “斜杠”可能是未来人们主要的生活方式之一,AI让人们可以快速进入不同领域,缩短从新手到专家的过程 [10] AI时代对人才能力的要求 - 对复合型、应用型人才的需求不断扩大 [3] - 人类的想象力、判断力、审美能力、批判性思维和情感互动能力,将成为人机协作中不可替代的优势 [8] - 未来人才培养应强化交叉学科素养和综合能力,同时加快完善AI新职业培训体系 [8] - 青年一代需建立以“AI思维”为核心的认知范式,提升驾驭AI的能力,并建立动态演进的知识体系,提升“跨学科融合+伦理引导”的未来竞争力 [10] - 应警惕过分依赖AI,在青少年教育阶段不宜过早使用AI,应优先锻炼独立学习能力,培养独特的想象力和视角 [10] AI技术发展趋势 - 具身智能、世界模型等技术方向加快突破,人工智能正从语言处理走向对物理世界的理解与建模 [3] - 北京智源人工智能研究院发布的《2026十大AI技术趋势》认为,行业技术范式正发生深刻变化 [3] - 具身智能推动人形机器人向更高自主性和更强人机协同能力发展,逐步进入真实应用场景 [5]
科学与健康|AI时代,职业生态如何变化?
新华社· 2026-01-25 18:17
文章核心观点 - 人工智能正在加速重塑职业图景,创造新职业与新创业范式,同时对劳动者的复合型技能与“AI思维”提出了更高要求 [1][2][3] AI创造的新职业与新机遇 - AI训练师、AI产品经理、AI伦理审核员、借助AI生成内容的动画师等新岗位持续出现,对复合型、应用型人才需求扩大 [1][2] - 普华永道2025年全球AI就业晴雨表显示,全球几乎所有涉及AI应用的岗位数量都在增加,拥有AI技能的从业人员平均工资溢价达56%,是上年的两倍 [2] - 58同城报告指出,平台已涌现近50类“人机协作”新岗位与40种智能新服务 [2] - 具身智能推动人形机器人产业发展,将在设计研发、生产制造、检测认证、保养维修、场景应用等产业链各环节创造大量新就业岗位 [3] 技术范式变革与行业影响 - 人工智能正从语言处理走向对物理世界的理解与建模,行业技术范式正发生深刻变化 [3] - AI正成为智能社会的重要基础设施,通过赋能传统行业、催生新业态,为提升就业质量提供新支点 [3] - “一人公司(OPC)”借助AI工具完成内容生产、产品运营和服务交付,正从个体创作转向具备规模化能力的“超级个体”,未来五年有望成为数字经济的重要组成部分 [3][4] - 从苏州提出打造OPC创业首选城市,到多地推出相关社区和支持政策,“单人+AI”的创业模式正加速走向主流 [3] AI时代的人才需求与核心竞争力 - 在人机协作背景下,人类的想象力、判断力、审美能力、批判性思维和情感互动能力将成为不可替代的核心竞争力 [5] - 未来人才培养应强化交叉学科素养和综合能力,同时加快完善AI新职业培训体系,帮助劳动者顺利转型 [6] - “斜杠”可能成为未来主要生活方式之一,为避免单一技能依赖、提升抗风险能力,需提升综合能力,AI的出现也大大缩短了从新手到专家的过程 [6] - 青年一代需建立以“AI思维”为核心的认知范式,提升驾驭AI的能力,并建立动态演进的知识体系,提升“跨学科融合+伦理引导”的未来竞争力 [6]
李飞飞世界模型公司一年估值暴涨5倍!正洽谈新一轮5亿美元融资
量子位· 2026-01-25 14:00
World Labs新一轮融资与估值跃升 - 公司正在以约50亿美元估值进行新一轮融资,融资规模最高可达5亿美元[1] - 若融资完成,公司估值将从2024年的10亿美元跃升至50亿美元,实现一年多时间5倍重估[2] - 此前公司已完成累计2.3亿美元融资,估值达到10亿美元[2] - 公司成立于2024年4月,当月完成首轮融资,估值约2亿美元[2] 公司历史融资与投资方 - 首轮投资方包括Andreessen Horowitz(a16z)和加拿大投资机构Radical Ventures[5] - 2024年6–7月,公司完成一轮1亿美元融资,由NEA领投,估值被抬升至超过10亿美元[5] - 历史投资方还包括英伟达、沙特阿拉伯的Sanabil Investments、新加坡主权基金淡马锡[5] - 个人投资者包括Google首席科学家Jeff Dean、演员兼投资人Ashton Kutcher、AI教父Geoffrey Hinton[6] 公司核心业务:世界模型 - 公司正在研发能够在三维世界中进行导航和决策的AI系统,构建“大世界模型”[8] - 目标并非“生成一张好看的图”,而是让模型真正理解真实物理世界的结构与演化方式[9] - 世界模型被视为继大语言模型之后,AI下一个十年的核心主线,是一种“基础设施型能力”[16][17] 产品与技术:Marble与World API - 公司于去年11月推出首款3D世界生成模型Marble[10] - Marble可以根据文本或图像提示,直接生成可探索的3D世界[12] - 技术采用3D高斯溅射,用数以百万计的半透明点表示场景结构,在保持较高渲染效率的同时实现更细腻的视觉效果[14] - Marble同时输出“碰撞网格”,专门用于物理仿真和机器人模拟[15] - 提供Chisel工具,用户可先用简单几何体快速搭建骨架,再生成不同风格的细节版本[15] - 公司近期开放了World API,开发者可通过文本、图像或视频直接生成可探索的3D世界[15] 世界模型的应用前景与能力框架 - 真正具备空间智能的世界模型需要三种能力:生成、多模态、交互[22] - 生成能力指能创造遵守物理定律、空间一致的世界[22] - 多模态能力指能处理从图像、视频到动作的多模态输入[22] - 交互能力指能预测世界随时间演变或互动的状态[22] - 应用方向包括AIGC(如3D资产生成、游戏世界构建、影视制作)和具身智能(如机器人、仿真环境)[22] - 以具身智能为例,世界模型提供对环境的可预测表示,是叠加有效决策与控制的基础[18] 行业竞争格局与技术路线 - 前Meta首席科学家Yann LeCun创办的AMI Labs传闻融资估值可能达到35亿美元[20] - LeCun的路线更偏向“内在认知”,采用隐式世界模型,基于JEPA在抽象的潜在空间中预测世界演化,而非还原每一个像素[21] - 世界模型技术版图大致分三层:可观看、可编辑的世界界面(如Marble);可反复试错的模拟器(如谷歌DeepMind的Genie 3);以状态与预测为核心的认知世界模型(如LeCun的JEPA路线)[27][24] - 资本押注的是对不同世界模型技术路径的提前下注[24]
死磕机器人大脑的北大副教授,和我们聊了聊具身领域最大的“偏见”
36氪· 2026-01-24 21:35
行业趋势:软硬分化 - 行业核心观点为“软硬分化”,即模型大脑与机器人本体由不同公司各司其职,与当前多数高估值公司追求的“软硬一体”全栈模式形成对比 [1] - 2026年初美国机器人模型公司Skild AI完成14亿美元C轮融资,估值翻三倍至超140亿美元,成为千亿独角兽,为一二级市场重新定价纯模型公司开了好头 [2] - 纯自研一个具身模型年开销高达数千万甚至上亿元,而外采一台机器人“大脑”的一次性成本仅需几万元,经济账促使行业审视全栈路线的性价比 [8] - 技术栈过长,模型与硬件是两套能力体系,一家公司难以两头做深,过去一年出现为融资而“套壳”做Demo但无法真实落地的公司,促使创业者重新思考路线 [9] - 行业正逐渐意识到本体公司自研模型本质是商业行为,随着更多机器人本体公司寻求合作,具身模型公司的估值正变得越来越贵 [14] 公司战略与产品 - 智在无界选择逆势专注研发机器人大脑(模型),不涉足硬件制造,并于近日完成数千万元天使轮融资 [1] - 公司目标是证明模型公司的价值,研发跨品牌、跨形态的具身智能模型,让硬件公司无需背负整个技术栈 [3] - 已推出灵巧手操作模型Being-H系列,最新发布的Being-H0.5模型可控制30种不同机器人,并能端侧部署在英伟达Orin-NX等小型芯片上实时运行 [3] - 正在研发用于控制双足机器人移动和操作的模型Being-M系列,这是一个多模态移动操作模型,训练数据包括对齐的第一人称、第三人称视频及动捕数据 [29] - 公司客户包括PND、灵心巧手等硬件公司,通过提供模型及增值服务Being-Dex,可实现机器人“开箱即用”及数小时学会新任务 [4] 技术核心:数据与训练 - 公司能力的核心在于拥有超3万小时预训练数据,据称为当前全球规模最大的具身智能模型预训练数据集 [5] - 采用独特的“人类动作视频”方案,通过头戴摄像头录制第一视角手部动作视频,具有数据规模大、成本低、能记录复杂操作的优点 [5] - 该数据方案早于业界共识,公司于2023年底开始使用,2025年七八月推出首个灵巧手模型Being-H0,使用了约100万条第一人称视角人手操作视频 [21] - 公司判断,数据规模需达到100万小时量级,机器人才更可能具备快速学习复杂新任务的真正泛化能力,预计该量级在2027年可达 [24] - 在“预训练-后训练”框架中,预训练阶段用大量人类视频让模型模仿人类;后训练阶段将信息与物理空间对齐,适配不同本体,并探索融入触觉等多模态信息 [26][27][28] 模型性能与现状 - 新发布的Being-H0.5模型在泛化性及跨本体性能上较半年前的Being-H0有非常大提升,其预训练融合了30种不同构型本体的真机数据 [31][33] - Being-H0.5展示出优秀的跨本体泛化能力,例如用宇树G1采集数据训练出的模型,首次上机即能让PND的Adam-U成功执行同一任务 [33] - 当前行业核心卡点在泛化性,具身智能远未达到可落地真干活水平,许多“工业场景落地”仍停留在演示或短周期概念验证阶段 [19] - 泛化性不足的原因部分在于硬件(如缺稳定好用的高自由度灵巧手及触觉反馈),部分在于模型(行业尚未研发出真正能干活的灵巧手模型) [20] - 行业内存在公司套壳其他模型(如PI 0.5)仅做后训练即宣称自研的情况,同时Demo拍摄可能存在技巧(如实为遥操作),与真实落地能力有差距 [35][36] 商业化与市场展望 - 公司当前收费模式为按机器人收取一次性License费用,范围在几万至十万元,另提供按数据量收费的后训练服务Being-Dex [16] - 当硬件公司出货量达到一定程度,可转为类似SaaS年包的付费方式,未来模型公司将存在竞争,可防止对硬件公司“坐地起价” [16] - 公司创始人认为,若技术收敛至通用模型阶段,机器人进入家庭,模型公司的市场将更大,甚至可做To C业务,公司也可能通过OEM涉足机器人产品 [17] - 创始人认为模型能力产生质变不会是循序渐进的过程,可能需要基于方法或模型层面的变化 [32] - 对于热点“世界模型”,认为若仅作为训练中的数据生成器可行,但若用于直接部署控制机器人则极其复杂且消耗算力,目前难度很大 [38][39]
估值35亿美元,LeCun创业公司官宣核心方向,掀起对Next-token范式的「叛变」
机器之心· 2026-01-24 12:09
公司核心方向与技术愿景 - 公司核心方向是开发“世界模型”,旨在构建能够理解现实世界的智能系统 [1] - 世界模型是一种能够准确反映现实动态的新型人工智能架构,旨在解决当前大模型在处理真实世界感知数据时的根本性挑战 [2] - 该模型将不再执着于逐像素生成现实,而是学会对真实世界传感器数据进行抽象建模,过滤掉不可预测的噪声,并在更高层次的表征空间中进行预测与推理 [2] 世界模型的关键能力与应用领域 - 世界模型应同时具备四项关键能力:理解真实世界、拥有持久记忆、能够进行推理与规划、以及可控且安全 [5] - 公司进一步提出“带动作条件的世界模型”,该模型能够预估智能体采取行动后的结果,并在安全约束内规划行动序列以完成任务 [3] - 其目标不仅是理解世界,更是让AI能够在真实世界中可靠地行动 [4] - 应用方向高度聚焦于对可靠性、可控性和安全性要求极高的领域,包括工业流程控制、自动化系统、可穿戴设备、机器人与医疗健康等场景 [4][18] 对现有AI范式的批判与替代路径 - 公司创始人Yann LeCun对现有大语言模型的发展持怀疑态度,认为仅靠预测下一个token的生成式模型无法真正做到理解现实世界 [2] - LeCun批评大语言模型依赖next-token预测的方式本质上是在猜答案,而真正的智能应建立在目标驱动与能量最小化的机制之上 [8] - 他认为,如果一个系统无法提前预测自身行为可能带来的后果,就无法构建真正的智能体系统 [11] - 公司被视为对大语言模型的一种逆向投资,旨在解决LLM的局限性(如幻觉问题),尤其是在医疗等高风险领域 [17] 行业背景与竞争格局 - 构建连接AI与现实世界的基础模型,已成为AI领域最令人兴奋的探索方向之一,正吸引顶尖科学家和资金雄厚的投资者持续加码 [13] - 由AI先驱李飞飞创立的World Labs在推出首款产品Marble后估值飙升,据报道正在洽谈新一轮融资,估值达50亿美元 [13] - 整个AI行业几乎被大语言模型所占据,很少有公司敢于走一条不同的路 [9] - Meta选择了全面押注大语言模型,这与LeCun的研究方向不同 [10] 公司融资与估值情况 - 有传言称公司可能正以35亿美元估值进行融资 [14] - 正在与公司洽谈的风投机构包括Cathay Innovation、Greycroft、Hiro Capital,其他潜在投资者还包括20VC、Bpifrance、Daphni和HV Capital [14] 公司治理与团队构成 - Yann LeCun担任公司的执行董事长,而非首席执行官 [14] - 首席执行官由Alex LeBrun担任,他此前是医疗AI初创公司Nabla的联合创始人兼首席执行官 [14] - Alex LeBrun转任源于Nabla与公司的一项合作,Nabla获得了对公司世界模型的“优先访问权” [16] - 公司CEO身边有许多熟悉面孔,包括曾在Meta的FAIR实验室工作的人员,以及据传将加入的前Meta欧洲区副总裁Laurent Solly [16] - 前雇主Meta很可能成为公司的首个客户 [16] 技术路线的行业印证 - 硅谷初创公司Logical Intelligence任命Yann LeCun为其技术研究委员会创始主席,其技术路线与LeCun倡导的思路高度一致 [7] - Logical Intelligence推出的能量-推理模型Kona,宣称其性能比OpenAI的GPT-5和谷歌的Gemini更准确,功耗也更低 [8] - Kona采用基于能量的推理模型,通过根据约束条件进行评分来验证和优化解决方案,从而找到能量最低(最一致)的结果 [8] - 无论是Logical Intelligence的能量推理模型,还是公司的世界模型,本质上都指向同一个方向:跳出语言生成范式,转向能够理解、预测并作用于真实世界的智能系统 [8] 公司运营与未来计划 - 公司计划将其技术授权给行业合作伙伴以用于实际应用 [18] - 同时计划通过公开出版物和开源项目,与全球学术研究界共同构建AI的未来 [18] - Yann LeCun计划保留在纽约大学的教授职位 [19] - 公司将成为一家总部位于巴黎的全球性公司 [20]
量产元年之后 中国人形机器人走向“价值战”
新京报· 2026-01-23 22:36
行业概览与规模 - 2025年被视为中国人形机器人的“量产元年”,国内整机企业数量超过140家,发布产品超过330款 [1] - 行业在技术、产品迭代、量产交付、场景落地等方面取得进展,产业规模与活力持续释放 [1] - 2025年,消费级机型价格下探至万元级别,工业领域亿元订单频出 [1] - 2026年预计将成为行业规模化放量和商业化加速的关键转折点,行业整合将加速 [1] 产品分层与价格下探 - 消费级产品进入万元区间,如松延动力的“小布米”售价9998元,定位娱乐陪伴、教育、展览展示 [2] - 宇树科技Unitree R1机器人起售价2.99万元,集成多模态大模型,适配教育、展示等场景 [2] - 加速进化Booster K1入门级具身开发平台起售价2.99万元,面向开发者市场 [2] - 轮式与双足形态并行发展,轮式机器人凭借高稳定性在服务业表现突出,如星动纪元的Q5轮式服务机器人 [2] 工业应用与技术突破 - 工业旗舰机型成为技术实力展示窗口,如优必选Walker S2支持自主换电和群体协同,已进入汽车制造、智慧物流等领域实训 [3] - 千寻智能Moz1是国内首个高精度全身力控人形机器人,负载自重比达到1:1,已在宁德时代新能源电池生产线上应用 [3] - 核心零部件进一步国产化,灵巧手、一体化关节、行星滚柱丝杠等“卡脖子”环节预计2026年为降本和规模化提供支撑 [3] - 慧灵科技的eHand-6灵巧手价格已下探至2999元 [3] 技术发展:“大脑”与“小脑” - 行业竞争焦点转向“大脑”与“小脑”协同和AI能力比拼,端到端具身大模型与世界模型的融合成为技术进化核心方向 [4] - 端到端的VLA大模型正成为具身智能领域主流技术路径,世界模型应用于机器人推演能力训练 [4] - 自变量发布的WALL-A模型首创VLA与世界模型深度融合,提升了机器人在非结构化环境中的零样本泛化能力 [5] - 数据与模型是行业面临的核心瓶颈,缺乏数据是端到端具身大模型发展的主要瓶颈 [5] 量产进展与出货数据 - 2025年智元机器人年度出货量超过5100台 [6] - 宇树科技2025年人形机器人实际出货量超5500台,本体量产下线超6500台 [6] - 优必选2025年全年交付超500台,产能突破1000台 [6] - 2026年企业积极规划产能扩张,智元机器人称出货量可达数万台,优必选预计产能提升至万台规模 [6] 商业化落地与场景探索 - 工业场景成为绝对主战场,优必选披露2025年人形机器人全年订单近14亿元,Walker S2交付超500台 [7] - 智元机器人与龙旗科技合作,计划在消费电子精密制造场景部署近千台机器人 [7] - 银河通用与百达精工合作,计划部署超过1000台具身智能机器人 [7] - 文旅、零售与服务领域探索商业模式,如智平方的“智魔方”已落地商超,其机器人可进行咖啡制作、零售导购 [7] - 家庭与商用陪伴领域,傅利叶GR-3具备情感化交互,乐享科技推出全线产品强调“陪伴”和情感联结 [7] 行业挑战与未来展望 - 商业化进程面临挑战,目前大多数人形机器人仍以展示、表演为主,缺乏类人的自主学习和延伸能力 [8] - “速度”与“泡沫”需要平衡,技术路线、商业化模式、应用场景等方面尚未完全成熟 [8] - 国内已有超过150家人形机器人企业,半数以上为初创或“跨行”入局,需防范产品“扎堆”上市等风险 [8] - 政策将持续推动技术创新,布局国家科技重大项目,提升大模型、一体化关节、算力芯片等技术 [9] - 行业洗牌将成为必然趋势,到2026年国内上百家公司中最终可能只留下10到20家 [9] - 资本市场逻辑将转向更现实的营收结构、毛利率、现金流与商业化路径,缺乏核心技术的企业将面临挑战 [10] - 未来胜出公司分为两类:将硬件成本控制到极致的本体企业,以及专注于“大脑”的软件公司 [10] - 2026年是检验行业商业化能力的关键一年,关键在于谁能率先找到大规模应用场景,实现自我造血 [10] 主要厂商及产品列表 - 宇树科技:产品包括R1、H2、G1-D [12][13] - 智元机器人:产品包括精灵G2、灵犀X2 [13][14] - 加速进化:产品包括Booster K1 [15] - 星动纪元:产品包括星动L7、星动Q5 [16] - 千寻智能:产品包括Moz1 [17][18] - 傅利叶智能:产品包括GR-3、Fourier N1 [19] - 优必选:产品包括Walker S2、Cruzr S2 [20][21] - 北京人形机器人创新中心:产品包括具身天工2.0、天轶2.0 [24] - 松延动力:产品包括N2、EJ、小布米 [25] - 越疆科技:产品包括Dobot Atom [26] - 其他列出的厂商还包括云深处科技、擎朗智能、魔法原子、光谷东智、灵宝CASBOT、星尘智能、上纬新材、鹿明机器人、乐享科技、众擎科技、源络科技、星海图、动易科技、普渡科技、智平方、跨纬智能、赛博格、帕西尼、逐际动力等 [17][19][20][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39]
量产元年之后,中国人形机器人走向“价值战”
贝壳财经· 2026-01-23 22:07
产业规模与活力 - 2025年中国人形机器人产业超预期迭代演进,国内整机企业数量超过140家,发布产品超过330款 [1] - 2025年被视为“量产元年”,产业在技术、产品迭代、量产交付、场景落地等方面取得进展,产业规模与活力持续释放 [1] - 消费级机型价格下探至万元级别,工业领域亿元订单频出 [1] 产品分层与价格下探 - 2025年人形机器人产品定位呈现明显分层,消费级产品进入万元区间 [3] - 松延动力推出的“小布米”售价仅9998元,定位娱乐陪伴、教育、展览展示,成为全球首款万元级消费机器人 [3] - 宇树科技发布的Unitree R1机器人2.99万元起售,集成多模态大模型,适配教育、展示等场景 [3] - 加速进化推出的Booster K1入门级具身开发平台价格2.99万元起,面向开发者市场 [3] 技术形态与工业应用 - 轮式与双足形态并行发展,轮式机器人凭借高稳定性与部署灵活度在服务业表现突出 [3] - 星动纪元的Q5轮式服务机器人依托端到端具身大模型ERA-42,已在商场中开展实训 [3] - 工业旗舰机型成为技术实力核心展示窗口,优必选Walker S2支持自主换电与群体协同,已进入汽车制造、智慧物流等领域实训 [4] - 千寻智能的Moz1作为国内首个高精度全身力控人形机器人,负载自重比达到1:1,已在宁德时代新能源动力电池生产线上应用 [4] 核心零部件国产化 - 灵巧手、一体化关节、行星滚柱丝杠等“卡脖子”环节核心零部件进一步国产化 [4] - 慧灵科技的eHand-6灵巧手价格已经下探至2999元 [4] - 行星滚柱丝杠等高端零部件有国内企业突破垄断,逐步推进国产替代 [4] 技术焦点:“大脑”与“小脑” - 人形机器人的竞争焦点转向“大脑”与“小脑”协同和AI能力比拼 [5] - 端到端具身大模型与世界模型的融合应用成为技术进化核心方向之一 [5] - 端到端的VLA大模型正逐步成为具身智能领域主流技术路径,世界模型开始应用于机器人推演能力训练 [6] 模型发展与数据瓶颈 - 北京人形开源世界模型WoW和多模态具身通用模型Pelican-VL,为机器人提供了理解物理世界和进行复杂任务规划的能力基础 [6] - 基于“慧思开物”平台和跨本体VLA模型XR-1,具身天工2.0实现了全自主分拣零部件 [6] - 自变量发布自研的WALL-A模型,首创VLA与世界模型深度融合,提升了机器人在非结构化环境中的零样本泛化能力 [6] - 视觉输入的端到端具身大模型遇到的主要发展瓶颈是缺乏数据,数据成本高昂 [7] - 业内对于模型的关注度还不够,模型能力不足会影响数据使用效果 [8] 量产进展与产能规划 - 2025年多家企业具备了从几百台到几千台的量产出货能力 [8] - 智元机器人2025年度出货量超过5100台 [8] - 宇树科技2025年人形机器人实际出货量超5500台,本体量产下线超6500台 [8] - 优必选2025年全年交付超500台,产能突破1000台 [8] - 2026年行业有望迎来规模化放量,智元机器人称出货量可达数万台,优必选预计产能提升至万台规模 [8] 商业场景落地 - 工业场景成为绝对主战场,优必选披露2025年人形机器人全年订单近14亿元,Walker S2交付超500台 [9] - 智元机器人与龙旗科技合作,将在消费电子精密制造场景部署近千台机器人 [9] - 银河通用与百达精工合作,计划部署超过1000台具身智能机器人 [9] - 文旅、零售与服务领域探索商业模式,智平方的“智魔方”已落地商超,计划三年内在全国落地1000个站点 [9] - 家庭与商用陪伴领域,傅利叶GR-3具备情感化交互,乐享科技布局从大型通用机器人到家庭陪伴机器人的全线产品 [9] 行业挑战与洗牌预期 - 当前人形机器人在技术路线、商业化模式、应用场景等方面尚未完全成熟 [10] - 我国目前已有超过150家人形机器人企业,半数以上为初创或“跨行”入局 [10] - 行业洗牌将成为必然趋势,到2026年行业将进入洗牌期 [11] - 国内上百家人形机器人公司中,最终可能只留下10到20家 [11] - 2026年资本市场对企业的审视将全面转向营收结构、毛利率、现金流与商业化路径 [12] 政策支持与未来方向 - 下一步将持续推动人形机器人技术创新和迭代升级,以人形机器人为小切口带动具身智能大产业发展 [11] - 着力“攻技术”,布局国家科技重大项目,提升大模型、一体化关节、算力芯片等技术水平 [11] - 加速“壮生态”,强化国家人工智能产业投资基金支持力度,建设开源社区,发布综合标准化体系建设指南 [11] - 未来能够胜出的公司,一类是将硬件成本控制到极致的本体企业,另一类是专注于“大脑”的软件公司 [12] - 2026年是检验行业商业化能力的关键一年,关键在于谁能率先找到大规模应用场景,实现自我造血能力 [12]
在OpenAI“创新已经变得困难”,离职高管深喉爆料
36氪· 2026-01-23 21:12
OpenAI的创新与结构性困境 - 随着竞争加剧与组织急速膨胀,OpenAI正逐渐陷入一种难以再承担真正高风险研究的结构性困境,一些前沿创新的研究方向已经难以在内部推进 [1] - 成本、增长压力等多重因素影响了OpenAI对风险的“胃口”,同时该公司尚未找到良好的跨团队研究协作模式 [3] - 对OpenAI来说,“集中力量办大事”已经变得有些困难,阻碍AI Lab研究的因素不是算力短缺,而是缺乏专注 [5] 行业竞争格局与路径趋同 - 当前全球范围内争夺“最佳AI模型”的竞争异常激烈且严苛,几乎所有主要AI公司都面临持续展示实力、不断推出最强模型的巨大压力 [8] - 目前大概有五家严肃的AI公司,使用几乎相同的技术配方,在同一技术基础上构建略有差异的产品,模型之间缺乏真正的多样性 [14][15] - 谷歌的崛起与其说是“回归”,不如说是OpenAI自己犯了错误,没能充分把握住自己的领先优势,OpenAI本应该持续领先 [3][47] 技术发展方向与AGI展望 - Transformer架构肯定不是最终形态,模型仍然可以通过多种方式改进,而其中许多路径至今尚未被系统性地实践 [12] - 实现AGI仍然缺失关键拼图,架构创新与持续学习是两大重要方向,AGI预计将会在2029年左右实现 [5][28][32] - 强化学习将卷土重来,在强大的世界表征(通过大规模预训练获得)之上,通过强化学习构建能力层级是未来的方向 [26][27] 人才流动与创新环境 - AI领域的人才争夺战已演变成一场肥皂剧,有些人频繁地更换工作,而真正投入到工作的时间不多 [4][44] - 明星AI研究员并不是驱动创新的核心因素,公司本身能否打造个人责任感强、允许探索和做大事的环境,可能更为关键 [4][66][67] - 研究人员的高薪酬水平可能带来副作用,使人们变得不愿意失去工作,更倾向于追逐短期回报,从而抑制了冒险精神 [18] OpenAI的内部文化与执行力 - OpenAI从2019年约30人发展到现在的几千人,但公司瞄准AGI、改变世界的野心始终没变 [7] - OpenAI早期有相当高比例的波兰裔员工,他们以勤奋和能识破“忽悠”著称 [45][46] - OpenAI真正擅长的是把研究从1推进到100,即采纳初步验证的想法,并找出如何让它们在大规模训练前沿模型时可靠地工作 [64] 对其他AI公司的评价 - 在过去一年里,对Anthropic的钦佩程度大幅上升,其起步更晚、资源受限,但成功构建了正在改变软件开发方式的卓越产品 [53][54] - Meta的策略可能是利用行业已掌握的AI技术来构建连接人和打造体验的产品,从其作为一家极其盈利的社交网络公司角度来看,这可能是一种相当不错的策略 [50][51][52]