Workflow
Robotics
icon
搜索文档
独家丨10亿,开年第一笔机器人融资,字节红杉都出手了
投中网· 2026-01-12 08:00
融资情况与资本动向 - 自变量机器人近期完成10亿元A++轮融资 投资方包括字节跳动、红杉中国、深创投、北京信息产业发展基金、南山战新投、锡创投等顶级投资机构及多元地方平台 [3] - 公司成为国内唯一同时获得字节跳动、美团、阿里三家互联网大厂投资的具身智能企业 [3] - 红杉中国继去年9月A+轮后再次出手投资 深创投将其人工智能和具身机器人基金的首笔投资投向自变量 [3][4] - 公司吸引了深圳、北京、无锡等多地政府背景资金支持 如北京信息产业发展投资基金是北京市政府主导的四大百亿级产业投资基金之一 [4] - 在两年时间内 公司已连续完成8轮融资 去年9月的A+轮融资额近10亿元 将全年融资总额推高至数十亿元 [10] 公司背景与技术定位 - 自变量机器人成立于2013年12月 是国内最早一批聚焦自研具身模型的创业公司之一 [6] - 创始人兼CEO王潜为清华大学本硕、美国南加州大学博士 曾创立量化基金 联合创始人兼CTO王昊为北京大学计算物理学博士 曾在IDEA研究院担任大模型团队算法负责人 [6] - 团队背景偏AI大模型 在行业内较为少见 [6] - 公司将具身智能基础模型定义为独立于、平行于大语言模型和多模态模型的“物理世界的基础模型” [6][7] - 公司自研的WALL-A核心架构深度融合了VLA与世界模型 旨在提升机器人在非结构化环境中执行移动操作任务的零样本泛化能力 [7] 技术路径与数据策略 - 公司认为具身智能下一阶段的竞争本质上是数据闭环构建的基础模型与模型进化能力的竞争 [8] - 作为国内最早规模化扩展真机数据采集的公司之一 公司自研了主从遥操、外骨骼、无本体等多种数据采集设备 [8] - 公司搭建了模型驱动的数据管线 通过数据生成、过滤、增强、标注等环节持续产生规模化高质量数据 [8] - 公司追求硬件-数据-模型的闭环迭代 基础模型能为数据处理和硬件设计提供反馈 从而迭代出更高质量的数据和更高效的数据采集设备 [8] - 2025年9月 公司开源了其自研的端到端具身基础模型WALL-OSS [8] 产品应用与商业化进展 - 公司的机器人在真实场景中展现出环境适应力 例如在外卖配送与纸箱回收场景中 能应对强风干扰或视线遮挡 并在遭遇卡顿时通过强化学习自主纠错 [9] - 在复杂物流场景中 机器人能凭借基础模型的零样本泛化能力识别异形件 并利用强化学习快速适应工作节拍 [9] - 公司设计发布了“量子一号”、“量子二号”两款高性能机器人本体 并实现了机械臂、关节模组、动力驱动器、主控制器等核心零部件的全面自研与算法深度适配 [9] - 全栈自研硬件促成了整机成本大幅下降 为规模化量产与商业化普及奠定了基础 [9] - 公司已逐步进入工业制造、物流和养老等多个场景探索商业化落地 [9] 行业趋势与竞争格局 - 行业竞争焦点正从机器人的“肢体”转向“大脑” 即如何为机器人构建能理解、操作并灵活应对物理世界的智能“大脑” [5] - 具身智能企业已出现分层 投资人更多是在已上牌桌的少数公司中选择自己相信的创始人和技术路径 [4] - 2025年具身智能领域前10家公司拿下了该领域40%的融资 而自变量机器人是其中融资额最高的公司 [9][10] - 资本正流向头部企业 行业可能在2026年进入验证阶段 产品市场匹配将逐渐成型 真正有商业价值的订单会涌现 [10]
马斯克:三年内特斯拉Optimus人形机器人将超越顶尖人类外科医生
搜狐财经· 2026-01-12 00:33
马斯克对擎天柱机器人的预测与专家观点 - 特斯拉首席执行官马斯克预测,擎天柱机器人将在三年内超越最顶尖的外科医生,成为更出色的手术执行者,并在三年后实现规模化应用,届时其数量可能超过全球人类外科医生的总和 [2][3] - 马斯克于2022年首次公开擎天柱机器人原型机,并曾表示首款量产机型有望在次年推出,但2024年已将机器人的上市目标时间定为2026年 [3][4] 医疗行业专家对机器人手术前景的评估 - 卫生政策领域专家认为马斯克的想法过于乐观,机器人广泛应用于大型外科手术在未来很长一段时间内都不现实 [5] - 生物伦理学家阿瑟・卡普兰教授指出,马斯克关于三年内让擎天柱超越全球顶尖外科医生的说法完全不可信,并认为机器人手术的发展进程一直十分缓慢 [5] - 专家认为,在未来三年内,机器人几乎不可能在所有外科领域全面超越人类医生,原因包括人类个体差异极大难以通过编程适配,以及证明临床效果相当需要数年时间 [5] - 部分外科手术如整形外科、烧伤修复和创伤治疗近乎艺术创作,其编程技术可能在未来很长一段时间内都无法实现 [6] 医疗行业自动化现状与机器人应用挑战 - 专家承认机器人技术正在改变医疗行业格局,例如放射科和病理科中部分用于扫描分析检测结果的环节已经实现自动化 [7][8] - 专家强调机器人主刀手术为时尚早,指出自动驾驶技术尚无法安全操控车辆在城市道路行驶,而外科手术的难度有过之而无不及,实现大规模应用还需要漫长的时间 [9] 关于人形机器人部署的公众担忧 - 马斯克关于人形机器人的部署计划引发了公众担忧,他曾多次将擎天柱机器人的研发称为打造机器人军团 [9] - 马斯克在讨论其薪酬方案及公司控制权时表示,核心顾虑在于如果牵头打造出庞大的机器人军团,未来可能失去对其的影响力 [9]
陪伴机器人,正在改写9亿人的孤独经济
搜狐财经· 2026-01-12 00:16
文章核心观点 - 在情绪消费崛起与AI技术爆发的双重驱动下,陪伴机器人正从玩具赛道突围,快速成长为一个覆盖多场景、多人群的千亿级市场 [1][3] 一、孤独经济爆发:9亿人催生的陪伴刚需 - 消费需求向“情绪价值”转变,2025年国内AI玩具线上市场销售额同比暴涨394.9%,其中主打情感陪伴的品类份额从7.0%跃升至15.7% [4] - 18-35岁独居青年超1.2亿,对拟人化交互陪伴产品需求强烈,25-30岁女性是核心消费群体,占比达72% [6] - 双职工家庭占比提升催生儿童陪伴需求,90后“科技育儿先锋族”青睐兼顾教育与互动的产品 [6] - 60岁以上老年人口达2.8亿,空巢老人占比超50%,高端陪伴机器人成为养老市场新刚需 [6] - 全球AI陪伴市场规模预计从目前的3000万美元飙升至2030年的700-1500亿美元,国内市场2024年规模约10亿元,预计2030年达38.6亿美元,年复合增长率高达75% [8] 二、技术破壁:从被动响应到主动共情 - 多模态大模型成熟,解决了“答非所问”痛点,能理解语境、情绪和潜台词,提供个性化回应 [9] - 技术路径多元化:字节跳动“显眼包”搭载豆包大模型,汤姆猫AI童伴采用西湖心辰Lingo语音大模型,海外产品如Curio的Grok接入GPT-4 [9] - 大模型API调用成本降至极低水平,为规模化普及奠定基础 [9] - 整合多模态传感器(视觉、触觉、温度等),实现情绪识别与主动交互,如三星家居机器人具备环境感知功能 [11] - 日本GROOVE X的LOVOT 3.0搭载深度相机和半球相机,通过情感算法模拟“喜爱”程度,充满电可移动陪伴4小时,售价2.98万元 [11] - 通过持续交互实现“千人千面”的成长型陪伴,部分品牌采用“共创+成长”模式,使用户留存率提升50%以上 [13] 三、市场重构:三类玩家角逐千亿赛道 - 市场吸引了传统玩具商、科技新锐、IP方等三类玩家入局,呈现差异化竞争 [14] - **传统玩具商**:凭借IP储备和供应链转型,如奥飞娱乐推出“喜羊羊超能铃铛娃娃”(定价399元),实丰文化开发宝可梦等系列产品 [16] - 带IP属性的AI玩具溢价可达3-5倍,Haivivi(跃然创新)通过奥特曼等IP授权,2025年1-10月销售额破亿,市场份额达20.5% [16] - **科技新锐**:凭借技术主攻中高端市场,如字节跳动“显眼包”在二手平台炒至300-1000元,珞博智能Fuzozo销量已突破12万台 [18] - 噜咔博士AI拍学机2025年销售额超6200万元,社媒互动量增长1755.9%,可以科技的Loona全球销量累计超9万台 [18] - 海外品牌如德国HCD智能狗售价199.99-549.99欧元,美国Embodied的Moxie机器人定价799美元,日本Mirumi在Kickstarter筹得约5万美元 [18] - **跨界玩家**:通过场景创新开辟新赛道,如索尼Aibo、松下球形底座机器人、TCL的Ai Me概念产品、三星球形滚动机器人Ballie [20] - 国内跨界案例如上海电影旗下上影元拥有600多部动画IP,与跃然创新达成“IP+AI玩具”战略合作 [22] - 2025年AI玩具TOP10品牌中4家为新上榜企业,腰尾部品牌份额不足1%但增速迅猛 [22] 四、产品进化:三级价格带覆盖全场景需求 - 市场形成清晰的价格分层,从百元级到万元级,精准匹配不同需求 [23] - **入门级(100-500元)**:主打基础语音交互+IP形象,代表产品有奥飞AI喜羊羊等,功能涵盖角色扮演、多语言对话,2025年千元以下市场占比已成为主流 [24] - **中端(500-3000元)**:具备情绪识别、多语言交互等进阶功能,目标用户为一线城市中产家庭、20-40岁单身女性,该价格带销售额占比已超40% [25] - **高端(>3000元)**:支持多模态交互、医疗级陪护,服务于高净值家庭及养老/医疗机构,代表产品LOVOT售价2.98万元,硬件毛利可达60%以上 [27] - 产品形态多元,包括主打疗愈的AI潮玩、聚焦儿童成长的AI教辅益智类、覆盖专业场景的AI机器人 [27] 五、未来趋势:四大方向定义陪伴新形态 - **情感计算精准化**:通过强化算法精准识别用户情绪,并整合多模态交互技术感知肢体动作、面部微表情 [29] - **IP融合深度化**:“IP+AI”双向赋能成为核心竞争力,未来产品将深度融入IP的性格特质、语调风格,如上影元《中国奇谭》IP播放量超3亿 [29] - **场景拓展多元化**:向成人情绪疗愈、老年医疗陪护、宠物互动玩具及文旅、教育等B端场景延伸 [31] - **变现模式服务化**:尝试从“单次销售”转向“长期服务变现”,如推出订阅制服务、搭建硬件销售+软件授权双轨模式,构建全链路变现生态 [31] 六、机遇与挑战:千亿蓝海的成长烦恼 - 面临技术融合难题,视觉识别、情感分析、多模态交互等技术的有效融合进展缓慢,部分产品交互不流畅、情感响应精度不足 [32] - 存在安全风险,联网产品收集的语音、面部表情等敏感信息有泄露风险,儿童过度依赖可能影响社交技能发展 [33] - 同质化趋势初显,尤其入门级市场已出现功能相似产品,可能陷入价格战 [35] - 机遇在于算力成本降低、大模型能力升级及供应链成熟将提升产品性价比,IP赋能、场景创新、服务化变现有助于构建竞争壁垒 [35]
26年持续挖掘十五五AI新质力机遇:八大必看核心科技赛道,已有涨超2倍!
搜狐财经· 2026-01-11 19:59
文章核心观点 - “十五五”规划中的“AI新质生产力”是未来几年中国资产的最大投资主线,2026年是开局之年,该主线具备确定性 [1][2][29] - 投资应遵循“四维共振”逻辑,即技术突破、政策催化、商业化推进、供应链重构共同发力 [5] - 数万亿银行理财资金也将重点关注“十五五”规划投资机会 [5] 八大核心赛道投资价值 - **商业航天**:全球进入低轨卫星资源“抢位赛”,中国星网规划12992颗卫星,2026年是组网“攻坚年”;行业天花板被打破,低轨卫星年发射上限或超5万颗,催生火箭回收、卫星制造及6G通信等持续需求 [7][8] - **AI应用与国产替代**:2026年国内AI主要机会在于国产半导体和国产大模型的预期差;国产大模型如DeepSeek R2预计将超越GPT-5,国产半导体设备在HBM工艺等领域取得突破;政策推动“人工智能+”,AI应用将从试点变为标配 [9][10] - **人形机器人**:2026年迎来量产拐点,特斯拉Optimus第三代已定型,目标年产量5万台,规模化后单台成本有望降至2万美元以内;其市场规模被马斯克认为将超过汽车 [12][13] - **端侧AI硬件**:AI眼镜被视为继AI手机后的下一个流量入口;字节跳动豆包AI眼镜将于2026年一季度出货无屏版,四季度推出带显示功能版,起步价2000元以内;2025年上半年全球AI眼镜出货量同比增长110%,未来有望成为千亿级市场 [15][16] - **智驾与无人驾驶**:L4-L5级自动驾驶进入落地阶段,将倒逼高精地图、线控制动、激光雷达、车规芯片等上游产业链升级;2026年是自动驾驶商业化关键年 [17][18] - **AI能源基建**:AI发展导致电力需求激增,预计到2026年底AI相关消耗将占全球数据中心用电量的49%;核电和燃气发电将成为算力中心的电力保障,2025-2026年全球核电发电量预计平均增长2%,燃气发电量增长1.3%;固态电池是解决安全焦虑的下一个突破口 [19][20][21] - **AI战略资源**:看好铜、铝、金银、稀土等“新石油”的需求;中国加强稀土出口管制,若全面禁运,日本三个月或损失300亿元人民币;锂资源因储能需求增长,2026年供需有望恢复紧平衡;美联储降息周期开启后,铜价可能进入上涨大周期 [22] - **前沿领域**:“十五五”规划中的未来产业,如核聚变、量子计算、具身智能、生物制造、6G通信、脑机接口等,是十年期的潜力股,需跟踪技术突破和资本开支信号 [23][25] 投资节奏与观察节点 - **IPO进度**:中国科技独角兽及海外SpaceX、OpenAI的上市进度,将带来新的巨量资本开支 [26] - **技术突破**:特斯拉Optimus在2026年第三季度的量产进展、中国火箭可回收技术突破、中国星网2026年底一期组网验收 [27] - **产业进展**:中国光刻机和芯片制造突破、DeepSeek R2大模型的多模态能力验证、以及字节、阿里、腾讯的AI资本开支和商业化进展 [27] 赛道强度与定位总结 - 商业航天和AI应用的确定性与弹性强,大概率是2026年最强科技主线 [29] - 人形机器人、国产半导体、AI眼镜、AI电力、智驾等是重要的科技进攻方向 [29] - AI战略资源和能源基建是保障,能对冲不确定性 [29] - 光刻机、核聚变、量子、脑机等前沿领域适合长期跟踪和分批布局 [29]
一场关于家的自动化实验:家务机器人的模式分野
机器人大讲堂· 2026-01-11 17:39
文章核心观点 - 2026年CES展会展示了家务机器人产业的爆发,其驱动力来自真实的市场需求和技术成熟,行业正从执行简单命令向理解复杂任务进化[1][2][4] - 行业未来发展呈现三条差异化路径:作为智能家居生态中枢的机器人、旨在替代人类的通用家庭助手、以及专注于垂直场景的专业清洁机器人[5][8][10] - 未来家庭智能生态将是混合形态,短期内由专业机器人主导市场,长期可能演变为“轻量中枢+多元终端”的架构[19] 市场需求与技术必然 - **时间稀缺与家政市场缺口**:全球双职工家庭比例攀升,例如荷兰选择“近全职”工作模式的人群在过去四年增加了30万[2]。中国家政市场规模已超万亿元,消费普及率达81.69%,但存在近2000万的人才缺口[2] - **市场快速增长**:2025年全球家用/家庭服务机器人市场已达百亿美元级规模,并以年复合增长率超25%的速度增长,预计2030年代初突破千亿美元[3] - **技术成熟驱动**:技术的成熟与成本下降使自动化解决方案变得可行,资本市场已敏锐捕捉到这一趋势[2] 技术进化路径 - **大脑与躯体合流**:大语言模型与机器人技术结合,使机器能理解“收拾客厅”等模糊指令并自主规划步骤[4] - **感知与行动一体化**:通过融合激光雷达、深度相机与灵巧机械结构,机器人能从清洁固定平面升级为管理复杂的三维家居空间[4] - **共同目标**:行业致力于创造能自主适应杂乱真实环境、并通过持续学习越用越聪明的家庭伙伴,而不仅仅是另一台机器[4] 发展路径分野 - **路径一:家庭协作中枢 (如LG CLOiD)** - 定位为“零劳动之家”战略的移动控制中枢与执行终端,核心价值在于调度与协同[5] - 采用三段式模块化设计,配备7自由度机械臂和可独立驱动的五指灵巧手,通过与ThinQ AI家居平台连接,可调度家电完成连续家务流程[7] - 核心技术为自研的Physical AI,包含视觉语言模型和视觉语言动作模型[7] - 公司同步推出机器人执行器品牌LG Actuator AXIUM,意图切入上游核心零部件市场,构建垂直一体化竞争力[7] - 最终目标是形成“AI之家”,并考虑推出“机器人订阅服务”商业模式[8] - **路径二:通用家庭助手 (如1X Technologies的Neo)** - 直接运行OpenAI定制的大模型,能够进行自然对话并理解复杂意图(如根据冰箱食材建议早餐食谱)[10] - 设计理念强调“可靠、实用、低调”,专注于在真实家庭环境中完成重复性任务[10] - 商业化策略清晰:提供2万美元(约合人民币14.2万元)的一次性购买价,或每月499美元、至少六个月的订阅模式[10] - 计划于2026年限量交付美国市场,2027年进入欧洲、日本、韩国等其他成熟市场[10] - **路径三:专业清洁专家 (以中国公司为代表)** - **石头科技**:展示轮足扫地机器人G-Rove (Saros Rover),融合轮式结构与机械腿,可自主判断并攀爬楼梯,同时清洁楼梯面,实现了从“二维地面清洁”到“三维空间管理服务”的跨越[11][13] - **追觅科技**:展示两款产品,旗舰扫地机器人X60 Max Ultra Complete将机身高度压缩至7.95厘米以深入低矮死角;Cyber10 Ultra概念机配备多关节机械臂,可自主拾取500克以下杂物并自动更换清洁工具[14][16] - 中国机器人企业通过极致的场景创新和快速工程化能力,在其擅长的垂直领域开辟出与通用人形机器人不同的商业化道路[18] 未来图景与产业走向 - **混合生态主导**:未来家庭将由混合智能生态构成,而非单一形态机器人统治[19] - **短期市场主导**:短期内,聚焦特定场景的“机器人专家”将成为市场主导者,解决明确痛点并积累用户;人形机器人则在特定封闭场景进行验证[19] - **生态竞争与融合**:生态大脑(如CLOiD)可能通过开放协议接入第三方专业设备;“专家”们也可能尝试联盟或平台化[19] - **最终形态猜想**:可能演变为“轻量中枢+多元终端”架构,一个低成本AI中枢负责理解意图与规划,众多“超级专家”负责高效执行,家庭自动化从拥有机器人转向享受无缝服务[19] - **产业走向**:决定产业走向的不仅是人形机器人,还包括轮足、机械臂、生态大脑等多种技术路径的探索者[20]
对话鹿明机器人:在具身智能的“数据荒”里,做一个送水人|AI Founder 请回答
钛媒体APP· 2026-01-11 12:52
行业背景与核心痛点 - 具身智能行业正面临“数据荒”,数据需求呈指数级爆发,从Pi0的1万小时训练到Gen-0的27万小时,预计2026年头部模型所需真机训练数据将达到百万小时级别 [2] - 传统数据获取方式(遥操作)成本高昂,每小时高达数百美金,且产生大量无法复现、传感器不同步的“废数据”,数据获取低效且昂贵 [2] - 在Scaling Law的驱动下,谁能规模化开采高质量数据(“物理石油”),谁就将拥有定义下一代通用机器人标准的话语权 [2] 公司定位与战略愿景 - 公司定位为具身智能时代的“超级数据工厂”,不做单纯的整机商,旨在成为行业的“卖水人”并“定义水的标准” [2] - 公司使命是成为全球领先的具身智能定义者和实践者,为行业提供数据和硬件的基础设施,联合生态伙伴赋能千行百业 [12] - 公司布局遵循从“工具”到“平台”再到“生态”的路径,核心是围绕“本体、场景、数据”的飞轮来构建业务 [7] 团队背景与融资情况 - 创始人喻超毕业于清华大学,自2016年起从事机器人学习算法研究,曾主导构建追觅科技具身机器人业务并参与开发小米CyberDog [3] - CTO曹俊亮是上海交通大学机械工程博士,联席CTO丁琰为纽约州立大学人工智能博士、前上海AI lab明星研究员,团队拥有深厚产业经验和技术积累 [3] - 公司于2025年12月完成Pre-A1、Pre-A2两轮融资,金额达数亿元人民币,投资方包括鼎晖投资、南京创投、金景资本等知名机构 [3] 核心技术:FastUMI Pro 系统 - FastUMI Pro 系统将单条数据采集时间从50秒缩短至10秒,效率提升5倍,综合成本降低80% [4] - 系统集成为UMI场景定制的高性能传感器,能稳定实现60Hz高频记录,并保障多模态信息的毫秒级同步 [8] - 系统实现了数据与本体的完全解耦,可快速适配市场上数十种不同的机械臂,做到“一套数据,全机通用” [9] 数据质量管理体系 - 公司独创8道工业级数据质量评估体系,将数据有效率从行业普遍的70%提升至95%以上 [4] - 该体系能从源头过滤视觉与位姿未对齐、传感器不同步、轨迹不可复现的“废数据”,确保数据100%可用于模型训练 [9][11] - 公司区分“废数据”(缺乏信息密度和教学意义的自然行为数据)与“脏数据”(包含抖动、漂移、时间错位等噪声的数据),强调数据的“有效信息密度”和“物理交互精确性” [10] 核心产品与市场竞争力 - FastUMI Pro 已成为行业内验证和开发UMI能力的“标配装备”,全球超过三分之二的顶尖具身智能团队正在使用 [14] - 与市面上“拼凑”模块的产品不同,FastUMI Pro 是系统化设计,解决了带宽架构脆弱、掉帧等问题,能稳定Replay交互记录 [9] - 公司已推出4款不同的机器人“本体”以适应不同场景,并与三菱、中远海运、德马科技等企业形成深度战略合作 [7] 核心指标与商业模式 - 公司提出“鹿明指数”:场景价值 / (数据成本 × 硬件成本),用以系统性地衡量和优化从硬件、数据到模型的全栈能力,追求场景价值最大化 [3][7] - 公司商业模式包括销售数据采集设备(FastUMI Pro)、销售数据集以及提供机器人本体,旨在成为行业的数据和硬件基础设施提供商 [12] - 公司认为基础设施的完善是场景高质量落地的前提,可靠硬件是落地保障,高质量、低成本、可规模化的数据是提升模型泛化能力的基础 [7] 发展目标与里程碑 - 公司为2026年设定的核心目标是建立100万小时的UMI数据产能,建成全球最大的具身真机数据集 [5][13] - 公司认为100万小时的数据量级是具身智能Scaling Law生效的临界点,可能催生具身智能的“ChatGPT时刻”,并构成公司的数据护城河 [5][13] - 公司战略核心是抢占时间差,建立数据的先发优势和生态位占领,以应对外部竞争 [16]
不用VLA!从视频生成模型到机器人控制
具身智能之心· 2026-01-11 11:02
文章核心观点 - 提出了一种名为LVP(Large Video Planner)的具身智能新范式,其核心思想是利用视频生成模型进行机器人控制,而非直接输出动作指令[12] - 该方法通过在大规模、多样化的视频数据集上预训练,使机器人模型获得了对物理世界运作规律的通用理解,从而在零样本情况下展现出对未见任务和场景的强大泛化能力[19][47] - 尽管在推理速度和实时控制方面存在局限,但该研究证明了视频生成模型作为通用机器人大脑的潜力,是迈向更智能、更通用机器人的重要一步[44][46] 技术方法与模型架构 - 核心模型LVP是一个拥有140亿参数(14B)的专用视频生成模型[18] - 模型采用“视频即规划”理念,利用视频包含的时空连续性信息,比离散的文本或动作指令蕴含更丰富的知识[19] - 引入了两项关键技术改进以确保生成视频的可执行性:1) **扩散强迫**:一种灵活的训练策略,使模型能根据清晰的第一帧或一段视频上下文稳定预测未来画面[24];2) **历史引导**:一种采样技巧,强制生成的视频严格遵循第一帧(机器人当前视角),保证物理连贯性[26] 训练数据集 - 为训练LVP模型,研究团队构建了名为LVP-1M的数据集,包含约140万个视频片段[29] - 数据来源高度多样化,融合了机器人数据、人类第一视角数据和互联网视频,以提供机器人形态先验、丰富的手物交互细节以及多样化的场景任务[30] - 关键数据清洗步骤包括:用大模型重新生成详细的动作描述、对齐机器人视频与人类视频的时间频率(统一为3秒完成动作)、剔除剧烈镜头晃动以专注于手物交互[34] 从视频到动作的执行流水线 - 设计了一套纯视觉的动作提取流水线,无需额外训练,将生成的视频转化为机器人可执行的动作[32] - 流程分为四步:1) LVP模型生成人类手部完成任务视频[35];2) 使用HaMeR模型对每帧进行3D手部重建[35];3) 使用MegaSAM模型进行4D时空对齐,平滑修正手部轨迹[35];4) 通过重定向算法将人手关节角度映射到机器人灵巧手或二指夹爪上[35] 性能评估与实验结果 - 在硬核的第三方“野外测试”中,LVP成功完成了包括撕胶带、舀咖啡豆等在内的从未见过的任务[38][39] - 与通用视频生成模型(如Wan 2.1, Cosmos)相比,LVP生成的视频在物理接触正确性和任务完成度上遥遥领先,通用模型常出现手穿物体等物理谬误[41] - 与当前最强的机器人视觉-语言-动作模型(如OpenVLA, π0)相比,LVP在零样本泛化能力上表现突出:在任务组A(平行夹爪)的“拾取物体”任务中,LVP成功率为5/10,优于π0的3/10和OpenVLA的0/10[8][43];在任务组C(分布外场景)的“拾取物体”任务中,面对新物体时成功率为4/10,而π0和OpenVLA均为0/10[8][43] 当前局限性与未来方向 - **推理速度慢**:在A100 GPU上生成一个视频计划需要几分钟,目前无法用于实时闭环控制,只能进行开环执行[48] - **依赖开源组件**:动作提取依赖HaMeR和MegaSAM等第三方模型,若组件识别错误会导致执行失败[48] - **开环执行风险**:一旦开始执行,若中途发生意外(如物体滑落),机器人无法像闭环策略那样实时调整[48]
唐山机器人产业大脑入围 省产业大脑建设“揭榜挂帅”名单
新浪财经· 2026-01-11 09:44
项目概况与入围情况 - 由唐山高新区国有控股集团有限公司牵头,联合唐山工业职业技术大学、中国移动通信集团河北有限公司唐山分公司、唐山百川智能机器股份有限公司、北京大学政府管理学院、东华软件股份公司等5家单位共同申报的“唐山机器人产业大脑”项目,成功入围河北省2025年度行业产业大脑建设“揭榜挂帅”名单 [1] - 该项目是全省6个入围项目之一 [1] 项目定义与建设目标 - 产业大脑是依托工业互联网、大数据、人工智能等新一代信息技术构建的智能化产业生态系统,以数据资源为核心要素,旨在打通产业链、创新链、政策链、资金链、供应链 [1] - 项目集成企业生产经营、产业协同发展、政府经济治理等多元应用场景 [1] - “唐山机器人产业大脑”紧扣《河北省数字技术赋能制造业高质量发展实施方案》要求,秉持“需求导向、场景引领、五链融合、多方赋能”的建设思路 [1] - 项目核心目标是“服务政府治理、赋能企业转型” [1] 项目实施路径与预期作用 - 项目通过汇聚政府公共数据、行业共性数据与企业个性化数据,搭建标准化产业数据仓 [1] - 项目旨在打造集数据整合、技术研发、协同服务于一体的、具有唐山产业特色的机器人行业专属大脑 [1] - 项目预期为河北省机器人产业高质量发展注入强劲动能 [1]
特斯拉“小伙伴”启动上市辅导
中国证券报· 2026-01-11 08:58
公司概况与上市进展 - 杭州新剑机电传动股份有限公司于1月9日启动上市辅导工作,辅导机构为中信证券 [1] - 公司成立于1999年,为专精特新“小巨人”企业,属于通用设备制造业 [2] - 公司2022年营业总收入为2亿元,净利润为1751万元 [2] - 公司主要股东包括上海新剑资产管理有限公司(持股29.40%)和单新平(持股约21.31%)等 [2] 核心业务与产品 - 公司是特斯拉人形机器人(Optimus)的核心零部件供应商,其产品已于2022年应用于该机器人 [1] - 公司专业研发生产滚轧成型蜗杆齿轮、座椅水平驱动器、行星滚柱丝杠-直线型电驱动关节、旋转型电驱动关节等系列产品 [2] - 2025年,公司取得多项人形机器人相关专利,包括“人形机器人直线电驱动关节自抗扰控制方法”等 [2] 产能扩张与重大项目 - 2025年一季度,公司总部暨年产100万台人形机器人“行星滚柱丝杠”产业化项目基地开工建设 [3] - 该项目总建筑面积约7.1万平方米,计划总投资26亿元,其中一期投资10亿元 [3] - 项目旨在打造国内领先的集研发、生产、销售、运维服务于一体的人形机器人零部件产业基地 [3] 战略合作 - 2025年8月23日,公司与信质集团子公司浙江鸿辉电机有限公司签署战略合作协议,将在人形机器人灵巧手及关节模组等传动执行器领域深度合作 [4] - 2025年3月12日,公司与五洲新春签订战略合作框架协议,将共同推动行星滚柱丝杠、微型滚珠丝杠等零部件及智能汽车用丝杠产品的生产配套与开发 [4] 行业前景与市场预测 - 2025年,国内人形机器人出货量预计达1.8万台,较2024年增长超650% [5] - 2026年,国内人形机器人出货量有望攀升至6.25万台 [5] - 花旗预测,2026年全球人形机器人产能将显著增长,中国供应链相关企业收入预计将实现翻倍 [6] - 增长核心驱动力来自整机产能扩张带来的上游核心零部件(如3D视觉、减速器、丝杠)需求激增 [6] 主要厂商动态 - 智元、宇树科技、特斯拉等厂商正积极推动产业加速发展 [5] - 智元披露其2026年量产规模有望增至数万台 [5] - 何小鹏于1月9日宣布,将于2026年规模量产人形机器人 [5] - 特斯拉宣布其人形机器人Optimus V3将于2026年量产,目标年产100万台 [5]
Want to Buy Artificial Intelligence (AI) Stocks in 2026? These 2 Companies Could Net You Millions in Retirement.
The Motley Fool· 2026-01-11 06:44
英伟达的行业领导地位与增长动力 - 英伟达是人工智能革命的主要受益者,提供训练和运行AI模型所需的高性能芯片[1] - 公司计划将新硬件发布节奏从历史性的两年一次加速至每年一次,以维持增长势头[3] - 其最新的Blackwell GPU架构销售表现强劲,云GPU已售罄,且该架构推出不到一年[3] - 公司已开始生产下一代Rubin架构,并称之为AI超级计算机,旨在满足激增的AI训练和推理计算需求[4][5] - Rubin平台相比Blackwell有多项改进,专注于推动智能体和物理AI的发展[5] - Rubin平台可将每次推理的令牌成本降至Blackwell平台的十分之一,并能使某些AI模型的训练所需GPU数量减少75%,从而可能加速AI的普及[6] 英伟达的中国市场机遇 - 中国市场对英伟达业务而言仍存在不确定性,管理层因贸易限制和地缘政治紧张局势的演变,未在业绩指引中计入对华销售的潜在贡献[7] - 公司在放宽限制方面已取得进展,并已要求代工合作伙伴大量生产H200芯片,预计中国市场将有高需求且中国当局会批准采购[7] - 据报道,中国科技公司已表示有兴趣订购数十万颗H200芯片[7] - 来自中国市场的额外收入可能推动英伟达股价进一步上涨[8] 英伟达的财务与市场数据 - 英伟达当前股价为184.86美元,市值达4.5万亿美元[9] - 公司52周股价区间为86.62美元至212.19美元[9] - 公司毛利率为70.05%[9] 物理AI趋势及受益公司 - 物理AI被认为是AI革命的另一个主要阶段,涉及能够理解、推理并采取行动的机器[9] - 英伟达CEO表示,“物理AI的ChatGPT时刻即将到来”[9] - 无人驾驶汽车和机器人领域的公司可能成为物理AI趋势的受益者[10] - Serve Robotics是一家同时涉足这两个领域的公司,与英伟达存在合作伙伴关系[10] Serve Robotics的业务与前景 - Serve Robotics的送货机器人使用英伟达的Jetson Orin平台硬件和软件,以L4级自动驾驶模式运行[11] - 公司是 sidewalk 自动驾驶配送系统的先驱,已部署超过2000台配送机器人[11] - 通过与连锁餐厅、零售商和配送平台(包括其最大股东优步技术)的合作,其活跃机器人数在一年内增长了20倍[12] - 公司也与DoorDash集成,正在开拓新市场并扩大现有市场的规模[12] - 管理层预计2025年营收仅为250万美元,而公司市值已超过11亿美元,使其成为一项投机性投资[14] - 公司对2026年的早期营收预测约为2500万美元[14]