Robotics
搜索文档
登顶全球第一后,这家中国公司把“具身大脑”开源了!
华尔街见闻· 2026-01-12 18:32
文章核心观点 - 中国创业公司千寻智能自研的Spirit v1.5 VLA模型在RoboChallenge真机评测中以总分66.09、成功率50.33%的成绩超越美国Physical Intelligence等对手,拿下全球第一,标志着具身智能行业竞争从硬件比拼进入比拼“大脑”的下半场 [1][2][6] - 千寻智能在登顶后随即开源了Spirit v1.5的基模权重、推理代码及使用样例,其战略意图在于抢占具身智能“通用大脑”的生态位,并有望通过成为行业基础(Baseline)而转型为平台型公司 [3][20][24][25] - 公司通过创新的技术路径(如VLA统一架构、独特数据飞轮)和真实的工业落地案例(宁德时代产线),证明了其模型在处理复杂、非标任务上的高效与稳定,从而推动行业估值逻辑从“硬件叙事”转向“模型叙事” [10][15][19][31] 行业现状与痛点 - 具身智能行业存在“虚火”,演示(Demo)动作在预设环境下流畅,但在真实混乱场景中往往错漏百出,陷入“四肢发达,头脑简单”的困境 [4][5] - 行业长期依赖在高度受控环境下采集的“干净数据”进行训练,导致模型过拟合,缺乏在真实物理世界中的泛化能力 [8][9] - 行业存在“重复造轮子”的痛点,每家机器人公司都试图从零训练自己的基础模型,造成资源浪费且水平参差不齐 [23] 千寻智能的技术突破 - Spirit v1.5采用了创新的VLA(Vision-Language-Action)统一架构,实现端到端的“直觉反应”,让机器人感知即行动,不同于传统的拼凑式模块 [10] - 公司构建了“先离散,后连续”的独特数据飞轮,并在物理世界验证了大模型Scaling Law的有效性 [11] - 模型训练数据源拥抱混乱,第一阶段预训练使用了海量、杂乱的互联网视频(如YouTube、爱奇艺)以学习物理世界的多样性,第二阶段才引入真实遥操作数据进行微调 [17] 商业化落地与成效 - 2025年底,千寻智能的人形机器人“小墨”已批量部署于宁德时代中州基地的电池PACK产线,这是全球首条人形机器人电池PACK产线 [15][16] - 在宁德时代的产线中,机器人处理高压、高精度的电池插接等“非标”场景,连续运行中插接成功率稳定在99%以上,单日工作量实现了3倍提升 [18][19] - 这一案例证明,在Spirit大模型加持下,机器人能够处理复杂工业任务,并在效率和良率上超越人类熟练工,使人形机器人从“展示品”变为实用工具 [18][19] 开源战略与行业影响 - 千寻智能通过开源Spirit v1.5,直接拉高了行业的“标准线”,旨在使其成为学界和产业界研究的基础(Baseline) [24] - 此举旨在抢占具身智能“通用大脑”的生态位,目标是使千寻智能转型为一家“赋能全球机器人公司”的平台型公司 [20][25] - 公司战略类似OpenAI,当模型能力形成真正的代际差时,仍握有转向闭源的主动权 [26] 行业范式转变 - 具身智能的竞争正从比拼硬件的“上半场”,迈入比拼大脑的“下半场” [6][30] - 行业正从“Demo时代”迈进需要拥抱混乱的“实战时代” [7] - 对于投资者,公司的估值逻辑正在重构,从对标发那科(Fanuc)的硬件制造商,转向对标OpenAI的AI平台公司 [31] - Spirit v1.5展现出的“一脑多形”能力,意味着其商业天花板不再受限于硬件产能,而取决于模型的泛化边界 [31] - 行业的真正壁垒,正在从硬件转向数据、模型、生态、标准 [32]
字节、红杉中国等联合投资,自变量机器人完成10亿元A++轮融资
搜狐财经· 2026-01-12 18:16
公司融资与股东背景 - 公司近期完成10亿元人民币A++轮融资 [1] - 本轮融资由字节跳动、红杉中国、北京信息产业发展基金、深创投、南山战新投、锡创投等顶级投资机构及多元地方平台联合投资 [1] - 此轮融资是深创投AI基金成立以来的第一笔投资 [1] - 公司此前已先后获得美团、阿里的投资 [3] - 公司是国内唯一同时获得字节跳动、美团、阿里巴巴三家互联网大厂投资的具身智能企业 [3] 公司业务与产品 - 公司成立于2023年12月 [3] - 公司业务聚焦于自研“通用具身智能大模型” [3] - 公司目前已推出量子1号、量子2号两款自研机器人本体 [3] - 量子2号为通用轮式仿人形机器人 [3]
美股异动 | 涂鸦智能盘前涨超3% 发布其首款AI宠物陪伴概念产品Aura机器人
格隆汇· 2026-01-12 17:47
公司股价与市场表现 - 涂鸦智能(TUYA.US)盘前交易中股价上涨3.64%,报2.28美元 [1] - 公司股票在常规交易时段收盘价为2.20美元,盘前交易中上涨0.08美元 [1] - 公司总市值为13.45亿美元,市盈率(TTM)为27.50 [1] 产品发布与战略突破 - 公司在CES 2026上正式发布其首款AI宠物陪伴概念产品——Aura机器人 [1] - Aura机器人是一款集陪伴互动、智能照护与生活服务于一体的AI产品,可通过多模态AI交互为宠物提供情感陪伴 [1] - 该产品标志着公司在消费级AI机器人领域取得关键突破,并加速推动Physical AI(物理AI)融入生活 [1] - Aura机器人的应用场景可延伸至更广泛的家庭看护与生活服务领域 [1]
CES 2026见证新一代AI陪伴机器人落户普通家庭
36氪· 2026-01-12 17:41
行业整体动态与趋势 - 在CES 2026上,消费级AI机器人是备受瞩目的焦点,行业展现出活跃度与创新潜力,但产品智能水平参差不齐仍是现实挑战 [2] - 能够真正理解并适应多样复杂家庭环境的AI机器人,才具备走入千家万户的可持续竞争力 [2] - 消费级AI机器人正从概念加速走进家庭,通过情感陪伴、主动服务等真实场景创造价值,推动智慧家庭生态从概念走向日常 [9] 核心产品与场景落地 - 展会中多款产品在交互能力、场景理解与主动服务等方面表现突出,展现出较高的技术成熟度与家庭场景下的可落地性 [2] - 四款代表性产品(TCL AiMe、会畅科技OlloNi、涂鸦智能Aura、星巡智能Ellie Boxer)均以“情感共鸣+主动服务”为核心设计理念,精准覆盖儿童、宠物、幼儿等家庭核心陪伴需求 [6] - TCL AiMe儿童陪伴机器人具备精准语音识别与情感捕捉能力,通过仿生交互实现拟人化沟通,移动底座可灵活穿梭、追踪抓拍,并能联动智能家居 [3] - 会畅科技OLLOBOT的OlloNi以主动关怀与情感共鸣为特点,通过多模态主动AI、智眸共情交互等能力,打造具有“生命感”和独特成长性的赛博宠物 [4] - 涂鸦智能AI宠物陪伴机器人Aura通过分析宠物行为与声音让主人远程感知状态,具备逗宠、投喂、拟人交互、自主移动、跟随陪伴与抓拍功能,并能连接健康管理等服务 [4] - 星巡智能的育儿保镖Ellie Boxer实现“安全防护+科学陪伴”的双重守护,在静默守护家庭安全的同时提供温柔陪伴 [8] 关键技术驱动与产业合作 - 专注于消费级物理AI的企业INDEMIND构建了覆盖机器人感知传感器、感知认知AI模型、消费级物理AI大脑ROBOMIND以及整机落地方案的全链路产品体系 [7] - INDEMIND的核心产品ROBOMIND具备“多模态感知-认知决策-动作执行”的完整技术闭环,采用“端侧+云端”混合架构,具备对家庭非标场景的理解与泛化能力,且端侧硬件成本完全满足消费级市场预期 [7] - 以物理AI为核心的技术突破,让机器人得以理解并适应复杂环境 [9] - INDEMIND通过开放协同模式与合作伙伴共同推动消费级AI机器人的规模化落地 [7] - 文中提到的四款机器人均与INDEMIND有技术合作,且INDEMIND近期与海尔机器人达成战略合作,旨在拓展更多细分家庭场景 [10]
CES2026揭示的AI三场变革:从眼镜到机器人、从家庭到工业丨36氪直击CES
36氪· 2026-01-12 17:30
文章核心观点 - 2026年CES显示,AI正从虚拟工具演变为人类生活的“底层操作系统”,其发展核心是“物理AI”,即人工智能从虚拟世界走向并嵌套进物理世界和真实生活场景[3][4][6] - AI行业正在进行一场从“能力”到“嵌入式生产力”的跃进式跨越,2026年是AI技术融合及产业化元年,各类厂商聚焦于具体场景进行最后一公里的应用探索[6] - 中国科技企业在本次CES上的参与度和存在感前所未有,在多个关键领域成为创新的弄潮儿和主导者[12][21][48] 信息交互:智能眼镜走向“去手机化” - 智能眼镜在CES 2026显露出接棒手机成为下一代信息入口的可能性,行业共识是轻量化、全天佩戴与多模态交互,“下一部手机,未必还是手机”成为趋势[9][10] - 超过50家AI/AR眼镜厂商集体亮相CES,全球市场在2025年爆发式增长,IDC预测2026年将进入规模化拐点,中国是最重要的创新与消费市场之一[10] - 中国厂商Rokid推出全球最轻全功能AI+AR眼镜之一Rokid Glasses,重量仅49克,内置高通AR1芯片,支持拍照、翻译、导航、AI问答等全场景功能,并支持调用不同AI大模型[12] - Rokid同时发布面向海外市场的Rokid Ai Glasses Style,重量仅38.5克,其产品已销往115个国家,积累超10万活跃用户,单日佩戴时长可达8小时[14] - 中国厂商影目科技发布INMO GO3,采用纯CNC五轴精雕工艺告别传统“笨重大黑框”形象,并成为行业首个实现双向对话实时翻译的智能眼镜,支持261种语言,翻译准确率达98%[17] - XREAL与谷歌扩展战略合作,被确定为Android XR主要硬件合作伙伴,2026年将合作推出智能眼镜Project Aura,这是谷歌重回智能眼镜赛道的重要信号[11] AI融入日常生活:从清洁、成长到睡眠、工作 - 清洁机器人正从二维空间向三维空间进化,从“清洁工具”向“整理收纳”工具演进,以应对复杂的家庭场景[19] - 科沃斯升级恒压活水洗地机器人,滚筒较上一代加长50%达26厘米,清洁效率大幅提升[19] - 云鲸新一代扫地机器人能识别更多物品,支持母婴、宠物专属模式,并推出具有强大物体识别和场景智能适配能力的旗舰款机器人吸尘器[19] - 中国品牌库犸科技在2024年7月至2025年6月期间位居全球无边界割草机器人销售额第一,并在CES发布新品矩阵,包括LUBA 3 AWD旗舰机型及泳池清洁机器人SPINO S1 Pro,并宣布入局商用割草市场[21] - 听力熊Teeni.AI推出面向青少年的AI随身机器人Mooni Pro,尝试下一代AI Agent落地形态,通过摄像头与语音理解真实环境,帮助孩子记录和感知世界[22][24] - 中国神经科技创新品牌LumiMind发布首款消费级产品LumiSleep实时调控脑电睡眠仪,基于对“睡眠脑特征”的原创性研究,以毫秒级精度实时采集分析脑电并生成个性化声学干预引导入睡[25][27] - 可以科技发布桌面助理机器人LOONA DeskMate,它是一个兼容MagSafe的3轴仿生机械运动充电站,可将iPhone变为个人助理,深度协同电脑处理邮件总结、日程安排等事务,并能感知用户情绪[29][31] - BroadLink博联智能展示RM MAX(matter版)超级网桥,通过双重桥接能力将红外射频类非智能家电和FastCon智能设备接入Matter生态,破解智能家居“生态孤岛”难题[33][35] 出行与工业底座:AI重构系统 - 黑芝麻智能在CES展示其从“驱动辅助驾驶”迈向“推动智能全维进化”的战略,集中展示辅助驾驶、具身智能与消费电子领域成果[38] - 黑芝麻智能华山A2000芯片通过美国相关审查并推向全球市场,实测性能媲美全球头部智驾芯片,已与东风、吉利等车企合作落地量产车型,并在10天内完成高阶辅助驾驶算法部署[41] - 黑芝麻智能武当C1296舱驾一体量产级方案完成海外首秀,由东风汽车和均联智及共同打造,用单芯片实现数字仪表、智能座舱、智能辅助驾驶等功能[41] - 黑芝麻智能推出面向机器人商业化的SesameX多维具身智能计算平台,并战略控股收购亿智电子以整合其AI SoC芯片优势[41] - 道通科技展示“物理AI”创新成果,包括智能充电机器人,可在云端调度下实现充电枪自动插拔,降低人工依赖,并与全球自动驾驶头部公司推进合作[44] - 道通科技展示“具身集群智慧解决方案”,通过轮式巡检机器人与云端AI系统协同,实现从感知到执行的闭环,已落地园区、能源等高价值场景[44] - 道通科技还展示V2G家用新品AC Compact Gen 2等,通过V2G技术实现电动车与电网的双向能量交互,助力解决AI时代的能源问题[45] - aigo旗下自研光场技术机器人亮相CES,其自研Holoptic 4D光场技术让机器人能像人眼一样接收光的所有信息,精准感知物体姿态、结构和距离,以应对工业AI的挑战[47]
预告︱机器人及人工智能领域近期相关活动预告
机器人圈· 2026-01-12 17:29
行业政策与战略定位 - 机器人产业正改变人类生产和生活方式 为经济社会发展注入强劲动能[1] - 2023年初 工信部等十七部委印发《"机器人+"应用行动实施方案》 目标到2025年制造业机器人密度较2020年实现翻番 服务及特种机器人应用深度和广度显著提升[1] - 2023年11月 工信部印发《人形机器人创新发展指导意见》 提出人形机器人有望成为继计算机、智能手机、新能源汽车后的颠覆性产品 并明确2025年实现批量生产[1] 近期行业活动概览 - 2026年1月12日至25日期间 机器人及人工智能领域有多场行业活动举办[2] - 活动涵盖人形机器人、具身智能、AIGC、传感技术、自动化及智能交通系统等多个前沿领域[2][3] 具体活动信息 - **2026人形机器人与具身智能产业大会** 于2026年1月15日至16日在上海市举办[2] - **2026年大湾区具身智能论坛暨珠海市计算机学会年会** 于2026年1月16日至18日在中山大学珠海校区举办 主办单位包括珠海市计算机学会、珠海复旦创新研究院等[2] - **第二届人工智能与计算机网络技术国际学术会议(ICAICN 2026)** 于2026年1月16日至18日在广州市举办 由广州理工学院主办[2] - **2026年第五届AIGC开发者大会** 于2026年1月17日在北京望京嘉瑞文化中心举办 由AIGCLink主办[2] - **2026全国传感技术与应用研讨会** 于2026年1月20日至23日在哈尔滨黑龙江金谷大厦酒店举办 主办单位包括哈尔滨工业大学、吉林大学、深圳大学等[3] - **2026年机器人、自动化和智能交通系统国际会议(RAITS 2026)** 于2026年1月23日至25日在西安市举办 由长安大学主办[3]
字节,阿里,美团三大互联网大厂组团投了这家企业!
机器人圈· 2026-01-12 17:29
融资与市场地位 - 近期完成10亿元人民币A++轮融资,投资方包括字节跳动、红杉中国、北京信息产业发展基金、深创投、南山战新投、锡创投等顶级机构及地方平台,这也是深创投AI基金成立后的首笔投资 [2] - 此前已先后获得美团、阿里的投资,是国内唯一同时获得字节、美团、阿里三家互联网大厂投资的具身智能企业 [2] - 跨领域资本的协同下注,凸显了资本市场对具身基础模型重要性的集体共识,以及对公司技术领先性与发展潜力的深度认可 [2] 行业趋势与核心命题 - 具身智能成为科技领域焦点赛道,机器人运动控制能力已实现显著突破,行业竞争重心正从“肢体”硬件性能比拼转向“大脑”智能系统的角逐 [2] - 行业突破的关键在于构建能够理解物理世界规律、灵活应对复杂动态场景的智能核心,让机器人真正胜任多样化实际工作 [2] 技术定义与核心价值 - 具身智能基础模型是物理世界的基础模型,与虚拟世界的大语言模型、多模态模型相互独立且平行 [3] - 其核心价值在于突破泛化性与通用性瓶颈,应对物理世界的复杂性,使机器人具备实时处理非结构化、动态及随机任务的能力 [3] - 公司的具身基础模型以机器人的视觉、触觉、语音等多模态感知信息为输入,直接输出动作、视觉及语言等执行指令,构建起连接感知与行动的完整智能闭环 [3] 核心技术优势 - 首创VLA与世界模型深度融合的系统范式,自研的WALL-A模型作为原生多模态输入输出架构,率先实现具身多模态思维链 [3] - WALL-A模型通过世界模型机制进行时空状态预测,结合视觉因果推理理解环境反馈,并借助可学习记忆机制内化物理常识,大幅提升机器人在非结构化环境中移动操作任务的零样本泛化能力 [3] - 依托大规模真机强化学习,模型在与真实物理世界的交互中持续积累高质量学习经验,自主解决长尾问题,实现能力的持续进化,形成“物理世界基础模型 - 真机自主进化”的技术闭环 [3] - 构建高质量真机数据驱动的模型进化引擎,坚持硬件-数据-模型的闭环迭代 [4] - 作为国内最早规模化开展真机数据采集的企业,自研主从遥操、外骨骼、无本体等多种数据采集设备,实现多设备的数据验证与模型突破 [4] - 搭建模型驱动的数据管线,通过数据生成、过滤、增强、标注等全流程处理,持续产出规模化高质量数据,并通过基础模型为数据处理和硬件设计提供反馈,形成正向循环 [4] 技术能力与场景落地 - 模型迭代实现能力跃迁,赋能真实场景任务落地,展现出极强的场景适应力 [5] - 作为全球首个基于物理世界基础模型、成功跨越室外与室内场景的移动操作范例,其机器人在外卖配送与纸箱回收任务中,面对强风干扰或视线遮挡等复杂情况,能通过世界模型的因果推演“脑补”被遮挡物体全貌,并在遭遇卡顿故障时通过强化学习策略自主纠错,无需人工干预即可完成任务闭环 [5] - 在物流场景中,机器人凭借零样本泛化能力精准识别异形件,通过强化学习快速适应工作节拍,高效处理堆叠混乱的包裹 [5] - 基础模型的进化解锁了高自由度灵巧手的应用潜力,机器人已自主掌握手内重定向等类人技能,从工具使用到发牌等指尖力控要求极高的精细动作均能精准完成,攻克了具身智能精细操作的“最后一厘米”难题 [5] 生态共建与全栈自研 - 于2025年9月开源自研端到端具身基础模型WALL-OSS,助力具身智能技术的开放普及 [6] - 坚持软硬件全栈自研路线,从模型算法与数据驱动的核心需求出发,深度定义机器人硬件架构 [6] - 推出“量子一号”、“量子二号”两款高性能机器人本体,并实现机械臂、关节模组、动力驱动器、主控制器等核心零部件的全面自研与算法深度适配,大幅降低整机成本,为具身智能机器人的规模化量产与商业化落地奠定坚实基础 [6] 商业化与未来展望 - 目前已成功切入工业制造、物流、养老等多个高价值领域,其高泛化能力与低成本部署优势得到市场验证,精准对接真实商业需求 [6] - 未来将持续深耕模型迭代、数据管线与机器人硬件三大核心领域,凭借扎实的技术积累与全栈自研能力突破现有边界 [6] - 致力于以领先的模型能力撬动具身智能变革,推动技术价值在产业应用中充分释放,助力模型驱动的具身智能在千行百业实现规模化应用,为产业升级与生产力跃升注入新动能 [6]
维他动力Vbot超能机器狗预订单6540台、销售额近亿元,刷新具身智能行业新纪录
IPO早知道· 2026-01-12 16:04
公司产品发布与销售业绩 - 公司于2025年12月23日发布了面向家庭和个人的消费级具身智能产品——Vbot超能机器狗[9] - 在2025年12月23日至2026年1月10日的限时创始权益预售期内,该产品累计订单量达6540台,预订销售额近亿元[7] - 预售成绩创下了行业内万元级具身智能产品单品历史销量与销售额的最高记录,也刷新了具身智能行业新纪录[7] - 产品开售当日仅52分钟订单即破千台,创下消费级具身智能行业预售最快速度[7] 公司背景与融资情况 - 公司由明星智驾团队创办,创始人兼CEO余轶南是地平线前副总裁、软件平台产品线总裁,联合创始人包括地平线前软件平台总架构师宋巍和理想汽车前智能驾驶产品总监赵哲伦[8] - 公司在2025年完成了种子轮、种子+轮以及天使轮三笔融资,投资方包括高瓴创投、地平线、BV百度风投、元璟资本等十余家机构[8] - 公司半年累计融资规模达3亿元人民币[8] 产品核心定位与特点 - Vbot超能机器狗是全球首款无需遥控的智能机器狗,旨在无缝融入日常生活[3][11] - 产品能自主完成全场景随行、载物、跟拍等多项能力,让智能机器人真正走入日常生活空间[11] - 公司理念是从真实生活场景出发,打造面向家庭与个人的智能机器人,解决让机器人在生活空间中与人自然相处的关键问题[11][12] 产品技术架构与能力 - 公司认为,真正无需遥控的智能机器人必须同时具备三大核心部分:本体智能、空间智能和Agent智能[14] - 本体智能要求具备全地形、长续航和人本主义设计,Vbot通过创新的1:1大小腿部设计,可稳定通过台阶、草地等常见路况,并具备IPX3防淋水级别[14][15] - 空间智能需要高算力、强感知和大模型,公司自研了行业首个全场景空间基座模型,统一处理视觉与雷达信息,完成对空间关系的整体理解与自主决策[14][15] - Agent智能要求机器人能够理解并拆解任务,Vbot提供了全能拓展背板,可支持连接机械臂、载物栏、相机自拍杆和拖拉小车等外设,以适配更多生活场景[14][15] 市场意义与用户反馈 - 产品以万元级的价格在市场反馈上收获亮眼成绩,表明“无需遥控、面向日常生活”的具身智能产品已进入用户愿意接受和付费的新阶段[15] - 预售期间,公司用户运营团队与所有订单用户进行了一对一沟通,实现超过93%的企业微信建联率,累计完成6.9万条订单答疑与反馈沟通[16] - 预售成功验证了消费级具身智能产品的市场潜力,并展现了公司构建系统化用户服务与运营能力的长期决心[16]
具身智能开年最大融资,字节红杉领投10亿
36氪· 2026-01-12 15:39
公司融资情况 - 公司于2026年初完成10亿元A++轮融资,由字节跳动和红杉中国领投,北京信息产业发展基金、深创投、南山战新投、锡创投等机构联合参与[2] - 红杉中国在2025年9月A+轮后继续加码,字节跳动则罕见地在具身智能领域直接出手投资[2] - 公司此前已获得美团和阿里投资,成为国内唯一同时获得字节跳动、美团、阿里三家互联网大厂投资的具身智能公司[2] - 公司在2025年内连续完成多轮融资,包括A+轮、A轮、Pre-A+++轮及Pre-A++轮,形成随技术与产品推进而不断放大的融资曲线[3] - 2025年9月8日,公司完成近10亿元A+轮融资,由阿里云与国科投资领投,国开金融、红杉中国、渶策资本跟投,美团战投超额加码,联想之星、君联资本持续追投[4] - A+轮融资资金主要用于全自研通用具身智能基础模型的持续训练、硬件产品研发迭代以及开源具身大模型WALL-A的推进[5] - 2025年5月12日,公司完成数亿元A轮融资,由美团战投领投,美团龙珠跟投,资金用于端到端通用具身智能大模型与机器人本体的同步迭代及加速应用场景落地[5] - 在A轮之前,公司完成了数亿元Pre-A+++轮融资,由华映资本领投,云启资本、广发信德跟投[5] - 截至Pre-A+++轮阶段,公司成立不到一年半已累计完成7轮融资,融资总额超过10亿元[5] - 2025年2月17日,公司完成数亿元Pre-A++轮融资,由光速光合、君联资本领投,北京机器人产业投资基金、神骐资本跟投,资金用于下一代统一具身智能通用大模型的训练与场景落地[5] - 截至目前,公司成立两年多已完成9轮融资,累计融资额已超过30亿元[5] 公司技术与产品 - 公司成立于2023年12月,聚焦自研“通用具身智能大模型”[6] - 公司创始人兼CEO王潜毕业于清华大学,在美国南加州大学攻读机器人学习博士,是较早将Attention思想引入神经网络体系的研究者之一[6] - 公司联合创始人兼CTO王昊为北京大学计算物理博士,曾任职于IDEA研究院并担任大模型团队负责人,主导发布过多个开源大模型[6] - 公司技术路径的核心观点是“具身智能模型是平行于语言模型的独立基础模型”[6] - 公司认为具身智能需要直接面对真实物理环境中的连续状态、因果关系与动作反馈,其建模目标、训练方式与评估标准与语言模型存在本质差异[8] - 围绕该观点,公司自研了「WALL-A」系列VLA操作大模型,将感知、理解、决策与动作输出统一纳入端到端模型中,以解决传统模块化架构在复杂任务中的推理断层与泛化瓶颈[8] - 2024年10月,公司发布WALL-A模型,成为当时全球参数规模最大的端到端统一具身智能大模型之一[8] - 2025年9月,公司进一步开源具身基础模型WALL-OSS,该模型在近期的RoboChallenge榜单中排名全球第三[8] - 在硬件方面,公司同步推进量子一号与量子二号两代具身机器人[8] - 量子一号为轮式双臂机器人,搭载端到端具身基座模型WALL-A,支持多模态遥操作,主要用于高频操作任务中的数据采集、模型验证及科研教学场景[8] - 量子二号升级为轮式仿人形结构,具备更高自由度与精细力控能力,用于采集复杂操作与高质量物理交互数据[10] - 公司整体战略是先搭建一套可持续进化的具身智能底座,形成模型在真实物理世界中学习、硬件为模型服务、数据反哺模型迭代的闭环[12]
自主水下机器人:在“深海盲盒”中开辟最优航路
机器人大讲堂· 2026-01-12 14:42
文章核心观点 - 一篇发表于《Journal of Field Robotics》的综述文章,为自主水下航行器(AUV)的路径规划提出了一个“环境建模-算法演进-学习决策”三维耦合的系统性理论框架,旨在推动AUV实现全自主、强适应的智能导航[1][4] 高精度的环境感知与任务建模 - 构建完整路径规划框架需同步考量AUV自身运动特性、外部环境建模及任务优化策略三大要素[7] - AUV自身运动特性建模:将其视为六自由度(6-DoF)刚体系统,结合计算流体力学(CFD)与半经验或数据驱动方法,以兼顾精度与计算效率[7] - 外部环境建模:基于深度学习的地形重构技术可有效填补传统声呐测绘的数据盲区,并通过数值模拟或结合强化学习构建并预测三维流场,实现从被动适应到主动利用洋流以降低能耗[8][9] - 任务优化策略:单体AUV侧重于在环境约束下寻找能耗最低的可行路径,多AUV协同则侧重于任务分配与通信协调的多目标优化,分布式强化学习和博弈论策略正取代传统集中式调度以应对通信带宽受限的挑战[9] 传统算法在深海中“摸石头过河” - 传统路径规划方法分为全局规划和局部规划[10] - 全局规划适用于环境相对已知的静态场景:Dijkstra算法能确保全局最优但计算复杂度高,A*算法通过启发式函数提高效率但路径平滑度低,基于采样的方法(如RRT)空间探索能力强但路径随机曲折需二次优化[10] - 受自然启发的群体智能算法(如遗传算法GA、蚁群算法ACO、粒子群算法PSO)在多目标优化中表现出色,但易陷入局部最优且在全局搜索与收敛速度间难以平衡[11] - 局部规划用于应对航行中突发的未知障碍:人工势场法(APF)计算负荷低、响应快,但在复杂障碍下存在局部极小值问题可能导致AUV停滞,动态窗口法(DWA)对动态障碍物鲁棒性好但搜索范围受限于局部感知,实践中常采用“全局引导、局部避障”的混合架构[11] 机器学习驱动的海洋自进化导航 - 机器学习(ML)推动AUV路径规划从“规则驱动”向“数据驱动”范式演进,提升其在复杂动态环境中的自主决策与适应能力[12] - 监督学习用于环境特征提取与非线性映射:生物启发神经网络(BINN)可生成平滑的动态避障轨迹,卷积神经网络(CNN)能实现从环境原始输入到最优路径的端到端映射[12] - 无监督学习为多AUV协作提供高效聚类方案:自组织映射(SOM)网络与K-Means算法可在无标签数据下自动划分任务空间,优化负载均衡与资源配置[12] - 强化学习(RL)使AUV具备自主演化能力:Q-learning及其深度演进版本(如DQN、DDPG、PPO)允许AUV在无先验知识下通过试错学习最优策略,深度强化学习(DRL)在处理非线性干扰(如时变流场)方面具有优势,多智能体强化学习(MARL)解决了非平稳环境下的集群协作难题[13] 未来航线驶向真正的“海洋智能” - 未来研究聚焦于三个关键方向以应对环境不确定性、通信受限及机载算力瓶颈等挑战[15][16][17] - 引入元学习(Meta-Learning)与终身学习(Lifelong Learning)机制:构建快速适应模型,利用极少样本实现跨海域任务快速迁移与知识积累,提升算法泛化性能[16] - 强化多模态感知融合(Multimodal Fusion)技术:集成前视声呐、视觉SLAM、磁力计及惯性导航系统(INS)等多源传感器数据,利用信息互补增强环境建模可靠性[16] - 推动轻量化模型与边缘计算(Edge Computing)协同优化:针对AUV嵌入式处理器算力限制,采用神经网络剪枝、量化等模型压缩技术,并结合边缘计算架构将非实时任务卸载,以降低机载功耗并提升实时规划效率[17]