Workflow
具身智能
icon
搜索文档
机器人不只会抓和放!北大x银河通用「世界-动作模型」赋能全面泛化的非抓握技能
具身智能之心· 2025-08-02 00:02
点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 本文的作者团队来自北京大学和银河通用机器人公司。第一作者为北京大学计算机学院前沿计算研究中心博士生吕江燃,主要研究方向为具身智能,聚焦于世 界模型和机器人的灵巧操作,论文发表于 ICCV,TPAMI,RSS,CoRL,RAL 等机器人顶会顶刊。本文的通讯作者为北京大学计算机学院教授王亦洲和 北京 大学助理教授、银河通用创始人及CTO 王鹤。 尽管当前的机器人视觉语言操作模型(VLA)展现出一定的泛化能力,但其操作模式仍以准静态的抓取与放置(pick-and-place)为主。相比之下,人类在操作物 体时常常采用推动、翻转等更加灵活的方式。若机器人仅掌握抓取,将难以应对现实环境中的复杂任务。例如,抓起一张薄薄的银行卡,通常需要先将其推到桌 边;而抓取一个宽大的盒子,则往往需要先将其翻转立起(如图 1 所示): 这些技能都属于一个重要的领域:非抓握操作(Non-prehensile Manipulation) ...
具身智能舞动、淘宝闪购进场、硬核游戏扎堆:22岁的ChinaJoy,什么变了?什么没变?
每日经济新闻· 2025-08-01 23:17
展会概况 - 第二十二届中国国际数码互动娱乐展览会(ChinaJoy)于8月1日在上海新国际博览中心开幕,吸引大量观众参与 [1] - 展会已从单一游戏形态扩展为多元数字娱乐盛会,成为各行业触达年轻用户的重要窗口 [1] - 本届展会共有743家企业参展,其中外资企业237家,来自37个国家和地区 [5] 行业趋势 - 游戏产业全面复苏:2025年1-6月国内游戏市场实际销售收入达1680亿元,同比增长14.08%,用户规模达6.79亿,同比增长0.72% [5] - 硬件厂商地位提升:硬件产品在展会中占比增加,游戏展区硬件设备支持随处可见 [6] - AI与游戏深度融合:具身智能、AI服务企业大量参展,游戏与AI关联度加深 [7] 参展企业动态 - 索尼PlayStation展区国产游戏《影之刃零》试玩火爆,完美世界《异环》等游戏试玩排长队 [2] - 网易游戏《燕云十六声》场景受关注,上线半年玩家突破4000万 [13] - 腾讯展出17款游戏产品,包含《王者荣耀》等头部作品及Supercell多款知名游戏 [13] - 巨人网络《超自然行动组》首次亮相展会,同时在线人数突破100万 [14] 跨界融合 - 非游戏企业加速进场:淘宝闪购、中国建设银行、比亚迪等企业通过展会触达年轻用户 [1][6] - "痛文化"盛行:比亚迪展出《黑神话:悟空》主题"痛车" [6] - 数字文创受追捧:Soul数字文创产品3分钟售罄,精神动物话题年增长率达2000% [9] 全球化布局 - 中国游戏厂商加速海外深耕:游族网络构建跨境算力体系,智能翻译平台节省80%本地化成本 [12] - 海外精品加速入华:多家海外游戏厂商亮相展会 [12] 技术创新 - 游族网络推进美术资产生产、代码生成等领域的自动化,自动化测试覆盖70%用例编写 [12] - Soul平台通过数字头像实现动态情感表达,创新社交工具 [9] IP运营 - 经典IP创新演绎:《征途》与《甄嬛传》联动展台受玩家欢迎 [17] - 跨界联动增多:《超自然行动组》与《精灵梦叶罗丽》、昆仑山世界地质公园等IP合作 [14]
解码具身智能:决定成败的2个维度与5个阶段 | Jinqiu Select
锦秋集· 2025-08-01 22:30
SemiAnalysis 团队最近发表了一篇深度报告,提出了一个清晰的机器人分级框架,将机器人技术发展划分为五个等级。 作者认为,通用智能机器人不会一蹴而就,而是会像自动驾驶技术一样,经历一个从低到高的发展过程;决定机器人发展水平的两个关键能力分别是 主动性 (Agency)与灵巧性(Dexterity) 。 主动性决定了机器人能否在复杂环境中自主理解任务、做出决策和规划行动;而灵巧性则决定机器人能否精确、稳定地执行这些物理动作。报告强调,这两个维度 缺一不可,它们共同决定了机器人实际能创造的商业价值。若任意一方受限,机器人应用的场景和深度都将受到极大制约。 在上述框架下,作者给出了机器人产业发展的五个演进阶段。 锦秋基金(公众号:锦秋集;ID:jqcapital)认为这篇文章提供了一个系统性的框架,帮助读者理解机器人技术从简单的、无智能的自动化工具,如何一步步演进为 能够在复杂、非结构化环境中执行多样化任务的通用智能体。它不仅定义了每个发展阶段的核心能力和典型应用,还分析了其背后的技术驱动力、商业模式和当前 挑战,因此也做了编译。 几十年来,机器人一直为制造业提供动力,但它们始终是单一用途的,并且只在完美的 ...
三天超150亿!WAIC 2025上海收官;M50芯片 10W功耗干翻英伟达;OpenAI深夜引爆学习革命 | 混沌AI一周焦点
混沌学园· 2025-08-01 20:06
中国AI开源浪潮 - 中国AI巨头智谱、Qwen、腾讯混元等在Hugging Face榜单包揽前10名,全部为开源模型 [2] - 近一个月密集发布超10款创新模型,包括GLM-4.5登顶、Qwen占5席 [2] - 开源浪潮推动全球AI生态向中国倾斜,对比海外闭源涨价趋势,重塑产业竞争规则 [2] OpenAI教育功能革新 - OpenAI推出ChatGPT学习模式,通过交互式提示和个性化支持引导学生主动探索知识 [3] - 该功能免费开放所有用户,或将重塑教育科技竞争格局 [3] - 采用提示词工程构建,强调元认知培养,挑战传统教育辅助工具 [5] Anthropic估值暴涨 - Anthropic获得50亿美元融资,公司估值飙升至1700亿美元,较四个月前增长近三倍 [6] - 预计其2027年营收将达350亿美元并超越OpenAI [6] - 此举将颠覆AI竞争格局,推动主权基金加速入场 [6] WAIC 2025盛会成果 - WAIC 2025吸引800余家企业参展,展区面积达7万平方米,参观人次突破35万 [7] - 现场签约31个项目,投资总额超150亿元 [7] - 展示人工智能从"参数竞赛"向生产力落地的转变,具身智能与智能体应用成为焦点 [7] Surge AI数据标注领先 - Surge AI以120人团队实现10亿年营收,未融资状态下反超ScaleAI [8] - 成为OpenAI、谷歌、Anthropic核心数据供应商 [8] - 创始人提出"高质量人类数据>合成数据"的颠覆性观点 [8] 微软浏览器AI升级 - 微软推出Edge浏览器"Copilot模式",实现跨标签页情境感知、语音控制及自动分组功能 [9] - 该AI智能体可同时分析9个网页内容,支持复杂操作 [9] - 限时免费开放预示浏览器付费时代来临 [9] 智谱模型开源突破 - 智谱开源旗舰模型GLM-4.5,专为Agent应用打造 [10] - 以MoE架构达到开源模型SOTA性能(全球第三/国产第一) [10] - API成本低至输入0.8元/百万tokens,输出速度最高可达100 tokens/秒 [10] AI芯片能效创新 - 后摩智能发布第二代存算一体芯片M50,以10W超低功耗实现160TOPS@INT8算力 [11] - 自研天璇架构最高可提供160%加速效果 [11] - 推出全场景硬件矩阵,颠覆边缘计算领域 [11] AI设计工具革新 - Lovart推出全球首款AI设计Agent"ChatCanvas",实现设计全流程自动化 [12] - 支持实时圈选修改、多图融合生成及视频动态化创作 [12] - 软件体验从以界面为中心的UX转向以Agent为核心的AX [12] 营销AI Agent突破 - 钛动科技发布全球首个营销AI Agent产品Navos [13] - 通过多智能体协同大幅降低企业出海营销成本 [13] - 成熟客户ROI提升3倍以上,中小客户ROI飙升50倍,营销周期效率跃升10-50倍 [13][17] 像素绽放融资扩张 - 像素绽放完成B3轮战略融资,加速全球化布局 [15] - 核心产品AiPPT.cn和AiPPT.com合并月访问量达2347万次 [15] - 锁定全球办公市场——存量5000亿、5年7000亿规模 [15]
外卖(WAIMAI)大战尴尬收场,但巨头们仍在“窘境”中竞争AI
36氪· 2025-08-01 20:01
外卖市场竞争格局 - 美团、淘宝、京东同步发文抵制恶性竞争,外卖大战告一段落 [1] - 巨头竞争焦点转向AI领域,包括自研大模型和具身智能 [1] - 外卖市场渗透率达22.6%,订单量增速降至7.2%,平台需为每单补贴3-12元维持增长 [18] 京东战略布局 - 京东持有2095亿现金及等价物,拥有3600个自营仓库及云仓,总管理面积3200万平方米 [6] - 京东单日投资16亿元领投三家具身智能企业(千寻智能、逐际动力、众擎机器人),覆盖"AI大脑-硬件本体-场景落地"全链条 [1][7] - 京东物流场景作为技术验证"试验场",拣货效率提升3倍以上 [6][7] - 京东推出JoyInside平台,将自研大模型植入第三方机器人硬件,建立"买机器人上京东"渠道心智 [14] 美团投资策略 - 美团连续投资星海图、自变量机器人等具身智能项目,成为宇树科技最大外部股东 [1][11] - 美团2024年累计投资8家具身智能企业,单年投入超十亿元 [15] - 美团开放700万商户网络作为试验场,银河通用人形机器人已落地无人药店 [15] 阿里技术路线 - 阿里通过大模型底座投资逐际动力、星尘智能,专注"大脑"而非"本体" [16] - 阿里将云计算、大模型与机器人技术深度绑定,形成差异化竞争力 [16] - 阿里云大数据和AI平台具备千卡、万卡规模算力集群,可延伸至具身智能产业 [16] 行业投资趋势 - 2025年前5个月机器人领域融资额达232亿元,超过2024年全年209亿元总和 [14] - 巨头通过投资而非自研布局机器人赛道,因硬件领域"越亏越深"特性 [11][12] - 配送机器人成本高昂(60万元/台),单均成本12元远高于骑手4-5元 [11] 市场估值与增长 - 京东静态PE仅8倍、美团18倍、阿里16倍,股价表现逊于恒生指数11%涨幅 [18] - 具身智能技术成熟后可能改写行业规则,从"补贴大战"转向"技术密度" [18] - 技术-产品-市场正循环是决定胜负的关键,需将单台机器人成本压缩至接近商用 [18]
云逛2025世界人工智能大会:800+企业集结,具身智能“霸馆”,人形机器人走进现实
机器人圈· 2025-08-01 19:55
世界人工智能大会(WAIC 2025)概况 - 展会规模创历届之最,面积突破7万平方米,汇聚800多家企业[2] - 展示内容涵盖40余款大模型、50余款AI终端产品、60款智能机器人及80余款全球/中国首发新品[2] - 聚焦"模型应用+具身智能+智能硬件"三大方向,覆盖智能体、人形机器人、AI芯片等热门领域[2] 具身智能与人形机器人创新 自变量机器人 - 通用具身大模型WALL-A驱动的机器人"小量"具备复杂环境抗干扰能力,可自主制作个性化香囊[4] - "小白"机器人通过语义导航实现无环境建模的垃圾清理与衣物收纳[4] - 轮式双臂仿人形机器人"量子2号"拥有62个自由度,工作空间覆盖0-2米[6] 松延动力 - 高动态运动平台N2实现奔跑、后空翻等高难度动作,获人形机器人马拉松竞赛亚军[9] - 仿生情感机器人"小诺"具备情绪识别与面部表情复现能力,适用于教育陪伴场景[9] 优艾智合 - "一脑多态"具身智能模型支持多形态机器人协同,人形机器人"巡霄"可完成冰淇淋制作等柔性操作[25] 宇树科技 - 格斗机器人G1配备29个关节与动态平衡系统,可完成拳击连招与自主起身动作[29] 智元机器人 - 全明星机器人阵容覆盖工业物流、商业服务等五大场景,支持群舞表演与棋类对弈[31] 傅利叶智能 - GR-3人形机器人触觉反馈精度达0.1毫米,医学术语理解准确率98.7%,采用亲肤材料设计[39] 赛博格 - Cyborg-R01具备20kg大负载搬运能力,配备500g超轻量灵巧手[42] 跨维智能 - DexForce W1 Pro人形机器人实现全流程咖啡制作,支持语音指令交互[44] 核心技术创新 运动控制 - 钛虎机器人自主研发一体化关节模组,应用于T170V2.1与T140人形机器人[33] - 国家地方共建中心"青龙3.0"新增算力背包系统,集成5G通讯与北斗定位[47] 触觉感知 - 墨现科技柔性电子皮肤触觉传感器可实时识别抓取力度[19] - 他石智能触觉传感器具备材质识别功能[21] 灵巧操作 - 灵巧智能展示3指(80%日常任务覆盖)与5指(高拟真度)机械手产品[15] - 灵心巧手Linker Hand实现电子琴弹奏,具备高精度运动控制[17] 行业应用落地 服务场景 - 擎朗XMAN-F1展示"岗位化"服务能力,支持持续学习拓展工作模式[36] - 银河通用Galbot机器人实现商超场景全天候值守,处理密集SKU货架管理[48] 工业场景 - 北京人形机器人创新中心展示分布式具身智能体架构,四机器人协同完成工业任务链[56] - 网易灵动推出露天矿山专用具身智能模型"灵掘"[64] 消费领域 - 傲鲨智能VIATRIX外骨骼采用浮动式髋关节设计,提供46Nm腿力增强与25km续航[10][62] - 非夕科技与穹彻智能联合展示自适应机器人蛋雕、按摩等生活化应用[65]
腾讯张正友回应具身智能三问:不造硬件、此时开放、人形非终极
机器人圈· 2025-08-01 19:55
腾讯Robotics X实验室的战略布局 - 公司2018年成立Robotics X实验室并制定"十年规划",目前已进入第7年[2] - 在WAIC推出具身智能开放平台Tairos,明确战略定位为具身智能平台而非硬件竞争者[3] - 公司不直接参与本体硬件量产,聚焦软件能力进化与开放[3] Tairos平台的定位与价值 - 平台整合五代机器人技术积累,包括多模态感知、规划、感知行动联合三大核心模型及虚实融合仿真平台[6] - 采用模块化设计,企业可根据需求选择功能模块,仅需少量数据即可完成适配[7] - 已与宇树机器人等种子企业深度合作,实现仿真-真实闭环应用[8] - 走访60-70家企业后发现市场普遍缺乏具身智能开发工具,推动平台开放[6] 技术研发路径与场景选择 - 小五机器人作为研究原型,重点探索养老、家居等对安全性和鲁棒性要求高的复杂场景[5] - 通过调酒机器人等展示性硬件验证灵巧性和触觉能力,但不进行本体量产[5] - 研发腿轮一体化机器人,探索更适合现代人居环境的非仿生形态[10] - 提出具身智能可能进化出屏幕等非传统交互形态的创新设想[11] 行业现状与未来展望 - 行业面临3D动态建模、触觉传感器标准化、模型泛化能力等核心技术瓶颈[6] - 当前处于类似通信设备"大哥大时代前夜",需等待场景规模化与成本可控[9] - 认为行业泡沫是必经过程,本体形态探索将持续投入[9] - 预测明年机器人马拉松将实现完全自主,无需人工遥控[9]
芳源股份:东北证券、民生加银基金等多家机构于7月31日调研我司
证券之星· 2025-08-01 19:41
公司基本情况 - 公司正从依赖单一产品和客户向产品、客户多元化转型,产品涵盖前驱体、硫酸盐及碳酸锂等,格局相对均衡 [2] - 专注于高镍、高端产品领域,如高镍NC二元前驱体产品,该产品自2024年开始出货且增长迅速,主要应用于具身智能装备 [2] - 高效镍锂分离技术取得突破,使用电池回收材料为原料,具有采购成本低、产品品质高等优势,硫酸钴产品可应用于高端数码行业 [2] 财务与经营状况 - 近两年业绩持续亏损,主要受行业竞争加剧、募投项目投产后固定支出增加及原材料价格波动影响 [3] - 2025年一季度主营收入4.07亿元,同比下降3.13%,归母净利润-4965.43万元,同比下降805.8%,毛利率-4.06% [11] - 负债率82.85%,财务费用2267.49万元,融资融券数据显示近3个月融资净流入855.3万,融券净流入7523.0 [11] 产品与技术 - NC产品能量密度更高,电池循环寿命较好,生产工艺要求更严格,价格较NCM更高 [4] - 公司自2015年进入高镍三元前驱体领域,2017年开始批量供应,近年来为提高产能利用率生产少量5系前驱体产品,但毛利率较低 [4] - 在固态电池领域,公司以高镍三元体系为主进行技术储备和研发,配合客户需求 [5] 市场与客户 - 具身智能装备的下游客户包括正极材料客户、电芯企业及终端机器人客户 [6] - 通过与客户早期合作研发,公司从2022年开始开发NC产品,受益于智能机器人行业发展,出货量同步上升 [7] 资金与融资 - 公司资信状况良好,与多家商业银行保持良好合作关系,银行贷款稳定,授信续约无实质性障碍 [9] - 将优化货币资金配置、强化现金流管理,稳固既有授信额度并拓展多元化金融合作场景 [9] - 对于可转债转股,公司将综合判断多方面因素,适时下修转股价格以促进转股 [11]
汽车行业深度报告:智能汽车产业链与具身智能产业链协同发展
国元证券· 2025-08-01 19:12
行业投资评级 - 智能汽车产业链与具身智能产业链协同发展进入加速落地阶段 [6][12] - 2025年成为具身智能量产元年,行业从技术验证迈入规模化生产 [16] 核心观点 具身智能发展沿革 - 2020年OpenAI发布ChatGPT3开启智能化周期,具身智能进入快速发展阶段 [8][11] - 2020-2025年为初级智能化阶段,特斯拉、小米、比亚迪等企业密集入局形成产业链雏形 [11] - ChatGPT3推动具身智能从机械执行升级为具备认知能力的智能体 [11] 供给端进展 - 2025年多家厂商量产计划落地:特斯拉年产5000台、优必选1000台、智元机器人1万台产能 [13][16] - 工业场景为优先攻坚领域,技术成熟度与需求适配性较高 [16] 政策端支持 - 2025年深圳、北京、广东等地出台专项政策,聚焦技术攻关与千亿级产业集群建设 [17][18] - 长三角、京津冀、珠三角差异化布局,形成研发-制造-应用全链条发展 [21] 需求端潜力 - 制造业到2035年替代率预计达59%,机器人需求547.6万只 [23][26] - 住宿餐饮业替代率73%,教育行业机器人需求137.1万只 [26] - 2027-2035年机器人需求年均复合增长率31.5% [27] 整车产业链与具身智能结合 布局原因 - 硬件趋同:传感器、芯片、电机等组件复用率达70%以上 [43][49] - 软件趋同:自动驾驶VLA模型与具身智能架构高度一致 [59][64] - 生产场景优势:车企工厂提供天然数据采集环境 [76][82] 企业动态 - 特斯拉Optimus成本有望降至2-3万美元,小鹏IRON已实现工厂实训 [36][78] - 华为、比亚迪等车企研发团队超4000人,云端算力达10EFlops [84][86] 具身智能核心硬件 丝杠技术 - 行星滚柱丝杠传动效率90%,寿命为滚珠丝杠10倍以上 [90][92] - 2023年中国丝杠市场规模31.2亿,行星滚柱丝杠占比4% [94][98] - 本土产品在精度、承载能力上与国际仍有差距 [99]
对话理想智驾团队:端到端像「猴子开车」,VLA有机会抵达「ChatGPT时刻」
雷峰网· 2025-08-01 19:11
核心观点 - 理想汽车发布首款纯电SUV理想i8,售价32.18万至36.98万元,被视为公司在纯电赛道的关键一步 [2] - 理想i8将搭载下一代智能辅助驾驶方案VLA司机大模型,成为重要卖点 [3] - VLA代表以强化学习为核心的新范式,具备思维能力、沟通能力、记忆能力和自主学习能力四大核心能力 [6] - 公司已积累12亿公里有效数据,云端算力规模达13EFLOPS [1][6] - VLA模型通过生成式方法和仿真环境构造稀缺数据,突破传统模仿学习路径的瓶颈 [6] 产品发布 - 理想i8为六座家庭SUV,定价参考理想L8,目标达到L8上市首月交付5293辆的水平 [2] - 理想i8交付时间定于8月20日,因需同步交付VLA司机大模型 [3] - 公司从去年开始预研VLA,今年初成立项目组攻关工程化研发 [4] 技术突破 - VLA通过强化学习解决端到端模型的数据质量和训练效率双重瓶颈 [5][6] - 端到端模型MPI从去年7月的十几公里提升至今年初的近100公里,7个月内增长近10倍 [4] - 从3月到7月底近5个月,端到端模型性能只提升2倍左右,显示遇到瓶颈 [5] - VLA推理帧率达10Hz,相比之前端到端的3Hz提升三倍多 [8] - 公司自研4B基座模型,采用MoE混合专家架构,专门针对嵌入式芯片定制 [9] 数据与算力 - 公司积累12亿公里有效数据,云端算力规模达13EFLOPS(2万张H20等效训练卡,3万张等效L20推理卡) [6][7] - 在规则算法时代训练卡不到1EFLOPS,端到端时代增长到10EFLOPS,增长10倍左右 [12] - 公司使用FP8格式实现1000TOPS算力,计划向FP4演进 [20][31] 仿真测试 - 公司90%以上测试采用仿真测试替代实车测试 [16] - 仿真测试效果优于实车测试,成本更低 [17] - 公司2024年进行150多万公里实车测试验证仿真环境可靠性 [28] - 仿真系统准确率达99.9%以上 [28] 安全指标 - 理想车主人驾数据为60万公里出一次事故,辅助驾驶功能下为350到400万公里发生一次事故 [13] - 目标将MPA提升到人类驾驶的10倍,即600万公里出一次事故 [13] - 当前MPA指标为300万公里左右 [13] 行业定位 - 公司是国内最早落地VLA的车企,认为技术壁垒在于世界模型仿真能力 [37][55] - VLA技术可拓展到其他机器人领域,公司已成立相关机器人部门 [55] - 公司采用"预研一代、研发一代、交付一代"的技术发展思路 [54] 用户体验 - VLA版本在内部评分上已全面超越端到端7.5版本 [58] - 重点提升行车舒适度,其次为安全和效率 [14] - 计划为不同用户提供个性化驾驶风格体验 [30]