Workflow
Atlas人形机器人
icon
搜索文档
波士顿动力x TRI联手!使用大型行为模型(LBM)训练Atlas!目标“AI通才机器人”
机器人大讲堂· 2025-08-25 20:10
大型行为模型(LBM)技术突破 - 大型行为模型是人形机器人实现多任务操作、全身协调和应对意外情况的核心技术方向 [1] - 波士顿动力与丰田研究院合作开发端到端语言调节策略 使Atlas能够完成长远操控任务 [2] - 策略训练采用4.5亿参数扩散变压器架构 以30Hz图像输入和语言提示为条件 预测1.6秒动作块 [11] 通用化策略体系构建 - 策略开发遵循四流程:数据收集、数据处理、神经网络训练和策略评估 [3] - 通过真实机器人和模拟环境远程操作收集行为数据 并纳入机器学习管道 [3] - 评估结果指导后续数据收集方向和网络架构优化 [3] 核心设计原则 - 搭建远程操作系统结合模型预测控制器与VR界面 覆盖从手指到全身的运动任务 [5] - 采用多任务语言调节策略 整合Atlas预训练数据、上身操控测试台数据和TRI Ramen数据 [5] - 构建支持快速迭代的基础设施 结合模拟和硬件测试持续提升性能 [5] 硬件配置与系统升级 - Atlas拥有78个自由度 Atlas MTS拥有29个自由度 二者共享硬件与软件 [9] - 每个夹爪含7个自由度 支持强力抓取和捏合抓取等多种策略 [9] - 新增足部追踪器实现足部一对一追踪 扩展远程操作控制逻辑 [10] - VR系统提供实时反馈包括机器人状态、控制目标和传感器读数 [10] 模拟技术应用 - 模拟堆栈忠实还原硬件与软件堆栈 支持快速迭代和高效培训 [11] - 作为联合训练数据源 为多任务多体现策略提供数据支持 [11] - 模拟与硬件平台共享数据管道、可视化工具和训练代码 [11] 操控能力突破 - Atlas能完成三项连贯子任务 实现迈步调整、蹲伏降低重心和手指精确捏合 [14] - 可操控22磅(9.9公斤)汽车轮胎 处理几何形状可变形和操作序列复杂任务 [16] - 策略推理速度可提升1.5-2倍 部分场景速度超越人类远程操作极限 [18] 技术通用性与未来规划 - 数据驱动方法具有通用性 适用于任何可通过远程操作演示的下游任务 [19] - 计划扩展数据飞轮 提高吞吐量、质量、任务多样性和难度 [19] - 探索新算法理念 在既定任务和性能基准基础上持续改进 [19]
全球首个1:1柔顺机械手设计!韩国WIRobotics重磅发布ALLEX人形机器人上半身!
机器人大讲堂· 2025-08-24 21:15
公司产品发布与技术突破 - 韩国WIRobotics发布首款通用人形机器人ALLEX上半身 具备15个关节和0.3毫米重复定位精度 实现力感知与物理交互的类人反应 [1][4][6] - ALLEX突破传统机器人局限 无需力传感器即可检测100克外力 手臂摩擦与转动惯量较传统协作机器人降低10倍以上 [4][6][8] - 公司以ALLEX为基础构建模块化通用人形平台 计划提供手臂、手部、身体及主导系统的单独或组合方案 [10] 公司背景与主营业务 - WIRobotics成立于2021年 主营产品包括超轻型可穿戴机器人WIM(重1.4千克)和无动力背部支撑机器人WIBS [10][12] - WIM助行机器人支持多模式功能 2024年4月在韩国上市后8个月内销量达500台 [12] 融资与合作伙伴 - 2024年3月完成130亿韩元(约950万美元)A轮融资 由Intervest领投 累计通过4轮融资筹集311万美元 [14] - 与RLWRLD、麻省理工学院、伊利诺伊大学等机构建立技术合作 构建开放创新生态 [10] 韩国人形机器人市场竞争格局 - NAVER的AMBIDEX机器人应用于星巴克门店 在10余家旗舰店完成原料配给与辅助操作 [17] - 三星Rainbow Robotics的RB-Y1实现工业规模化应用 日处理800个装配工位 操作精度达0.1毫米 [17][19] - 波士顿动力Atlas在现代汽车工厂进行焊接辅助与零部件搬运实训 通过多模态传感器适应复杂环境 [19][21][22] 行业生态与产业链 - 中国机器人产业链覆盖工业机器人、服务特种机器人、医疗机器人、人形机器人及核心零部件企业 [25][26][27][28] - 教育机器人领域包括硅步机器人、史河科教机器人等企业 [28]
快讯|优必选牵头两项人形国标;富士康投资机器人公司;盛视科技切入机器人潮玩市场等
机器人大讲堂· 2025-08-22 12:27
机器人行业投资与融资动态 - 香港机器人初创公司Robocore Technology获得富士康科技集团1000万美元D轮融资首笔投资 富士康持有6.6%股份 并有权在2026年和2027年分别追加两笔1000万美元注资 [2] - Robocore由工程师Roy Lim于2018年创立 最初是Temi轮式助手机器人在香港的独家经销商 并于去年收购了这家以色列公司 [2] - 富士康正与英伟达洽谈在休斯顿工厂部署人形机器人用于生产AI服务器 并与优必选机器人公司合作在工厂部署人形机器人 [2] 人形机器人技术突破 - 波士顿动力为Atlas人形机器人训练全新大型行为模型LBMs 这是一种端到端由语言指令驱动的策略模型 能让机器人完成需要长远规划的复杂操作任务 [5] - 策略模型能充分利用人形机器人独特优势 包括迈步行走 精准落脚 弯腰下蹲 转移重心 避免自我碰撞等能力 以30Hz频率控制整个机器人活动 [5] - 研究人员采用结合流匹配损失的扩散型Transformer架构训练模型 将图像 本体感觉和语言提示等输入信息转化为动作指令 [5] 行业标准制定进展 - 优必选牵头《人形机器人技术要求 第6部分:定位导航》和联合牵头《人形机器人技术要求 第7部分:人机交互》两项国家标准正式获批立项 [8] - 今年4月份优必选还牵头了首批人形机器人技术要求国家标准 负责制定作业操作技术要求 [8] - 公司将持续深度参与人形机器人相关行业标准建设 为技术研发 产品落地及产业规范化发展提供标准化支撑 [8] 企业战略布局与合作 - 盛视科技投资1000万元设立全资子公司深圳菲菲特文化创新有限公司 旨在将AI 人形机器人与潮玩创新结合 打造智能陪护和情感交流体验的AI潮玩产品 [11] - 格力博与浙江智鼎机器人有限公司签署合作协议 共同发力商用清洁机器人全球市场 形成"核心技术+制造落地+全球渠道"三位一体模式 [14] - 格力博凭借海外渠道资源助力浙江智鼎商业清洁机器人扩大海外市场销路 提升全球市场占有率 此举为公司打开比传统园林机械更广阔的市场空间 [14] 行业生态体系 - 机器人行业已形成完整产业链生态 包括工业机器人 服务与特种机器人 医疗机器人 人形机器人 具身智能企业以及核心零部件企业等多个细分领域 [19][20][21][22] - 行业涵盖从埃斯顿自动化 优必选科技等整机企业 到绿的谐波 思岚科技等核心零部件供应商 形成协同发展的产业格局 [19][20][21][22]
腾讯研究院AI速递 20250822
腾讯研究院· 2025-08-22 00:01
全新Pixel 10系列发布 - 谷歌发布Pixel 10系列四款机型,搭载Tensor G5芯片和Gemini Nano模型,强调AI深度整合成为标志性特点 [1] - 新机型配备多项AI功能:Gemini Live语音助手、Voice Translate实时语音翻译、Nano Banana照片编辑器和Camera Coach摄影导师等 [1] - Pro Res Zoom支持高达100倍智能变焦,Magic Cue智能信息提示自动从Gmail和日历中提取内容,谷歌宣告"传统智能手机时代终结" [1] DeepSeek-V3.1模型发布 - DeepSeek正式发布V3.1模型,采用混合推理架构同时支持思考与非思考模式,思考效率和Agent能力均有显著提升 [2] - 新模型在编程智能体测评SWE和搜索智能体测评上取得明显进步,并在保持性能的前提下减少20%-50%的输出token [2] - 模型全面开源,采用UE8M0 FP8 Scale参数精度,API同步升级对Anthropic API格式的支持,上下文扩展至128K [2] 字节Seed团队开源Seed-OSS系列模型 - 字节跳动Seed团队开源三款模型:Seed-OSS-36B-Base(含合成数据和不含合成数据两个版本)和Seed-OSS-36B-Instruct [3] - 模型用12万亿tokens训练,采用Apache-2.0许可证,支持512K超长上下文窗口和灵活推理预算控制 [3] - 在MMLU-Pro、MATH、AIME24等测试中表现突出,特别是Instruct版本在多个开源基准测试中创下新SOTA记录 [3] 港大和可灵团队推出Context as Memory技术 - 港大和快手可灵团队推出Context as Memory技术,在视频生成中实现长时间保持场景记忆力,效果媲美谷歌Genie 3且投稿时间更早 [4] - 该技术创新性地将历史生成的上下文作为"记忆",并设计基于相机轨迹视场的记忆检索机制,大幅提升计算效率 [4] - 研究发现视频生成模型能隐式学习3D先验,无需显式3D建模,能在几十秒时间尺度内保持原视频的静态场景记忆力 [4] 百度发布蒸汽机(MuseSteamer)视频模型2.0 - 百度发布蒸汽机(MuseSteamer)视频模型2.0,利用中文音视频一体化生成技术,解决AI视频生成中对白不自然的痛点 [5] - 新模型提供四款版本(turbo、pro、lite和有声版),能精准匹配中文口型,支持情感表达和方言,驱动静态照片说对白 [5] - 该技术将声音和画面同步构思,无需后期匹配,采用"多模态潜在空间规划器"技术,大幅降低视频制作成本和复杂度 [6] 腾讯元宝接入腾讯视频功能 - 腾讯元宝接入腾讯视频功能,用户与元宝聊天时若检索到腾讯视频片源,回答中会显示可点击的封面卡片或片名链接 [7] - 用户可通过给出片名寻找类似风格的影片、向元宝描述场景获取个性化片单推荐、用模糊记忆找回想不起名字的电影 [7] - 除了搜片和推荐功能,元宝还能与用户深入探讨影片的创作背景、剧情内涵和风格流派,点击相关作品即可直接跳转观看 [7] 波士顿动力Atlas人形机器人新进展 - 波士顿动力发布新视频展示Atlas人形机器人进化,基于最新的大型行为模型(LBMs)实现多任务、语言驱动的精准控制 [8] - 该系统由四部分组成:通过遥控操作收集具身行为数据、处理标注数据、训练统一神经网络策略模型、通过测试任务评估策略模型 [8] - Atlas机器人现可流畅完成"维修站"任务,包括复杂的移动操作、灵巧抓取、二次抓握等,能智能应对意外情况,推动通用AI机器人发展 [8] GPT-5官方解析 - OpenAI研究员称GPT-5的行为设计有意针对"逢迎问题",旨在平衡互动感与健康助手属性,且创造性写作、编程能力显著提升 [9] - 随着评测基准趋于饱和,未来模型优劣将主要看实际使用场景,团队从目标能力反推,根据真实世界需求设计内部评测 [9] - OpenAI的智能体发展战略从ChatGPT开始,向Deep Research、功能更完整的Agent进化,目标是构建异步执行任务的系统,能长期维持跨平台记忆 [9] Index Ventures投资逻辑 - Index Ventures投资总监强调创始人特质比市场规模更重要,优秀创始人能将小市场做大,如Adyen和Figma案例所示 [10] - 美国与欧洲创始人存在明显差异:美国创始人更具全球化野心和融资能力,欧洲创始人虽更务实但往往受限于市场分散和资本不足 [10] - 欧洲要想诞生全球性AI巨头必须解决三大核心问题:提升资本密度、加速市场一体化、完善人才体系以留住顶级研究者和创业者 [10]
苹果、Meta、谷歌...谁将打造人形机器人时代的“安卓”系统?
华尔街见闻· 2025-06-30 18:58
全球人形机器人市场发展现状 - 全球人形机器人市场正处于爆发前夜,科技巨头如Apple、Meta、Google、华为等正通过开源机器人模型和工具争夺生态主导权 [1] - 中国政府对人形机器人产业支持力度持续加强,投资基金规模已达1870亿元人民币 [1][6] - 摩根士丹利预测到2050年全球人形机器人市场年收入可达5万亿美元,累计采用量将达10亿台,约为2024年全球20大汽车制造商总收入的两倍 [1][8] 科技巨头竞争格局 - 科技巨头开源竞争白热化,Meta发布12亿参数的V-JEPA 2世界模型,Google推出Gemini Robotics On-Device,Apple发布EgoDex数据集,华为推出CloudRobo具身智能平台 [5] - 开源策略旨在将AI工具扩展到物理世界,并将开发者绑定到各自生态系统 [2] - 科技公司近期开始大规模招聘机器人人才,AI投资向硬件领域分散将加速行业发展 [3] 中国市场优势与政策支持 - 中国在制造业基础和政策支持方面具有优势,可能在全球"机器人竞赛"中占据领先地位 [1][7] - 各级政府设立总规模1870亿元人民币的产业基金,包括北京100亿元机器人基金、深圳100亿元AI和机器人基金等 [6] - 武汉市提供双边补贴,应用方最高补贴100万元(占项目投入30%),产品提供方最高补贴100万元(占研发投入20%) [6] - 5月份中国人形机器人公司融资达25笔交易,宇树科技C轮融资后估值达17亿美元 [6] 商业化应用进展 - 富士康和英伟达计划在AI服务器制造工厂部署人形机器人,预计2026年一季度投入使用 [8] - 亚马逊开发人形机器人配送系统,将测试Unitree G1等机器人 [8] - 特斯拉预计年底前生产"数千台"Optimus人形机器人用于自家工厂 [8] - 人形机器人正从概念验证快速迈向实际商业应用,尤其在制造业和物流领域显著提升效率并降低成本 [8] 市场预测与价格趋势 - 预计到2036年全球将采用2370万台人形机器人,2040年达1.344亿台,2044年达4.28亿台 [9] - 高收入国家人形机器人平均售价将从2024年的20万美元降至2040年的5万美元 [9] - "人形机器人100"指数今年以来上涨14.4%,跑赢标普500指数约11个百分点,其中双林股份涨幅148%,金力永磁上涨132% [1]
华为鸿蒙PC即将亮相,产业链迎发展机遇;现代汽车将部署Atlas人形机器人,推动人形机器人商业化进程加速——《投资早参》
每日经济新闻· 2025-05-07 07:42
重要市场新闻 - 美股三大指数集体收跌,道指跌0.95%,纳指跌0.87%,标普500指数跌0.77%,大型科技股多数下跌,Meta跌超2%,特斯拉、英特尔跌超1%,苹果、微软、谷歌、亚马逊小幅下跌,奈飞小幅上涨 [1] - 医药股跌幅居前,礼来跌超5%,中概股多数上涨,纳斯达克中国金龙指数收涨0.42%,文远知行涨超31%,小马智行涨超47%,老虎证券涨超3%,传奇生物跌超6%,百济神州跌超4% [1] - 国际油价大涨,美油主力合约收涨3.27%报59.00美元/桶,布伦特原油主力合约涨2.99%报62.03美元/桶,国际金价大幅走高,现货黄金涨2.95%报3431.11美元/盎司,COMEX黄金期货涨3.60%报3441.80美元/盎司,COMEX白银期货涨2.96%报33.44美元/盎司 [1] - 欧洲三大股指收盘涨跌不一,德国DAX指数跌0.41%报23249.65点,法国CAC40指数跌0.4%报7696.92点,英国富时100指数涨0.01%报8597.42点 [1] 行业掘金 机器人行业 - 现代汽车将在美国佐治亚州新工厂部署波士顿动力Atlas人形机器人参与生产,计划年产30万辆电动和混合动力汽车,已订购数万台机器人 [2] - 人形机器人商业化时代加速到来,具身智能市场规模有望在2026年突破万亿规模,概念股包括汉威科技、德迈仕、东土科技等 [2] 鸿蒙电脑 - 华为将于5月8日在深圳召开鸿蒙电脑技术与生态沟通会,鸿蒙电脑将正式亮相,这是首个从操作系统内核开始重构的国产电脑 [3] - 鸿蒙电脑在数据安全、智能与互联体验等方面有突破,预计2025年AI PC比重将提升至40%,2024-2028年AIPC出货量复合增速为44%,概念股包括润和软件、东土科技、科蓝软件等 [3] 存储行业 - 2025年一季度全球DRAM市场规模同比增长42.5%至267.29亿美元,SK海力士以36.7%的市场份额首度登顶全球DRAM市场第一 [4] - AI与云服务成为存储需求核心驱动力,行业供需关系或将逐步改善,存储价格和需求有望回升,概念股包括同有科技、香农芯创、朗科科技等 [4][5] 量子计算 - 本源量子推出支持500+量子比特的中国第四代自主量子计算测控系统"本源天机4.0",为百比特级量子计算机量产奠定产业化基础 [5] - 量子计算产业正处于技术驱动向应用牵引的关键转折期,2025-2030年将是商业化落地的黄金窗口,有望迈进千亿美元市场规模,概念股包括科大国创、国盾量子、迪普科技等 [5][6] 避雷针 - 天茂集团因涉嫌未按期披露定期报告被证监会立案 [7] - *ST恒立因未按规定期限披露定期报告被证监会立案 [7] - 紫天科技因未按规定期限披露定期报告被证监会立案 [7] - 老百姓控股股东计划减持不超过2280.29万股,占总股本不超过3% [7] - 徕木股份董事长兼总经理朱新爱计划减持不超过986.56万股,占总股本2.31%,财务总监刘静计划减持不超过12.83万股,占总股本0.03% [8]