具身智能模型

搜索文档
【对话机器“人”】“机器人有大量可落地场景”
中国证券报· 2025-08-13 21:00
行业技术发展现状 - 2024年机器人行业处于技术打磨和体系打磨阶段 算法成熟度已获充分验证且体系化建设初步完成 为产业落地奠定基础 [1][7] - 具身智能模型目前仅具备单一场景任务执行能力 尚未实现融会贯通 [5] - 行业普遍面临数据不足问题 数据短缺是当前制约模型发展的关键因素 [5] 技术研发路径与突破 - 采用Real to Sim to Real虚实融合方法 通过1:9的真实数据与仿真数据比例构建模型 该方法已在移动导航、商超操作、工业分拣等多场景验证有效性 [6] - 灵巧手技术存在较大提升空间 需在拟人化尺寸下实现大负载和精细化感知 对空心杯电机驱动、结构设计和传感器集成提出更高要求 [6] - 硬件方面需权衡跑跳能力与上半身作业性能 若兼顾两者则需进一步提升下半身器件性能 [6] 应用场景落地进展 - 在浙江服装纺织工厂完成堆叠布料分离、模板机上下料等场景的概念验证 即将进入实际应用阶段 [1][2] - 实验室场景已实现化工、生物医药领域的试管分液、测试及清洗等自动化操作 [2] - 创新中心通过校企合作开发具实际应用价值的产品 结合下游企业场景实现技术快速落地 [4] 区域产业生态建设 - 浙江省凭借机器人及新能源汽车产业链完整布局 为具身智能机器人本体开发提供产业基础 [2] - 浙江人形机器人创新中心于2024年3月在宁波挂牌 获省市区三级政府支持 联合多家产业方共建 [3] - 创新中心聚焦高精度作业泛人形机器人开发 强调双臂与手部作业能力 下肢根据场景采用双足或轮式设计 [3] 未来发展趋势 - 具身智能模型预计需两到三年时间趋于成熟 未来有望出现通用人形机器人或通用具身智能模型 [1][6][7] - 汽车、手机等行业企业跨界加入人形机器人赛道 推动多技术融合创新 [7] - 研发采用需求导向的反向布局模式 基于现有技术规划发展路径 [7]
AI模型正在让机器人“钞能力”觉醒
36氪· 2025-08-04 08:26
行业投资与商业化进展 - 2025年上半年具身智能行业投资达91起,总额110.37亿元,超过2024年全年总量 [1] - 应用端成交额同比激增17倍,呈现爆发趋势 [1] - 机器人赛道进入规模化商业价值兑现期,核心驱动力是"数据采集-模型训练-商业转化"的技术变现闭环加速成型 [1] - 2050年全球人形机器人市场预计突破5万亿美元,规模是2024年全球前20大汽车OEM总收入(2.488万亿美元)的近两倍 [9] - 中国在服务机器人领域将率先形成集群效应,并保持5%-10%的年均增速 [9] 技术突破与智能化发展 - 基于Transformer架构的具身智能模型使机器人自然语言理解准确率提升至92.3%,接近人类水平 [3] - 深度强化学习系统通过千亿级参数规模神经网络训练,赋予机器人环境理解、语境识别、情感感知等多维度认知功能 [3] - 机器人实现从"程序驱动"向"认知驱动"转变,具备跨场景任务泛化执行能力 [3] - 模型具备自学习与自我纠正能力,可基于已有经验快速组合优化新任务策略,并实时监测偏差自主调整行为 [6] - 端侧大模型将关键计算能力下沉至本地设备,使机器人在网络不佳时也能快速决策和实时处理任务 [7] 数据支撑与产业生态 - 高质量、大规模数据集是机器人"人性"觉醒的关键,需要海量涵盖各类场景的细致数据 [4] - 数据标注需要专业人员耗时费力地进行,国内众多企业包括大型上市公司和传统行业企业正参与数据标注行业 [4] - 数据标注服务覆盖机械工业、教育、医疗、金融、文学、自动驾驶、音视频等多个领域,为人工智能和机器人研发企业提供定制化服务 [4] - 模型透明化与开源性加速迭代,如GR00T大模型80%训练数据来自AgiBot World并登陆国内开源平台 [6] - 开源模型汇聚全球开发者智慧,从不同角度改进创新,加速技术普惠 [6] 应用场景与市场格局 - 人形机器人最早且最大的价值应用场景是工业生产及军事领域 [9] - 由于成本因素,2050年预计仅有约10%的人形机器人进入家庭环境,绝大多数将应用于工业和商业领域 [9] - 传统汽车工业总收入在未来25年可能持续萎缩,而机器人产业呈现指数级增长 [9] - 中国具身智能产业化拐点已经到来,从技术验证到商业闭环的市场格局变迁正在发生 [9]
自变量机器人王潜:具身智能大模型没法抄国外作业
36氪· 2025-05-29 09:05
公司概况 - 自变量机器人成立于2023年,创始人王潜为清华大学本硕、南加州大学博士,曾在美国创立量化基金公司,后因执着机器人事业回国创业 [5][6] - 公司成立不到一年半完成7轮融资,累计金额超10亿元,最新一轮获美团数亿元独家投资 [5] - 国内人形机器人融资梯队中,公司以超10亿元融资金额进入准一线阵营(第一梯队为宇树科技、智元机器人、银河通用,融资均超15亿元) [5] 技术路线 - 坚定采用"端到端统一VLA大模型"技术路线,研发节奏为每2-3个月更新一版模型 [7][13] - WALL-A模型已实现衣物处理、收纳整理等复杂精细操作,领先于仅能完成Pick&Place的竞品 [8] - 模型能力对标国际:与Physical Intelligence(PI)、Google Gemini robotics同步实现any-to-any多模态输出及思维链(COT)功能 [14][15] - 技术路线选择上,放弃Figure采用的两层模型架构,坚持单层端到端范式以追求更高天花板 [16][17] 商业化进展 - 当前商业化重心在服务业场景,已有本体产品实现销售但未大规模发布,计划年底至明年初完成POC验证 [27][29] - 拒绝科研教育/迎宾表演等"小场景",认为其市场规模有限且偏离通用智能目标 [10][31] - 质疑工厂场景价值:认为现有工厂任务过于简单,属于PR行为且不利于模型能力提升 [35][36] - 商业化时间表:预计1-2年内实现付费商业化,C端家庭服务机器人需3-5年 [21] 行业竞争格局 - 国内具身智能呈两极分化:朱啸虎等质疑商业化前景,但资本持续加注(2023年赛道融资超15亿元案例达3家) [5] - 中美技术差距:承认整体落后于PI、Google、特斯拉,但公司部分指标已实现国际对标甚至超越 [37][38] - 开源模式争议:认为具身智能领域开源难以复现(PI开源的π0模型跨本体适配效果不佳),软硬一体特性决定商业化必须闭源 [39][43][44] 研发战略 - 研发投入占比:三分之二支出集中于模型能力提升 [12] - 数据策略:自建高质量数据集为主,拒绝依赖低质量开源数据 [23] - 技术预判:类GPT-3水平具身模型有望1年内出现,行业进步速度将被低估 [20][22] 创始人观点 - 批判跟随策略:强调原创性研发,认为等待开源再模仿会导致团队丧失创造力 [41][42] - 定义商业化标准:必须依赖模型泛化能力突破,而非简单场景堆砌 [11][36] - 行业周期判断:波谷源于成果不足,公司目标成为引领技术突破的标杆 [25]
启明创投周志峰:AI的性能和成本已达到临界点,AI应用将在今年爆发
IPO早知道· 2025-04-29 11:01
AI行业投资框架 - AI行业投资分为三个层次:基础设施层、模型层、应用层 [7] - 基础设施层包括工具链、数据软件、AI安全、训练推理加速技术以及AI芯片和云算力平台等硬件基础 [7] - 模型层公司现阶段通过底层技术创新实现差异化,最终都将转型为应用企业 [7] - 应用层企业将占据AI市场主体地位,预计99%的企业属于应用层,捕获70%-80%的行业价值 [7] AI技术发展阶段 - 2025年将成为AI应用全面落地的关键年份,性能与成本将达到临界点 [4][7][8] - 科技浪潮发展规律显示,底层基础技术成熟后应用才会爆发,AI技术已临近这一阶段 [8] - 过去半年AI模型性能取得突破性进展,最新模型智能水平接近人类天才级别 [10] - 成本优化与性能突破同等重要,行业已进入"普惠成本"时代 [10][11] 启明创投AI布局 - 已投资14家大语言模型、多模态模型、具身智能模型或端到端智驾模型的领军企业,数量在亚洲位居前列 [5] - 协助管理规模达100亿元的北京市人工智能产业投资基金 [6] - 在模型层已布局10余个具备模型开发与创新能力的公司,覆盖大语言模型、3D模型生成、语音生成等新兴领域 [11] - 应用层重点布局AI硬件、AI教育、AI医疗、企业级AI、AI内容平台、具身智能等细分领域 [11] AI商业化路径 - AI商业化将遵循与互联网相似的发展路径,从单一工具向平台性产品转型 [10] - AI技术不仅创造全新产品形态,也能在传统产品中创造巨大价值 [11] - AI应用将渐进式改变生活,而非突然颠覆 [11]