仿真数据

搜索文档
理想VLA含金量分析与关键迭代方向预测
理想TOP2· 2025-08-09 14:18
理想VLA的核心价值 - 理想VLA属于DeepSeek MoE级别的创新,虽非MLA级别的首创理念,但首次完整落地至汽车领域并取得显著成果,架构设计与执行高度原创 [2] - 公司在AI软件与硬件结合方面达到行业领先水平,克服了硬件迭代慢、AI软件与传统编程差异大的挑战 [3] - 创始人李想(44岁,高投票权)是VLA推进的核心灵魂人物,其资源调配、关键决策能力(如押注强化学习路线)对技术方向起决定性作用 [4][5] - 强化学习为核心的VLA架构长期将显著优于模仿学习主导的端到端路线,具备针对性解决bad case和持续迭代的优势 [6][9] 理想VLA的技术架构与迭代方向 - 技术内核为强化学习主导,通过仿真环境试错学习最优策略,区别于监督学习的标记数据依赖和端到端的单纯模仿 [9][10] - 当前车端部署4B参数模型(较小规模),未来需提升本地推理能力以支持更大参数量模型,同时确保时延达标 [12] - 关键迭代路径:1)优化仿真数据效率(低成本、高质量、快速生成);2)挖掘现有芯片算力潜力或升级硬件;3)强化学习驱动的能力跃升 [8][12] - 长期若未实现L4,可能转向在线学习等新架构,允许模型权重动态更新,但需解决超级对齐等安全问题 [13] 行业技术对比与创新点 - 端到端方案依赖模仿学习,拟人性提升但缺乏思考能力,bad case改进效率低(类似炼丹);理想VLA通过强化学习实现针对性优化 [9][10] - 仿真数据替代真实数据成为核心训练资源,解决强化学习对交互场景的高需求(如AlphaGo无人类棋谱训练案例) [10][11] - 公司展示的工程能力包括:仿真系统优化(如无保护左转的自我博弈训练)、芯片算力压榨、跨领域技术整合(如扩散模型生成轨迹) [12][2] 创始人角色与资源分配 - 李想直接参与AI学习与决策,确保资源高效投向VLA而非端到端,并推动双Orin平台兼容前沿模型(2022年车型支持2025年技术) [4] - 创始人深度介入避免团队陷入无效争论,保障技术路线执行力(对比技术灵魂人物离职导致资源中断的案例) [5][4]
WAIC观察|仿真不稳、真机太贵?机器人数据最优解出现了吗
第一财经· 2025-07-28 10:07
机器人训练数据路径争议 - Physical Intelligence联合创始人Sergey Levine主张真实世界数据对机器人训练不可或缺 挑战业界用仿真数据替代真机的做法 [1] - 行业面临关键选择:优先依赖低成本快速的仿真数据 或回归真实环境积累高质量真机数据 [1] 仿真数据优先派观点 - 银河通用采用Sim2Real路径 主要依靠合成仿真数据 主张在零真实数据情况下启动训练 [2] - 通过"摇操"采集真人动作数据对创业公司成本高昂 [2] 真实数据优先派观点 - 擎朗智能CEO李通强调需将机器人部署到实际岗位 通过真实任务积累有效数据 [3] - 机器人需在明确岗位达到万级部署量才能积累对模型有效的数据 非百台级别能解决 [3] - 服务业场景底层"动作元素"(抓取、递送、避障等)可泛化 但需足够丰富真实数据支撑 [3] 数据融合技术挑战 - 灵初智能指出仿真和真机数据不能简单混合使用 模型会识别数据来源并分配不同权重 [9] - 灵初方案:仿真用于大规模预训练 少量真机数据完成最终微调 [9] - 北京人形机器人创新中心仿真与真实数据使用比例为7:3 [9] - 国家地方共建人形机器人创新中心真实数据与仿真数据占比为3:1 [9] 真实数据的不可替代性 - 智元机器人100%使用真机数据训练多模态大模型和VLA模型 [10][12] - 自变量机器人COO杨倩指出仿真在"下半身"训练(步态规划等)占主流 但"上半身"精细操作仿真能力有限 [10] - 长链条柔性交互任务(如制作香囊)仿真工程开销巨大 甚至不可完成 [10] - 自变量机器人采用端到端真实数据采集 一周内完成机器人完整制作任务训练调优 [12] 行业实践与投入 - 智元机器人自建专业数采工厂 形成全球最大数据集AgiBot World并开源 [12] - 发布行业首个通用具身基座模型启元大模型 具备"一脑多形"适配能力 [12] - 自变量机器人处于PoC阶段 与酒店、养老等行业联合测试非结构化环境部署能力 [10] 行业现状共识 - 真实和仿真数据孰优孰劣尚无定论 尚未有企业通过单一数据路径跑出通用智能完全体 [4] - 具身智能处于落地早期阶段 高昂的真实数据采集成本是行业必须面对的代价 [10]
英伟达对机器人下手了
远川研究所· 2025-03-20 20:35
英伟达布局人形机器人领域 - 公司通过CES展和GTC大会展示机器人战略,发布仿真平台Cosmos和基础模型Isaac GR00T N1,构建从训练算力(DGX)、仿真数据(Omniverse)到终端芯片(Jetson Thor)的全套解决方案[1][3][4][19] - 物理AI被视为AI新浪潮,人形机器人是核心载体,需通过仿真数据训练算法理解物理规则[7][8][16] - 公司未直接造机器人,而是提供底层技术设施,类比"修建收费站"商业模式[5][20][44] 人形机器人技术突破方向 - 智能化是核心差异点,需具备理解语言、自主决策能力,案例显示RT-2模型机器人可识别"灭绝动物"并执行操作[10][11][12] - 仿真数据填补真实数据缺口,特斯拉已应用37.1亿张仿真图片训练模型,自动驾驶依赖真实数据而机器人更依赖仿真[16][17] - 传统工业机器人仅执行预设任务,人形机器人需模拟人类思考过程[9][13] 英伟达技术积累路径 - 通过游戏业务沉淀物理引擎技术,收购Ageia后整合PhysX至GPU,应用于医疗、影视等工业场景[22][25][27][28] - 光线追踪技术展示实时物理模拟能力,为机器人/自动驾驶场景奠定基础[29][30] - Omniverse平台延续"虚拟世界物理规则模拟"逻辑,形成技术复用闭环[24][31] 公司业务扩张战略 - 经营逻辑为覆盖高价值场景:游戏(2010前)→移动设备(Tegra失败)→自动驾驶(占比<5%)→AI(ChatGPT引爆需求)→物理AI(机器人)[32][34][37][39][41] - 软硬件绑定模式:提供芯片+软件工具箱(CUDA/NVLink/Cosmos),形成生态壁垒[42][43] - 黄仁勋提出技术演进三阶段:生成式AI→智能体AI→物理AI,机器人属于第三阶段[41]