Workflow
VLA
icon
搜索文档
L3自动驾驶量产元年,离L4的梦想又近了一步?
新浪财经· 2025-12-17 14:30
L3级自动驾驶商业化与政策突破 - 工信部首次批准L3级自动驾驶商业化运营,长安深蓝SL03与极狐阿尔法S6两款车型通过准入申请,标志着中国首次允许车辆在特定条件下由系统承担驾驶任务 [1] - 政策明确了L3级自动驾驶的权责划分:在限定路段以不超过80公里时速自主行驶时,若系统激活状态下发生事故,车企或将承担主要责任 [1] - 准入要求传感设备必须为“前装量产”,后改装车辆无法获得试点资格,从源头保障技术稳定性 [1] - 行业普遍认为L3级是从“辅助驾驶”到“完全自动驾驶”的重要过渡,后续L4级将在固定区域内实现完全无人驾驶 [1] - 中国此次准入虽起步晚于德国(德国2021年通过《自动驾驶法》),但一步切入责任核心,直接启动附条件商业化运营,未走“测试”老路 [1] L3级自动驾驶技术定义与行业进展 - 根据国家标准,L3级被定义为有条件自动驾驶,在特定条件下车辆可自主完成所有驾驶任务,驾驶员转变为监督者,仅在系统请求时介入 [4] - 与L2级(组合辅助驾驶)相比,L2级驾驶员需时刻监控并准备接管,而L3级在特定条件下系统可独立完成所有驾驶操作,驾驶员角色发生根本转变 [6][7] - 多家主流车企已将2025年实现L3级有条件自动驾驶落地作为目标,2026年被视为L3级自动驾驶的“量产元年” [1][3] - 华为联合赛力斯、阿维塔、奇瑞、北汽等11家车企在公开场合谈及L3,这些车企基本囊括中国汽车行业四大央企和新势力代表 [3] - 具体车企进展:小鹏汽车已在广州获得L3级道路测试牌照并启动常态化测试,计划2026年推出软硬件达L4级水平的量产车型;广汽集团计划2024年第四季度启动首款L3车型量产上市;奇瑞汽车计划2026年量产L3级车辆,并发布算力达1000 TOPS的猎鹰智驾系统 [3] 自动驾驶技术演进与关键挑战 - 从L2到L3的跨越面临现实挑战,核心在于人机共驾的信任建立,包括系统何时退出以及驾驶员能否及时接管 [2] - 国际数据显示,50岁以上用户从分神到重新掌控车辆平均需6秒以上,而系统发出接管请求后留给驾驶员的反应窗口通常不足10秒 [8] - 在低频激活场景下(有研究称城市道路L3可用时间不足23%),驾驶员极易产生依赖或松懈,反而放大风险 [8] - 当系统检测到难以处理的复杂情况(如恶劣天气、道路施工)时会提前发出接管提示,驾驶员必须迅速响应重新掌握控制权 [8] 智能驾驶技术竞争与AI模型发展 - 汽车行业智驾竞争激烈,主流车企如比亚迪、吉利、奇瑞、广汽等纷纷推出智驾计划,行业进入“得智驾者得天下”的时代 [8] - 自2023年以来,智驾行业掀起BEV、端到端技术浪潮,车企正逐步将AI神经网络融入感知、规划、控制等环节 [8] - “端到端+VLM”曾是主流技术方案,但存在联合训练困难、3D空间理解不足、驾驶知识欠缺、难以处理人类驾驶多模态性等问题 [12][13] - VLA(视觉语言动作)模型正在成为重要技术方向,它通过统一的大模型架构将感知、决策、执行无缝串联,形成“图像输入-语义理解-类人决策-动作输出”的闭环,可同步提高智驾的上限和下限 [13] - VLA模型整合了VLM的感知能力和端到端模型的决策能力,并引入“思维链”技术,具备全局上下文理解与类人推理能力 [14] - 在推理时长方面:传统基于规则方案只能推理1秒路况;端到端1.0系统能推理未来7秒路况;VLA模型则能对几十秒路况进行推理,显著提升决策能力和适应性 [14] - 理想汽车发布了新一代自动驾驶架构MindVLA,计划于2026年量产应用 [9] - VLA被业界认为是端到端2.0的主要技术形态,目前尚处于发展阶段,相关模型包括DeepMind的RT-2、OpenVLA、Waymo的EMMA、Wayve的LINGO-2、英伟达NaVILA等 [14] 车企智能化战略与自研趋势 - 随着汽车从“机电产品”变为“智能体”,用户需求从“能不能开”升级为“开得是否安全”,关注系统决策过程的可理解性与交互性 [15] - 车企自研渐成趋势,更适合自研的项目主要包括三类:核心竞争技术(如自动驾驶算法)、差异化技术(如独特用户界面)、高成本技术部件(如高性能自动驾驶芯片) [16] - 自研道路伴随高昂研发成本、漫长技术积累及未知市场风险,车企需在自研与配套之间找到最佳平衡点,并保持自研技术的持续创新力 [16] - 车企可采用分阶段的研发和投资策略,在每个阶段完成后进行评估和调整,根据项目进展和市场反馈逐步投资,以有效控制风险和成本 [17]
最近收到了很多同学关于具身方向选择的咨询......
具身智能之心· 2025-12-17 08:05
行业研究方向与选择 - 具身智能领域当前的研究方向包括视觉语言导航、视觉语言操作、强化学习以及真实到仿真再到真实的闭环方法[1] - 对于从事同步定位与地图构建研究的从业者,视觉语言导航和视觉语言操作被视为较好的切入方向[1] - 拥有机械臂硬件的研究者适合展开视觉语言操作研究,而无硬件的研究者可利用仿真环境或低成本硬件平台进行实验[1] - 四足机器人和人形机器人更适合采用强化学习方法进行研究,而视觉语言操作的研究难度相对较高[1] 研究方法与资源 - 研究过程中,拥有优秀的创新想法至关重要,但新人研究者往往需要经历多次试错才能获得[1] - 行业存在多种低成本的科研平台可供选择,例如移动操作平台[1] - 仿真方法是解决预算有限问题的可行方案之一[1] 专业辅导服务内容 - 提供的论文辅导服务覆盖从CCF-A到CCF-C级别的会议,以及SCI一区到四区的期刊[2] - 服务范围包括EI、中文核心期刊论文、毕业论文以及博士申请辅导等[2] - 辅导团队由来自国内外名校的博士及头部企业研究员组成,具备在ICML、ICLR、CoRL、ICRA、NeurIPS、CVPR等顶级会议的投稿与审稿经验[2] - 辅导流程为全闭环服务,涵盖选题创新点挖掘、实验设计、代码调试、论文写作到投稿策略[2] - 辅导服务兼具工业界与学术界双重视角,不仅关注论文发表,也重视研究的落地价值[3] - 公司为前10名咨询者提供免费匹配专属导师的机会[5]
中游智驾厂商正在快速抢占端到端人才......
自动驾驶之心· 2025-12-15 08:04
行业技术发展趋势 - 智能驾驶领域的技术焦虑正在产业链中游厂商间快速传播[1] - 业内认为,端到端等前沿技术的大规模量产起点将在明年[2] - 当前智驾前沿技术发展放缓,量产方案趋同,L2级智能驾驶正走下沉路线[2] - 随着明年L3法规的进一步推进,中游厂商面临迫切的技术升级压力[2] - 近期许多公司的算法负责人正积极寻求了解端到端、世界模型、VLA、3DGS等前沿技术[2] 市场与量产现状 - 中国二十万以上的乘用车年销量约为700万辆[2] - 头部新势力品牌在此价格区间的销量占比不及三分之一[2] - 已实现端到端技术量产的车型占比更低[2] - 端到端技术的成熟被视为开启更大规模量产的关键[2] - 地平线公司宣布将进军10万级市场,表明高阶智驾正迅速向更多国民车型下沉[2] 技术实施与人才需求 - 端到端自动驾驶不仅仅是一个算法,其落地需要完善的云端与车端基础设施、数据闭环、工程部署、闭环测试、模型优化及平台开发等全套能力[2] - 可以预见,市场对中阶智能驾驶相关岗位的需求将更加旺盛[2] - 端到端和VLA(视觉语言动作模型)领域的招聘需求预计将显著增长[3] 行业培训动态 - 为应对技术升级需求,市场出现了针对端到端和VLA技术的实战培训课程[3] - 相关课程由工业界与学术界的专家联合开展,聚焦量产落地[3] - 课程内容涵盖导航信息应用、强化学习优化、Diffusion和自回归模型量产经验、时空联合规划等核心模块[3] - 另有课程专门梳理BEV感知、大语言模型、扩散模型和强化学习在端到端领域的应用,并设计相关实战项目[6] - 针对VLA领域,有课程从VLM(视觉语言模型)解释器到模块化、一体化及推理增强VLA进行全面梳理,并包含从零搭建模型的大作业[11] - 课程讲师及团队背景雄厚,多来自国内顶级主机厂、Tier1供应商及顶尖高校,拥有丰富的算法研发、预研及量产交付经验[5][8][13][14]
输了裸奔!何小鹏打赌,明年8月要追上特斯拉FSD
新浪财经· 2025-12-12 22:19
公司核心动态与目标 - 小鹏汽车创始人何小鹏公开设下赌约,若到2026年8月30日,小鹏第二代VLA在国内能达到特斯拉FSD V14.2在硅谷的效果,他将在硅谷建一家中国风味食堂;若不能达到,小鹏自动驾驶中心负责人刘先明承诺将在金门大桥裸跑[2][3][21] - 小鹏汽车已宣布第二代VLA将在2026年第一季度正式发布,并计划向Ultra车型全量推送,赌约时间点设定在发布后约5个月,被视为关键优化期[5][23] - 何小鹏在试驾对比后认为,特斯拉FSD V14.2已进入“准L4阶段”,虽然存在瑕疵,但水平大幅超过去年[2][20] 技术路径与能力评估 - 何小鹏表示,在近期测试中,他首次感受到第二代VLA的上限能够达到L4的可能性,若多给3-5年时间,甚至可能达到L5[6][24] - 小鹏第二代VLA的核心创新在于砍掉了语言转译环节,首次实现从视觉信号到动作指令的端到端直接生成[8][26] - 为训练该模型,公司使用了接近1亿个视频片段,相当于人类司机驾驶65000年才能遇到的极限场景总和,并采用了阿里云3万卡云端算力集群,部署720亿参数的基座大模型,每5天完成一次全链路迭代[8][26] - 公司自研的图灵AI芯片单颗算力为750TOPS,整车配备3颗芯片集群,总算力达2250TOPS,是行业主流双Orin-X方案(508TOPS)的4.4倍[11][29] 竞争对比与挑战 - 特斯拉FSD拥有显著的数据优势,通过全球超600万辆测试车辆,每天产生16亿帧图像数据,累计行驶里程已突破96亿公里,其“影子模式”能在全球多样化交通环境中收集数据[14][15][32] - 在20公里复杂小路的实测中,特斯拉FSD V13.2.9版本接管5次,而小鹏第二代VLA仅需接管1次[16][33] - 搭载小鹏第二代VLA的测试车辆已能识别交警手势、理解红绿灯并提前反应,甚至在暴雨夜安全行驶[17][34] - 然而,特斯拉最新的FSD V14.2版本大幅提升了性能,解决了V13.2.9版本中95%以上的犹豫变道和异常刹车问题[17][34] - 小鹏承认在“泛化”能力上面临挑战,例如不同国家对黄灯交通规则的理解不同,如何平衡并实现良好泛化是公司正在探索的问题[12][13][30][31]
输了裸奔,何小鹏打赌,明年8月要追上特斯拉FSD
36氪· 2025-12-12 20:12
公司管理层表态与赌约 - 公司CEO何小鹏在硅谷试驾后认为,特斯拉FSD V14.2已进入准L4阶段,大幅超过去年水准,但公司第二代VLA的首个版本尚无法实现其全部能力[2] - 何小鹏与自动驾驶团队立下赌约:若到2026年8月30日,公司VLA在国内达到特斯拉FSD V14.2在硅谷的效果,他将在硅谷建一家中国风味食堂;若未达成,自动驾驶中心负责人刘先明承诺将在金门大桥裸跑[2] - 公司已宣布第二代VLA将在2026年第一季度正式发布,并计划向Ultra车型全量推送,赌约时间点设定在发布后约5个月,是关键优化期[4] 公司技术路线与能力展望 - 何小鹏表示,在最近几个月的测试中,首次感受到第二代VLA的上限能够达到L4的可能性,如果多给3-5年,也许能够达到L5[6] - 第二代VLA方案砍掉了语言转译环节,首次实现从视觉信号到动作指令的端到端直接生成[9] - 为研发该模型,公司采用了阿里云3万卡云端算力集群,部署720亿参数的基座大模型,每5天完成一次全链路迭代,何小鹏称明年云端算力将达5万卡甚至更多[9] - 公司自研的图灵AI芯片单颗算力为750TOPS,整车配备3颗芯片集群,总算力达2250TOPS,是行业主流双Orin-X方案(508TOPS)的4.4倍[12] 行业技术对比与公司挑战 - VLA(视觉-语言-动作)概念由谷歌DeepMind于2023年提出,旨在整合视觉、语言和动作能力,目前除该公司外,理想汽车、长城汽车等车企也在布局[8] - 特斯拉FSD通过全球超600万测试车辆,每天产生16亿帧图像数据,累计行驶里程已突破96亿公里,其“影子模式”能在全球多样化交通环境中收集数据[13] - 在实测中,20公里复杂小路上,特斯拉FSD V13.2.9版本接管5次,公司第二代VLA仅需接管1次,公司车辆能识别交警手势、理解红绿灯并提前反应,甚至在暴雨夜安全行驶[13] - 特斯拉最新FSD V14.2版本大幅提升性能,解决了V13.2.9版本中95%以上的犹豫变道和异常刹车问题[13] - 公司正在探索泛化问题,例如不同国家对黄灯交通规则的差异,这是追赶特斯拉FSD需要解决的能力之一[13] 公司研发投入与合作伙伴 - 用于训练第二代VLA模型的视频片段接近1亿个,无需人工标注,相当于人类司机驾驶65000年才能遇到的极限场景总和[9] - 阿里巴巴CEO吴泳铭曾亲自到访公司广州总部,与何小鹏会面[10]
中游智驾厂商,正在快速抢占端到端人才......
自动驾驶之心· 2025-12-09 08:03
行业技术发展趋势 - 智能驾驶领域的技术焦虑正在产业链中游厂商间快速传播[1] - 业内认为端到端等前沿技术的大规模量产起点将在明年[2] - 当前智能驾驶前沿技术发展放缓,行业量产方案趋于同质化,L2级智能驾驶正走下沉路线[2] - 随着明年L3级法规的进一步推进,中游厂商面临迫切的技术升级压力[2] - 近期许多公司的算法负责人正积极寻求了解端到端、世界模型、VLA、3DGS等前沿技术[2] 市场现状与规模 - 二十万元以上的乘用车年销量约为700万辆[2] - 头部新势力品牌在该价格区间的销量占比不足三分之一[2] - 搭载端到端量产方案的车型占比则更低[2] - 地平线公司宣布将进军10万元级市场,表明高阶智能驾驶正迅速向更多国民车型下沉[2] 技术落地与产业影响 - 端到端技术不仅仅是一个算法,其成熟落地需要完善的云端与车端基础设施、数据闭环、工程部署、闭环测试、模型优化及平台开发等全套体系支持[2] - 端到端技术的成熟被视为更大规模量产的开端[2] - 可以预见,市场对中阶智能驾驶相关岗位的需求将更加旺盛[2] - 近几个月,行业对端到端和VLA技术的学习与入门需求显著增加[3] 行业培训与人才需求 - 为应对技术升级需求,出现了针对端到端和VLA技术的实战培训课程[3] - 相关课程由工业界与学术界的专家联合开展,聚焦量产落地[3] - 课程内容涵盖导航信息应用、强化学习优化、Diffusion和自回归模型量产经验、时空联合规划等关键模块[3] - 另有课程专注于VLA领域,内容从视觉语言模型作为解释器,覆盖到模块化、一体化及主流的推理增强型VLA[11] - 课程要求参与者具备一定的自动驾驶基础、了解Transformer大模型、强化学习、BEV感知等概念,并拥有Python和PyTorch编程能力[10]
8个实战,彻底讲清VLA的各类方案
具身智能之心· 2025-12-08 09:11
具身智能与视觉语言动作模型技术现状 - 行业普遍面临视觉语言动作模型在实际硬件上难以跑出效果的挑战 [1] - 具身智能领域高度依赖硬件本体,算法与硬件紧密耦合,仿真和互联网数据在泛化性能上无法保证,许多公司坚持采用“真机数据”路线 [2] - 近2年来,算法技术快速发展,从ACT、OpenVLA到π0、π0.5、π0.6等新方法层出不穷,性能持续提升,基于强化学习的优化方案使模型运行更流畅 [4] - 开源硬件本体多样化,例如SO-100机械臂、openarm双臂操作系统、XLeRobot移动操作平台,支持各类研究需求 [4] VLA模型落地实施的核心模块与挑战 - 数据采集是首要模块,主要方法包括基于模仿学习的遥操作、VR、全身动捕捉,以及强化学习方法,在机械臂结合VLA领域更多采用遥操作和VR [7][8] - 数据采集的质量保障及real2sim2real流程是关键问题 [8] - 模型训练前通常需进行仿真调试,在真机数据不足时,Mujoco、Isaac Gym等仿真框架及sim2real技术尤为重要 [10] - 模型训练技巧至关重要,包括如何微调模型、如何在小数据量下取得良好效果,许多模型存在机械臂运动准但夹爪操作不佳或运动误差大的问题 [10] - ACT算法相对简单易出效果,而π0、π0.5、GR00T等模型训练难度高,对细节和技巧要求严格,强化学习优化模型的经验门槛高 [6][10] - 模型部署前需进行“瘦身”操作,即使参数量为2B的模型,在边缘芯片部署挑战仍大,需通过量化、蒸馏等轻量化技术最小化参数量并保证性能 [12] VLA技术学习与人才培养 - VLA技术更新快,学习曲线陡峭,许多学习者即使拥有真机硬件也不知如何入手 [13] - 行业推出了首个面向实战与求职的VLA小班课,内容涵盖机械臂硬件、数据采集、VLA算法与评测、仿真、主流VLA模型部署、VLA结合世界模型、真机实验及具身产业讲解 [14][16] - 课程为学员提供SO-100机械臂一套,包含示教臂和执行臂 [21] - 课程讲师为某机器人公司VLA高级研究员,拥有5年以上机器人行业实战经验,精通具身智能全栈技术,并在顶级期刊发表学术论文10篇以上 [25] - 课程目标人群包括:具身领域求职者、VLA入门进阶者、相关领域学生、从传统CV/机器人/自动驾驶转行者以及对具身智能感兴趣的人员 [27] - 课程对硬件有明确建议:推理建议使用RTX 3060及以上显卡,训练建议使用2张以上RTX 3090 Ti显卡,也可自租云服务器,并要求学员具备一定的Python和PyTorch基础 [27] - 完成课程后,学员将掌握真机调试与数据采集、各类VLA算法真机部署、模型量化技术,并对具身产业有清晰认识,简历项目经验可达到1-2年以上算法工程师水平 [30] - 课程计划于2025年12月30日开课,共分九章,持续至2026年2月25日 [28][31]
都在说VLA,很多同学连demo都跑不好......
具身智能之心· 2025-12-03 18:00
文章核心观点 - 视觉语言动作模型领域面临从理论到实践的巨大挑战,特别是在真机数据采集、模型训练与部署等环节,存在显著的学习壁垒和落地困难 [2][6] - 行业技术发展迅速,开源框架和新算法不断涌现,但模型性能高度依赖硬件本体和数据质量,仿真与真实场景存在泛化差距 [2][4] - 为应对上述挑战,推出了一个全面的实战课程,旨在通过软硬结合的方式,系统化地培养VLA领域的实操人才 [14][16][19] 技术发展现状与挑战 - 算法层面近2年涌现大量新方法,如ACT、OpenVLA、π0、π0.5、π0.6系列,性能持续提升,基于强化学习的优化方案使模型运行更流畅 [4] - 开源硬件本体多样化,支持不同类型的研究需求,例如SO-100机械臂、openarm双臂操作系统、XLeRobot移动操作平台 [4] - 核心挑战在于数据、模型、训练、部署的全流程打通,初学者常陷入长期调试而难以入门,尤其π0、π0.5、GR00T等模型的数据采集和训练包含大量未公开技巧 [6] VLA模型落地关键模块 - **数据采集**:主要基于模仿学习(遥操作、VR、全身动捕捉)和强化学习,机械臂领域多采用前两种,如何保证数据质量及实现real2sim2real是关键问题 [7][8] - **模型训练**:真机部署前需进行仿真调试,Mujoco、Isaac Gym等框架在数据不足时尤为重要,训练技巧至关重要,不同算法难度差异大,ACT相对简单易出效果,而π0和π0.5则极难训练成功 [9][10] - **模型部署**:面临模型参数量大(即使2B规模)导致的边缘芯片部署挑战,必须进行轻量化操作如量化、蒸馏,以在保证性能的同时最小化参数量 [11][12] 课程解决方案与目标 - 课程定位为国内首个面向实战与求职的VLA小班课,内容覆盖机械臂硬件、数据采集、VLA算法、评测、仿真、主流模型部署、VLA+世界模型、真机实验及产业讲解 [14][16] - 课程目标为使学员掌握真机调试与数据采集、各类VLA算法真机部署、模型量化技术,并对产业落地有清晰认识,学完后达到1-2年算法工程师经验水平 [30] - 面向人群包括具身领域求职者、VLA入门进阶者、相关专业学生、以及希望从传统CV/机器人/自动驾驶转行的人员,建议具备Python和PyTorch基础,推理需3060及以上显卡,训练需2张以上3090ti显卡 [27]
带硬件!最全的VLA实战教程来啦
具身智能之心· 2025-12-01 11:12
VLA技术发展现状 - 具身智能领域高度依赖硬件本体,算法性能与硬件紧密相关,仿真和互联网数据在泛化性能上无法保证,许多公司坚持采用真机数据路线[2] - 近2年来VLA技术框架快速发展,从ACT到OpenVLA,再到π0、π0.5、π0.6系列,新方法层出不穷且性能持续提升,基于强化学习的优化方案使VLA模型运行更加流畅[4] - 开源硬件本体多样化,支持各类研究需求,包括SO-100机械臂、openarm双臂操作系统、XLeRobot移动操作平台等[4] VLA落地技术挑战 - 完整打通数据采集、VLA模型训练优化和部署全流程存在较大困难,初学者可能花费半年时间仍无法有效入门[6] - 数据采集主要采用模仿学习和强化学习方法,模仿学习包括遥操作、VR和全身动捕捉三种方式,机械臂领域多采用前两种,如何保证数据质量和实现real2sim2real是关键问题[8] - 模型训练需要先进行仿真调试,在真机数据不足时sim2real技术尤为重要,使用mujoco、Isaac Gym等框架,训练技巧对结果影响显著,不同算法难度差异大[10] - 部署阶段需要进行模型轻量化处理,即使2B参数规模的模型对边缘芯片也是挑战,必须通过量化、蒸馏等技术在保证性能的同时最小化参数量[12] 教育培训解决方案 - 针对VLA技术快速迭代的特点,推出了国内首个面向实战与求职的VLA小班课,涵盖机械臂硬件、数据采集、VLA算法、模型评测、仿真、部署等完整内容[14][16] - 课程配备SO-100机械臂硬件套装(包含示教臂和执行臂),由拥有5年以上机器人行业实战经验的VLA高级研究员授课,具备IEEE Trans系列顶级期刊发表经验[22][26] - 目标学员包括求职者、VLA入门进阶人员、高校学生及转行人员,要求具备Python和Pytorch基础,推荐使用3060以上显卡进行推理,2张以上3090ti进行训练[27] - 课程于2025年12月30日开课,共九章内容,学完后可掌握真机调试与数据采集、VLA算法部署、模型量化等技术,达到1-2年算法工程师经验水平[28][30][31]
首个面向求职+工业级的VLA实战教程!真机+各类VLA算法部署+量化+世界模型
具身智能之心· 2025-11-29 10:07
文章核心观点 - 视觉语言动作模型领域技术迭代迅速但实践门槛高,初学者在数据采集、模型训练与部署等环节面临显著挑战[1][6] - 行业强调真机数据的重要性,仿真与互联网数据在泛化性能上存在不足[2] - 为解决学习痛点,业内推出结合硬件与软件的全栈VLA实战课程,旨在通过真机实验提升学员的工程实践能力[14][16][19] VLA技术发展现状 - 近2年来VLA算法快速迭代,从ACT到OpenVLA,再到π0、π0.5、π0.6系列,模型性能持续提升[4] - 基于强化学习的优化方案显著改善了VLA模型的操作流畅度[4] - 开源技术框架如LeRobot降低了入门门槛,开源硬件本体如SO-100机械臂、openarm双臂、XLeRobot移动操作平台支持多样化研究需求[4] VLA落地实践的关键模块 - 数据采集主要依赖模仿学习与强化学习,模仿学习通过遥操作、VR、全身动捕捉方式实现,机械臂领域侧重前两种[7][8] - 模型训练需借助Mujoco、Isaac Gym等仿真框架进行调试,sim2real技术在真机数据不足时尤为重要[10] - 模型部署面临参数量大的挑战,即使2B规模也对边缘芯片构成压力,需通过量化、蒸馏等轻量化操作在保证性能的同时最小化参数量[12] VLA实战课程内容 - 课程涵盖机械臂硬件、数据采集、VLA算法、模型评测、仿真、主流模型部署、VLA+世界模型、真机实验及产业讲解等全栈内容[16] - 学员将获得SO-100机械臂硬件套装,课程设计面向求职者、进阶学习者、高校学生及跨行业转型人员[22][27] - 课程要求学员具备Python和PyTorch基础,推荐使用3060及以上显卡进行推理,2张以上3090ti显卡进行训练[27] - 完成课程后学员可掌握真机调试与数据采集、VLA算法部署、模型量化等技能,达到1-2年算法工程师经验水平[30]