Workflow
机器人技术
icon
搜索文档
边缘设备上高效运行!NanoVLA :保留 VLA 模型的精度与泛化能力,推理速度提升 52 倍
具身智能之心· 2025-11-02 00:03
文章核心观点 - NanoVLA模型通过创新的“视觉-语言解耦融合+长短动作分块+动态路由”架构,解决了通用视觉-语言-动作模型在边缘设备上部署时“通用化”与“轻量化”的矛盾 [2] - 该模型在保持甚至超越现有大型VLA模型任务精度与泛化能力的同时,将推理速度提升52倍,参数量压缩98%,首次实现在资源受限的边缘设备上高效运行通用机器人策略的目标 [2][19][32] 技术瓶颈与解决思路 - 传统VLA模型存在三大设计瓶颈:模态融合冗余导致高延迟、动作执行僵硬导致运动失准、模型容量错配导致资源浪费与性能不足并存 [3] - NanoVLA的突破思路并非单纯缩小模型,而是重构推理逻辑,通过解耦静态指令与动态视觉、分阶段规划动作、自适应选择骨干网络,实现计算资源的“按需分配” [3] 核心架构模块 - **视觉-语言解耦融合与缓存**:分离模态编码并延迟融合时机,对静态指令特征进行缓存复用,仅需动态更新视觉嵌入,使计算量减少62% [8][12] - **长短动作分块**:训练时学习长序列依赖以保证动作连贯性,推理时执行短窗口并结合高频环境反馈重新规划,在LIBERO长任务中成功率比固定长序列执行高16%,动作抖动减少30% [9][11][13][14] - **动态路由**:引入轻量级路由器,根据任务复杂度自适应选择轻量或重量级骨干网络,使简单任务中轻量骨干使用占比超80%,平均参数量降至296M,仅为OpenVLA的4% [15][18][21] 性能表现 - **模拟基准测试**:在LIBERO基准上,NanoVLA-R版本取得84.1%的平均成功率,比7.5B参数量的OpenVLA高7.6%,比450M参数量的SmolVLA高5.5% [20] - **真实机器人测试**:在搭载Jetson Orin Nano的LeRobot机器人上,NanoVLA在12类真实任务中的平均成功率达85.6%,超越OpenVLA的80.4% [26] - **边缘设备效率**:在Jetson Orin Nano上,NanoVLA-R的推理速度达到41.6 FPS,是OpenVLA(0.8 FPS)的52倍,同时在LIBERO-Goal任务上成功率提升8个百分点 [22][29] 行业意义与未来方向 - NanoVLA为通用机器人策略的边缘部署提供了不牺牲精度的轻量化路径,其架构范本可直接复用于工业巡检、家庭服务、嵌入式操控等产业化场景 [30][32] - 未来技术演进方向包括融入触觉/力觉等多模态信号以提升操作精度、通过知识蒸馏实现端到端轻量化、以及扩展适配双臂、移动机器人等多机器人形态 [31]
“进一步退两步”,特朗普制造业回流目标正在被自身关税和移民政策绊倒
观察者网· 2025-10-19 15:35
特朗普政府制造业回流政策的核心矛盾 - 政策目标与具体措施背道而驰,关税推高原材料和进口设备成本,移民政策加剧技能工人短缺,开支削减威胁补贴稳定性 [1] - 政策环境产生麻痹效应,企业因缺乏确定性而无法批准回流项目 [7] - 政策被批评为“准备、开火、瞄准”模式,即兴式执政方式忽略了供给侧障碍 [7] 关税政策的具体影响 - 关税提高了美国工厂所依赖的进口零部件成本,尤其在汽车、半导体等供应链复杂的行业 [7] - 福特汽车公司面临20亿美元的成本压力,阻碍了其在美国的进一步投资 [7] - 美国国内生产商(如钢铁和铝制造商)借机提价,引发连锁反应,甚至促使部分企业转向海外价格更低地区生产 [8] - 对中间产品征收关税伤害了试图出口或回流的美国企业 [8] 人才与移民政策的冲突 - 全国有超过40万个制造业岗位空缺,高科技领域如半导体、机器人技术短缺最为严重 [9] - 特朗普政府对H-1B签证申请征收10万美元新费用,大幅提高企业雇佣外国工人的成本,可能阻碍企业扩张所需的技术人才引进 [10] - 行业团体警告新政策将削弱人才培训渠道,并使美国在人才竞争中处于劣势 [12] - 美国商会就H-1B签证费用决定对特朗普政府提起诉讼 [12] 投资承诺与补贴不确定性 - 特朗普政府已从企业获得数万亿美元的投资承诺,包括斯特兰蒂斯130亿美元和摩根大通1.5万亿美元的倡议 [5] - 白宫预算鹰派削减可刺激投资的项目,导致补贴环境不稳定,企业可能在破土动工前失去激励措施 [13] - 政府内部政策紧张,白宫管理和预算办公室暂停审查联邦拨款和贷款,例如能源部终止了价值超过75亿美元的300多个清洁能源项目拨款 [13] 行业与企业的反应 - 企业抱怨政策混乱,不知应围绕哪种“美国优先”政策进行规划 [1] - 卢塞恩国际公司决定缩减并推迟一项将就业从中国迁回密歇根州的铝锻造项目 [8] - 美国劳工联合会-产业工会联合会批评政策零敲碎打,缺乏连贯战略和清晰愿景 [14]
东土科技:公司目前并不直接生产人形机器人本体
证券日报网· 2025-09-24 17:10
核心观点 - 公司不直接生产人形机器人本体 但在具身机器人领域提供底层技术支撑 [1] 业务定位 - 公司目前并不直接生产人形机器人本体 [1] 技术优势 - 鸿道操作系统承担国家重大专项 具备完全自主可控属性 [1] - AUTBUS总线网络是国内唯一获国际标准的总线技术 [1] - 二者可共同构建具备时间确定性网络与确定性计算能力的机器人电子架构 [1] 技术应用价值 - 为具身机器人的高安全 高性能 高质量发展提供自主可控的底层技术保障 [1]
劳动者自己当代言人,北京十大劳务品牌盯准“北京特色”
北京日报客户端· 2025-09-24 13:14
北京劳务品牌整体概况 - 北京推出10个具有地方特色的劳务品牌,包括怀柔宝山大姐、密云文物医生、京顺小蜜蜂等,针对劳务输入城市特点,为外来务工群体提供职业发展支持 [1] - 品牌代言人均为深耕各自领域的劳动者,通过亲身经历和专业实力展示品牌魅力 [1] - 品牌建设紧密贴合民生需求,以高端技能为核心,部分品牌深度融合北京历史文化特色 [15] 北京惠心相伴医疗护理员 - 品牌已标准化培训4000余名护理员,遍布北京70家医院,服务对象中六成以上为60周岁以上老人 [4][5] - 北京常住老年人于2024年底达514万人,首次突破500万,预计“十六五”初期进入重度老龄化社会,医疗护理需求巨大 [5] - 通过惠佳丰职业技能培训学校进行系统培训,年培训量超6000名,新手需经过120课时线上培训及一周多实操,通过模拟患者等严格考试方可上岗 [5] 北京智虫匠才 - 品牌专注于机器人技术人员高技能培训,实现“岗位需求+技能培训+技能评价+就业服务”四位一体闭环服务,累计培训7000余人,就业率达98% [9] - 中国已成为全球最大工业机器人应用市场,连续6年位居世界首位,装机量占全球市场的36% [9] - 代言人常锋带领团队完成多个工业自动化项目,每年为企业降低生产制造成本超2000万元 [8] 房山智源工匠 - 品牌聚焦新能源汽车技术、AI数字媒体等科技领域,采用“订单式培训”模式与多家知名企业合作,办学至今解决5000人次就业,年均招生2300-2500人,就业率达98% [12][14] - 研发VR新能源汽车故障模拟系统,将汽车部件拆分成可视化模块,实现虚拟模型与物理设备故障联动,提升教学效率 [12] - 学校落户房山窦店,依托中关村房山园的新型储能与氢能、智能制造等四大产业集群,形成“前店后厂”的产业生态 [13] 北京劳务品牌发展策略 - 品牌建设首要特色是以劳务输入为主,通过引进外地优质劳动力并高标准培训,缓解本地护理员紧缺等民生痛点 [15] - 部分品牌以输出高端技术标准和智能发展理念为目标,助力全国相关领域人才培养 [15] - 联动京津冀区域发展,创新品牌建设模式,例如与雄安新区合作共建京雄数字媒体人劳务品牌 [15]
印媒:印度应与中国携手向前
环球网资讯· 2025-09-16 07:10
文章核心观点 - 印度应在能源、交通和人工智能等关键领域与中国合作,以加速其自身发展目标 [1][2][3] 能源行业 - 中国发电量达到美国发电量的2.5倍,并计划每年新增相当于整个德国的发电量 [1] - 中国通过清洁电力赢得电力竞赛,并在彭博新能源财经全球供应链排名中重新夺回第一,得益于较低的商业电价和雄厚的制造实力 [1] - 印度应大力发展国内太阳能发电和储能产业,并与中国进行资本支出合作以实现上游产品生产本地化,缩短走向大规模生产的时间 [2] 交通行业 - 在电动汽车领域,中国占据主导地位,2024年占全球电动汽车销量的近2/3 [1] - 电动汽车占据中国国内汽车月销量的半壁江山,全球最畅销的10个电动汽车品牌中有6个为中国品牌 [1] - 中国的电动汽车和电池巨头纷纷在海外建厂,印度需通过本地化和知识产权护栏参与承接这些产能的竞争 [2] 人工智能行业 - 美国在尖端前沿模型方面领先,但人工智能大规模应用的天平倾斜将取决于计算所需的能源、数据、监管和需求,而不仅取决于模型基准 [1] - 中国已解决为人工智能运行提供能源的问题,并在机器人技术领域处于全面领先地位 [2] - 中国的人工智能发展路径是通过清洁能源为开源人工智能提供动力并聚焦于各种应用场景,人工智能应用将在计算成本低、数据充足且监管支持快速部署的地方流行 [2] 印度合作策略 - 印度的增长策略依赖于大规模能源、出口市场以及获得前沿技术,而中国在这三项领域处于主导地位 [2] - 印度应继续以“多边结盟”为战略特色,但在推进自身实现目标的领域应与中国携手前行 [3]
杭州六小龙融资近20亿,群核科技两度IPO失效,宇树强脑竞速上市
金融界· 2025-08-15 07:15
杭州科技创新生态发展机遇 - 杭州科技创新生态迎来前所未有的发展机遇 以深度求索 宇树科技 群核科技 强脑科技 云深处科技 游戏科学为代表的杭州六小龙企业群体成为资本市场关注焦点 [1] - 杭州六小龙在人工智能 机器人技术 脑机接口等前沿科技领域展现出强劲实力 吸引了众多投资机构的青睐 [1] 群核科技IPO进展与财务表现 - 群核科技作为杭州六小龙中首个冲刺IPO的企业 于2024年2月14日向港交所递交招股书 但该招股书已于8月14日因6个月有效期届满自动失效 [3] - 群核科技2022年 2023年 2024年前三季度营收分别为6.01亿元 6.64亿元 5.53亿元 毛利率达到72.7% 76.8%及80.4% [3] - 公司经调整净亏损2022年 2023年 2024年前三季度分别为3.38亿元 2.42亿元 9361.1万元 通过外部融资维持运营 [3] - 公司股权结构中三位创始人黄晓煌 陈航和朱皓分别持有15.46% 11.04%和4.22%股权 四大机构合计持股近50% [3] 宇树科技上市计划 - 宇树科技于2024年7月7日与中信证券签署辅导协议 正式启动A股IPO进程 [4] - 按照计划 中信证券将在7月至9月对相关人员进行集中授课 最早将于2024年10月进行上市条件综合评估 [4] 创投机构战略布局 - 强脑科技正以超13亿美元的估值洽谈约1亿美元的IPO前融资 [5] - 云深处科技在2024年7月宣布完成近5亿元人民币的新一轮融资 [5] - 投资机构认为人工智能 机器人技术等前沿科技企业具备较大成长空间 创投资本涌入不仅提供发展资金 还带来产业资源和管理经验 [5] 政府引导基金支持 - 多个省市新设引导基金存续期均在10年以上 部分长达20年 为创投机构提供更充裕的投资和退出时间 [6] - 深圳市福田引导基金率先支持延长在管子基金存续期2年 为行业树立标杆 [6]
2021版“散户暴打空头”重演?这是美股最被做空的小微盘名单
华尔街见闻· 2025-07-23 09:06
市场投机情绪 - 散户投机热潮正席卷美股市场 一场堪比2021年GameStop行情的"Meme股"逼空大戏重新上演[1] - 美股期权市场看涨合约交易占比飙升至70% 创2021年"史诗级散户逼空"事件后新高[1][5] - 社交媒体再次成为散户集结地 Reddit的WallStreetBets论坛充斥鼓励买入高做空股票的帖子[8] 目标公司特征 - 市值在1000万至15亿美元 空头头寸占自由流通股比例超过25%的小微盘股票成为主要目标[4] - 40只符合条件的高做空股票涵盖生物技术 零售 机器人技术等多个行业[4] - 这些公司大多基本面不佳 但高空头比例为潜在轧空行情提供充足燃料[6] 个股表现数据 - BEELINE HOLDINGS空头比例高达166.77% 市值1800万美元 上周股价大涨31.1%[4][7] - NEOVOLTA空头比例81.22% 市值1.604亿美元 SKILLZ空头比例81.02% 市值1.133亿美元[4][7] - 1-800-FLOWERS空头比例69.39% 上周大涨29.7% IOVANCE BIOTHERAPEUTICS上周涨幅达35.4%[6][7] 市场交易活动 - 百货零售商Kohl's股价周二开盘后一度翻倍 全天成交量达1.83亿股 是25日移动平均成交量的25倍[8] - Kohl's期权总成交量达36万份合约 较日均水平暴增12倍 看涨期权成为主力[8] - 分析师警告市场情绪正走向非理性繁荣 投资者对风险因素表现出较少担忧[8]
分析了102个VLA模型、26个数据集和12个仿真平台
自动驾驶之心· 2025-07-22 10:18
视觉-语言-动作(VLA)模型综述 - 核心观点:VLA模型通过整合视觉感知、语言理解和机器人控制,正在推动机器人技术的变革性发展[3][7] - 研究范围:全面梳理了102个VLA模型、26个基础数据集和12个仿真平台[3] - 发展趋势:从端到端框架向模块化架构演进,强调跨模态对齐和泛化能力[9][12] VLA模型架构 - 主流架构:基于Transformer的视觉和语言骨干网络,通过跨模态注意力机制融合[9] - 视觉编码器:CLIP、SigLIP和DINOv2等ViT变体成为主流选择[13] - 语言编码器:LLaMA、Vicuna系列和T5风格模型广泛应用[15] - 动作解码器:扩散策略因能建模复杂动作分布而受青睐[15][16] 数据集发展 - 数据集演进:从早期简单状态-动作映射发展到多模态、长时间跨度数据集[21] - 代表性数据集:Open X-Embodiment统一22个机器人实体和500多个任务数据[5] - 评估标准:建立任务复杂性和模态丰富度二维评估框架[22][24] 仿真平台 - 主要平台:AI2-THOR、Habitat和NVIDIA Isaac Sim等提供多模态支持[30][31] - 功能差异:从逼真室内导航到接触丰富的物理模拟各有侧重[31] - 发展趋势:强调GPU并行计算和大规模场景生成能力[33] 应用领域 - 主要方向:操作与任务泛化、自主移动、人机交互等六大领域[34] - 代表性模型:RT-2、Pi-0和CLIPort等在各自领域表现突出[37] - 技术路线:分为大型通用架构和模块化专用系统两大发展轨迹[38] 挑战与机遇 - 架构挑战:分词对齐、模态融合和跨实体泛化等关键技术瓶颈[39][40] - 数据限制:任务多样性不足、模态不平衡和注释成本高等问题[42] - 仿真差距:物理准确性、视觉真实性和语言接地API等亟待改进[44][45]
利亚德(300296) - 2025年7月4日投资者关系活动记录表
2025-07-07 09:08
公司业务介绍 - 公司AI与空间计算业务板块以全球领先的光学动作捕捉技术为核心,研发、生产、销售动捕产品,推动其与各行业结合的应用方案,已应用于影视娱乐、具身智能机器人等多领域 [1] - 公司在OptiTrack技术基础上,增加Lydia动作大模型等多种前沿技术能力,可提供不同解决方案 [1] - 2024年公司以“数据、服务、算法、硬件”为核心能力入局具身智能领域,发布技术成果和解决方案,成立具身智能联合实验室 [2] 具身智能领域赋能方面 - 数据方面,公司有丰富动作数据原始积累,可基于动作捕捉技术产出新数据,构建机器人动作数据集 [2] - 服务方面,公司从提供硬件设备拓展出数据采集开发、机器人训练等服务 [2] - 算法及硬件方面,开发小型摄像头,配合SLAM算法积累,为机器人提供空间定位摄像头 [2] 投资者问答 - 公司会基于客户需求提供硬件、软件、数据服务等,制定整体解决方案和机器人训练服务 [3] - 公司有现成高质量动作数据库,机器人厂商可提取数据,公司也会按需采集 [3] - 机器人达到泛化标准所需数据量不确定,如跑步训练百条有效数据配合算法可适应路况,精细动作需更多数据,算法泛化能力也是关键因素 [4] - 一条数据指一组有意义的动作 [5] - 数据采集后需先清洗,再调优线路,重定向给机器人 [5] - 公司有光学、惯性等多种技术路线,认为光学对机器人训练最合理,因其精度最高 [5]
镁伽科技冲刺港交所:国内收入最大的自主智能体供应商,在手订单15亿元
IPO早知道· 2025-06-26 08:39
公司概况 - 镁伽科技成立于2016年,是一家自主智能体提供商,专注于智慧实验室与智能制造场景,通过机器人技术和AI提升生产力并推动创新 [2] - 公司业务从生命科学智慧实验室领域起步,逐步扩展至消费级集成电路、餐饮、新能源和农业应用领域 [2] - 公司开发的多功能自主智能体擅长独立完成复杂任务,解放人力以专注于高价值工作 [2] 市场地位 - 以2024年智慧实验室场景收入计算,镁伽科技位居中国国内自主智能体供应商首位 [3] - 截至2025年6月21日,公司在中国拥有最广泛的机器人应用场景覆盖 [3] 技术创新 - 开发中国首套智慧实验室自主智能体操作系统Labillion和LibraX,融合自动化、数据治理和AI决策功能 [4] - 推出中国首个基于多智能体解决方案的智能生命科学实验室Megalaxy Lab,覆盖样本处理、检测分析和深度数据学习全流程 [4] - 开发中国首款AI驱动液体处理工作站Auflo,将复杂手工实验流程转化为自动化程序 [4] - 推出高内涵成像分析系统CellVue,像素分辨率达中国行业竞品最高水平 [4] - 发布国内首款7μm超薄切割刀片,实现半导体制造领域突破,摆脱对进口切割耗材的依赖 [4] 客户与市场 - 截至2024年12月31日,公司为超880家客户提供服务,包括安捷伦科技、药明康德、金域医学等 [5] - 2022年新获取的主要客户复购率为74%,收入留存率为115% [5] - 全球自主智能体机器人技术市场规模从2020年的约318亿元增至2024年的约1,143亿元,复合年增长率37.7%,预计2030年达约3,837亿元,复合年增长率22.4% [5] 财务表现 - 2022年至2024年营收分别为4.55亿元、6.63亿元和9.30亿元,复合年增长率43.0% [2][5] - 截至2025年6月21日,公司在手订单大幅增至15亿元 [5] - 2022年至2024年毛利率分别为28.1%、23.9%和29.0% [6] 融资与资金用途 - 公司获得亚投资本、药明康德、明势创投、高盛等知名机构投资 [6] - IPO募集资金将主要用于技术和产品研发、扩大产能、扩张销售网络、战略合作和投资、营运资金及一般公司用途 [6]