Workflow
EMMA
icon
搜索文档
具身领域LLM结合强化学习与世界模型工作汇总
具身智能之心· 2025-07-30 08:02
具身智能领域最新研究进展 1 UniSim通用现实世界交互模拟器 - 通过生成式建模整合多源数据(图像/机器人/导航数据)实现高层级指令和低层级控制的视觉结果模拟 [3] - 应用场景覆盖游戏/电影内容生成和具身智能体纯模拟训练(零样本迁移至现实)[3] - 实验证明可同时训练视觉语言策略和强化学习策略 [3] 2 因果世界模型与鲁棒智能体 - 首次证实最优智能体必须学习真实因果模型以实现跨领域泛化 [5] - 研究结论对迁移学习和因果推断领域产生深远影响 [5] 3 MAMBA元强化学习框架 - 结合模型方法与元强化学习技术实现15倍样本效率提升 [8] - 在高维任务场景验证有效性,推动现实世界泛化能力突破 [8] 4 EMMA多模态具身智能体 - 通过文本世界LLM指导视觉世界VLM训练(DAgger-DPO算法)[10] - ALFWorld基准测试成功率提升20%-70% [10] 5 Text2Reward自动奖励生成 - 基于LLM生成可执行密集奖励代码(无需真实数据)[13] - 17项操作任务中13项超越专家编写奖励 [14] 6 在线持续学习智能体 - 提出Behavior-IL/Environment-IL框架解决现实场景持续学习问题 [17] - CAMA机制无需任务边界信息即实现参数更新 [18] 7 AMAGO情境强化学习 - 通过并行化Transformer训练解决长期记忆和元学习挑战 [21] - 可攻克开放世界多指令完成难题 [21] 8 LLM世界模型构建 - 创新性采用PDDL构建显式世界模型(支持40+动作生成)[22] - 在Household领域成功求解48项复杂规划任务 [23]
寻找下一个泡泡玛特 东莞石排镇掀起潮玩淘金热
证券时报· 2025-07-30 06:15
行业概况 - 东莞石排镇拥有国内顶尖玩具制造产业链 潮玩产业正在重塑东莞玩具产业[1] - 东莞玩具制造产业起步于改革开放初期 产量最高时占全球30% 占广东50%[11] - 东莞目前有玩具工人30万人 超过4000家玩具企业 其中规模以上企业426家 上下游配套企业超过1500家[11] - 中国近85%的潮玩来自东莞 石排镇集聚超400家潮玩和玩具生产企业[11] - 2024年石排镇潮玩产业集群总产值132.18亿元 同比增长12.3%[11] - 石排镇是东莞产值最大 潮玩企业及自主品牌最多的镇街 潮玩产业产值约占东莞潮玩产业产值30%[11] 产业集群建设 - 石排镇投入约1亿元建成建筑面积约6万平方米的"中国潮玩之都·潮玩中心"[11] - 潮玩中心设有潮玩展厅 选品中心 培训基地 电商直播空间 共享办公空间等载体[11] - 截至目前累计引进企业33家 入驻面积约1.53万平方米[11] - 入驻企业类型涵盖潮玩IP孵化 品牌运营 设计研发 电商销售等生产性服务业[11] 企业案例:衍创文化 - 公司从广州搬迁至石排镇 看重产业集中度和集群效应[2] - 2019年推出自有潮玩品牌 是最早做自有IP的公司之一[2] - 旗下拥有麻酱工作室和尤弥工作室两个设计师团队[3] - 孵化了EMMA MISYA等知名原创潮玩IP[3] - EMMA秘境森林以北欧宫廷风格为设计原型[3] - 2020年仅推出两代盲盒 销售额从第一年2000万元增长到2022年1亿元[3] - 原为手办代工企业 后因合作方结账问题转向潮玩转型[3] 企业案例:大漂亮潮玩 - 抓住毛绒玩具爆火红利 去年销售额大增[4] - 通过电商直播走红后进入上游领域设计自有产品[5] - "娃三岁"系列毛绒玩偶在东南亚积累近400万粉丝 全球出货量突破2000万只[5] - 2024年5月推出首款自创产品"娃三岁"盲盒 很快打开市场[6] - 产品种类从角色模型拓展到T恤 填充玩具 钥匙扣 手机壳等多种品类[6] - 新品AI潮玩内置对话系统 售价399元[6] 企业案例:文博工艺/漫博潮玩 - 成立于2009年 是本地生产型企业转型升级的产物[7] - 拥有Hello Kitty 史努比 加菲猫 周杰伦等知名IP授权[8] - 部分产品授权费高达上百万元 需要做到3000万元销售额才能保本[8] - 参与巴西奥运会 俄罗斯世界杯吉祥物设计制作[7] - 是北京冬奥会吉祥物特许经销商 参与制造杭州亚运会 成都大运会和巴黎奥运会衍生品[7] - 2021年成立自主潮玩品牌漫博潮玩 组建东莞和上海4个设计研发团队[8] 产品特点与行业趋势 - 潮玩相比传统玩具利润空间更大[9] - 潮玩设计更精美 与消费者有更强情感牵绊 分系列销售带动持续购买[10] - LABUBU火爆带火毛绒搪胶玩具品类[10] - PVC玩具开模价格高(15万至20万元) 而毛绒搪胶玩具工艺简单 大幅降低开模成本[10] - 行业门槛下降导致毛绒搪胶玩具竞争加剧[10] - 最近两年不断有行业外人士加入潮玩行业 但很多因产品滞销留下库存[10]
寻找下一个泡泡玛特东莞石排镇掀起潮玩淘金热
证券时报· 2025-07-30 02:31
行业概况 - 东莞石排镇拥有国内顶尖的玩具制造产业链,潮玩产业成为热门,正在重塑东莞玩具产业 [1] - 东莞玩具制造产业起步于改革开放初期,产量曾占全球30%、广东50%,目前有30万玩具工人、超4000家玩具企业,中国近85%潮玩来自东莞 [11] - 石排镇集聚超400家潮玩和玩具生产企业,2024年潮玩产业集群总产值132.18亿元,同比增长12.3%,占东莞潮玩产业产值的30% [11] 公司案例 衍创文化 - 公司从广州搬迁至石排镇,因产业集中和集群效应,拥有自主潮玩品牌EMMA和MISYA,2020年销售额从2000万元增长至2022年1亿元 [2][3] - 旗下拥有麻酱工作室和尤弥工作室两个设计师团队,EMMA秘境森林系列以北欧宫廷风格为原型,第一代盲盒"茶会系列"获市场好评 [3] - 原为手办代工企业,因合作方结账问题转型潮玩 [3] 大漂亮潮玩 - 抓住毛绒玩具爆火红利,2023年销售额大增,因泡泡玛特出海带动海外商家寻找中国货源,其产品价格优势明显 [4] - "娃三岁"系列毛绒玩偶在东南亚积累400万粉丝,全球出货量突破2000万只,成为现象级原创IP [5] - 创始人章霆通过直播带货积累市场嗅觉,设计首款自主产品"娃三岁"盲盒,2024年5月推出后迅速打开越南等市场 [6] - 产品种类拓展至T恤、填充玩具、钥匙扣等衍生品,新品AI对话毛绒玩具售价399元 [6] 文博工艺/漫博潮玩 - 成立于2009年,曾参与巴西奥运会、俄罗斯世界杯吉祥物设计制作,是冰墩墩特许经销商及巴黎奥运会衍生品制造商 [7] - 拥有Hello Kitty、史努比等知名IP授权,但授权费高达百万元,需3000万元销售额保本,因此成立自主品牌漫博潮玩 [8] - 转型升级措施包括对授权IP再创作、组建4个设计研发团队,并引入自动点胶机等先进设备提升产能 [7][8] 产品与市场特点 - 潮玩与传统玩具差异显著:潮玩依赖外形设计而非故事IP,消费者因情感牵绊重复购买系列产品,购买动机更强 [9][10] - LABUBU火爆带动毛绒搪胶玩具品类,其开模成本(15万-20万元)低于PVC玩具,但行业门槛下降导致竞争加剧 [10] - 石排镇政府投入约1亿元建成"中国潮玩之都·潮玩中心",引进33家企业,涵盖IP孵化、设计研发等生产性服务业 [11]
自动驾驶端到端VLA落地,算法如何设计?
自动驾驶之心· 2025-06-22 22:09
自动驾驶VLA模型研究进展 - 端到端自动驾驶已成为主流范式 视觉-语言-动作(VLA)方法伴随具身智能兴起 相关论文横扫前沿领域 [2] - 主机厂如理想 文远知行 小米 小鹏等都在大力尝试VLA技术量产落地 [2] - 学术界和工业界涌现AutoVLA ReCogDrive等优秀工作 关注自适应推理 强化微调等方向 [3][7][9] 关键技术突破 - AutoVLA统一推理和动作生成 采用双重思维模式(快速/慢速思维)和GRPO强化微调方法 [3][4] - ReCogDrive采用三阶段训练框架 集成VLM与扩散规划器 PDMS达89.6创SOTA [7][9] - DriveMoE引入混合专家架构 包含场景专用视觉MoE和技能专用动作MoE 处理罕见驾驶行为 [19][21][22] - OpenDriveVLA通过分层视觉语言对齐和代理-环境-自我交互过程 实现轨迹规划SOTA [28][30][32] 数据集与基准 - Impromptu VLA数据集含8万+视频片段 覆盖4类非结构化场景 显著提升模型性能 [14][18] - DriveAction基准含16185个QA对 直接关联驾驶操作 支持全面评估VLA模型 [23][24] - 行业亟需更多高质量VLA基准 当前工作多基于nuScenes Bench2Drive等有限数据 [47] 行业应用趋势 - VLA模型输出形式向多模轨迹生成发展 文本输出逐渐被替代 [47] - 大规模自动驾驶预训练模型仍欠缺 多数工作依赖Qwen等开源模型 [47] - 时序处理能力待加强 需适配车端实时性要求 [47] - 小米 博世 清华等机构积极布局VLA研发 形成产学研协同 [7][14][19][28] 性能对比 - AutoVLA在nuPlan等基准上PDMS达92.12 碰撞率低于1% [5] - ReCogDrive在NAVSIM基准PDMS达89.6 超越前SOTA 5.6分 [9][10] - DriveMoE在Bench2Drive紧急刹车等场景能力提升显著 均值达47.91% [22] - OpenDriveVLA-7B在nuScenes开环规划L2误差仅0.66m 优于GPT-3.5等基线 [31]