Workflow
RynnEC
icon
搜索文档
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
具身智能之心· 2025-08-12 08:03
阿里达摩院具身智能开源项目 - 阿里达摩院在世界机器人大会上宣布开源三款具身智能相关模型和协议:视觉-语言-动作模型RynnVLA-001-7B、世界理解模型RynnEC、机器人上下文协议RynnRCP [1] - RynnRCP协议旨在解决具身智能开发流程碎片化问题,推动数据、模型和机器人本体的兼容适配,已支持Pi0、GR00T N1.5等多款热门模型及SO-100、SO-101等机械臂 [2] - RynnRCP包含两大模块:RCP框架(建立机器人本体与传感器连接)和RobotMotion(实现大模型与机器人控制的桥梁)[4][5] 开源模型技术细节 - RynnVLA-001是基于视频生成和人体轨迹预训练的7B参数模型,可从第一人称视频学习人类操作技能并迁移到机械臂控制 [7] - RynnEC是世界理解模型,能从11个维度解析场景物体,支持仅通过视频序列建立空间感知 [7] - 达摩院上月还开源了WorldVLA模型,首次实现世界模型与动作模型融合 [8] 具身智能产业布局 - 达摩院聚焦具身智能系统和模型研发,与产业共建基础设施包括硬件适配、数据采集和技术社区 [7] - 公司正在拓展机器人产业空间,加速场景落地 [7] 开发者生态建设 - 具身智能之心知识星球是国内首个具身智能全栈学习社区,包含30+学习路线、40+开源项目、60+数据集 [11] - 社群覆盖60+技术交流群,涉及大模型、机器人仿真、产品开发等多个方向 [12]
腾讯研究院AI速递 20250812
腾讯研究院· 2025-08-12 00:01
一、xAI开放Grok 4 - Grok 4向全球用户免费开放但限制每12小时使用5次 达到限制后完全不可用 [1] - 该策略被视为对标GPT-5发布 引发付费用户对订阅价值的质疑 [1] - Grok Imagine视频生成服务新增分享功能 修复下载问题并强化图片审核机制 [1] 二、浪潮发布元脑SD200服务器 - 元脑SD200将64张GPU卡融合为统一内存节点 支持四大国产开源模型并行运行 [2] - 采用3D Mesh架构与GPU虚拟映射技术 显存达4TB 内存64TB 满足万亿参数模型推理需求 [2] - 64卡运行DeepSeek R1性能提升3.7倍 Kimi K2提升1.7倍 专为Agentic AI计算需求设计 [2] 三、智谱GLM-4.5技术突破 - GLM-4.5公开预训练与后训练细节 首创单模型融合推理、编码与智能体能力 [3] - 基于MoE架构与15T通用+7T专业数据训练 强化长上下文与智能体性能 [3] - 在12项ARC测试中超越Claude Opus 4 部分指标超过OpenAI o3 [3] 四、昆仑万维SkyReels-A3视频模型 - SkyReels-A3基于DiT架构生成1分钟数字人视频 优化手部动作与运镜控制 [4] - 采用改进插帧方法与ControlNet模块 解决长视频稳定性与多视角切换问题 [4] - 作为五天技术发布周首款产品 已上线Talking Avatar工具 [4] 五、腾讯混元3D生成能力升级 - 创想三维MakeNow平台接入腾讯混元 增强CubeMe等工具的3D生成能力 [5] - 混元3D v2.5采用稀疏原生架构 几何分辨率达1024³ 纹理贴图4K级 [6] - 用户上传照片5分钟内可生成可打印Q版手办 支持三种风格个性化调整 [6] 六、阿里开源具身智能组件 - 开源RynnVLA-001视觉-语言-动作模型 能从第一人称视频学习人类操作 [7] - RynnRCP协议打通传感器到执行的机器人工作流 支持多款热门模型 [7] - RynnEC模型通过视频序列建立连续空间感知 引入多模态世界理解能力 [7] 七、百川医疗大模型Baichuan-M2 - 32B参数Baichuan-M2在HealthBench评测中仅次于GPT-5 超越所有开源模型 [8] - 集成验证系统与患者模拟器 严格遵循中国医疗指南并适配临床场景 [8] - 4bit量化后单卡RTX4090可部署 成本较DeepSeek-R1 H20降低57倍 [8] 八、灵巧智能机器人手技术 - DexHand021 Pro拥有22自由度 双绳驱动实现拇指对指等精细操作 [9] - 串并混联设计解决摩擦损耗问题 四指负载>1kg 整手抓握>5kg [9] - 集成12个电机与多传感器 成本仅为同类产品十分之一 [9] 九、Scaling Law行业观点 - Scaling Law反映数据内在幂律特性 模型能力非线性增长源于数据结构 [10] - 需通过强化学习将计算转化为新知识 建立生成-验证-学习的进化飞轮 [11] 十、2025大模型应用趋势 - 45%企业已部署大模型至生产环境 32%定制模型 27%采用API服务 [12] - 用户平均使用4.7家不同产品 ChatGPT领先但Gemini与DeepSeek增速显著 [12] - 55%接受中国模型但要求海外部署 英伟达占据78%训练硬件市场份额 [12]
达摩院开源具身智能“三大件” 机器人上下文协议首次开源
环球网· 2025-08-11 12:17
阿里达摩院开源具身智能技术 核心观点 - 公司在世界机器人大会上宣布开源三款具身智能技术产品:视觉-语言-动作模型RynnVLA-001-7B、世界理解模型RynnEC、机器人上下文协议RynnRCP 旨在解决开发流程碎片化及数据模型适配难题 [1] - 通过MCP理念和RCP协议推动数据模型与机器人本体的标准化对接 建立从传感器到动作执行的完整工作流 [1][2] - 开源模型聚焦第一人称视角技能迁移和物理世界理解能力 提升机械臂操控连贯性与场景解析精度 [3] 技术架构 - **RynnRCP协议** - 包含RCP框架和RobotMotion模块 前者实现本体-传感器连接与标准化接口 后者将低频推理转为高频连续控制信号 [2] - 已支持Pi0 GR00T N1 5等模型及SO-100 SO-101机械臂 提供仿真-真机一体化工具降低迁移难度 [1][2] - 协议分层处理传感器数据(RCP框架)与动作执行(Action Server) 支持遥操数据回流和推理服务 [2] - **开源模型特性** - RynnVLA-001-7B基于视频生成和人体轨迹预训练 实现第一人称视角操作技能向机械臂的隐式迁移 [3] - RynnEC模型通过11维度场景解析(位置/功能/数量等) 仅凭视频序列建立空间感知 支持复杂环境目标定位 [3] 行业布局 - 公司持续投入具身智能系统研发 已构建WorldVLA等融合世界模型与动作模型的技术体系 [3] - 联合产业方推进硬件适配 数据采集和技术社区(DAMO开发者矩阵)建设 加速机器人场景落地 [3]
机器人上下文协议首次开源:阿里达摩院一口气放出具身智能「三大件」
机器之心· 2025-08-11 11:19
阿里达摩院开源具身智能技术 - 公司在世界机器人大会上宣布开源三款具身智能相关技术:VLA模型RynnVLA-001-7B、世界理解模型RynnEC、机器人上下文协议RynnRCP [2] - 开源技术旨在解决行业开发流程碎片化、数据模型与机器人适配难等挑战,推动具身智能全流程开发 [3] - 公司将MCP理念引入具身智能领域,首次提出并开源RCP协议以标准化数据模型与机器人本体的对接 [3] RynnRCP协议框架 - 协议包含两大模块:RCP框架负责机器人本体与传感器的标准化连接,RobotMotion实现大模型与机器人控制的桥梁作用 [5][6][7] - RobotMotion能将低频推理指令实时转换为高频控制信号,支持仿真-真机一体化工具,降低策略迁移难度 [7] - 当前已兼容Pi0、GR00T N1.5等热门模型及SO-100、SO-101等机械臂 [3] 开源模型技术特性 - RynnVLA-001基于视频生成和人体轨迹预训练,可从第一人称视频学习人类操作技能并迁移至机械臂控制 [8] - RynnEC模型通过11维度场景解析能力,在复杂环境中实现目标定位分割,仅需视频序列即可建立空间感知 [8] - 公司此前开源的WorldVLA模型首次实现世界模型与动作模型融合,提升图像与动作的联合理解能力 [9] 行业布局与生态建设 - 公司聚焦具身智能系统与模型研发,联合产业方共建硬件适配、数据采集、开发者社区等基础设施 [8] - 技术开源覆盖从传感器数据采集、模型推理到动作执行的全流程,加速机器人场景落地 [3][8]