RoboBrain 2.0

搜索文档
智源宣布全面开源RoboBrain 2.0与RoboOS 2.0;全球首个AI智能体运行安全测试标准发布丨AIGC日报
创业邦· 2025-07-15 07:59
1. 【"生物人工智能"系统创建】7月14日消息,澳大利亚悉尼大学研究团队开发出一种名为PROTEUS 的"生物人工智能(AI)"系统。该系统通过模仿自然进化过程,能在几周内创造出具有新功能的分子, 为药物研发和生物技术带来突破性进展。该成果发表在最新一期《自然·通讯》期刊上,不仅展示了生物 技术与AI融合的前景,更可能为个性化医疗和精准治疗提供关键工具。(光明网) 2.【 全球首个AI智能体运行安全测试标准发布】 7月14日消息,日前,世界数字科学院(WDTA)在联 合国日内瓦总部正式发布AI STR系列新标准《AI智能体运行安全测试标准》,标准由蚂蚁集团、清华大 学、中国电信牵头,联合普华永道、新加坡南洋理工大学、美国圣路易斯华盛顿大学等二十余家国内外 机构、企业及高校共同编制,为全球首个单智能体运行安全测试标准,解决了智能体安全测试技术标准 的行业空白。(上游新闻) 扫码订阅 AIGC 产业日报, 精选行业新闻,帮你省时间! 此外,如果您还想 查公司、找项目、看行业,深入了解人形机器人、商业航天、AGI等热门赛道 ,欢迎加入睿兽分析会员,解锁相关行业图谱和报告等。 (活动期间加入会员可免费获赠一份 产业 ...
腾讯研究院AI速递 20250715
腾讯研究院· 2025-07-14 22:38
1. Comet是一款"AI Agent原生"浏览器,核心理念是"从浏览到思考",可连接多标签页信息 并执行复杂任务; 生成式AI 一、 Perplexity 的 AI Agent 浏览器 实测 , 重新学习「上网」 2. Comet采用"环境重构派"策略,将浏览器打造成智能环境,而非仅集成AI功能,旨在重新 定义人与信息关系; 3. 目前Comet仅向支付200美元的Max订阅用户开放,面临用户习惯难改和高昂定价两大挑 战。 https://mp.weixin.qq.com/s/NjtBt35DTwyNR8Yo9z2QkQ 二、 Meta 收购 PlayAI!强化 AI 虚拟角色与创意内容生成 1. Meta收购语音AI初创公司PlayAI,交易估值接近1亿美元,整个团队将加入Meta的新语音 AI部门; 2. PlayAI提供语音克隆、多语言TTS、情感化对话模型等技术,将补齐Meta在音频生成方面 的短板,完善多模态内容生成能力; 3. 此次收购是Meta超级智能战略的重要一环,与组建"AI Superintelligence Labs"、投资 Scale AI等动作共同构成其720亿美元AI年度投入计 ...
智源RoboBrain 2.0+RoboOS 2.0双发:问鼎评测基准最强具身大脑,刷新跨本体多机协作技术范式
机器之心· 2025-07-14 19:33
机器之心发布 机器之心编辑部 近日,智源研究院发布具身大脑 R oboBra in 2.0 32B 版本以及跨本体大小脑协同框架 RoboOS 2.0 单机版 。 RoboBrain 2.0,作为集感知、推理与规划于一体面向真实物理环境的 "通用具身大脑",32B 版本凭借时空认知能力的突破,在 多 项权威 具身智能基准上全面刷新 纪录 ,此前发布的 7B 版本,具备紧凑高效的模型结构,其轻量化设计完美 适配边缘设备部署需求 ,能在低资源环境下稳定运行,同时 相比主流的开闭源模型性 能依旧强劲。 RoboOS 2.0 作为 全球首个具身智能 SaaS 开源框架 ,创新性集成 MCP 协议与无服务器架构 ,实现轻量化部署,打通智能大脑与异构本体协同通路。同步推出 单 机版产品线及 RoboSkill 技能商店 ,通过深度集成实现机器人技能模块智能匹配与一键适配功能,标准化接口有效消除厂商与硬件适配流程差异。同步推出 开箱 即用镜像 ,支持 "三行指令" 极速部署,全面赋能开发者高效构建智能机器人系统。 具身大脑与跨本体大小脑协同框架双擎联动,将有效推动机器人 从 "单机智能" 迈向 "群体智能" ,加速具身智能 ...
智源全面开源具身大脑RoboBrain 2.0与大小脑协同框架RoboOS 2.0:刷新10项评测基准
具身智能之心· 2025-07-14 19:15
点击下方 卡片 ,关注" 具身智能之心 "公众号 >> 点击进入→ 具身 智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有 你想要的。 近 日 , 智 源 研 究 院 发 布 具 身 大 脑 RoboBr ain 2.0 3 2B 版 本 以 及 跨 本 体 大 小 脑 协 同 框 架 RoboOS 2 . 0单机版 。 Ro boBr a i n 2.0,作为集感知、推理与规划于一体面向真实物理环境的"通用具身大脑", 3 2B 版本凭借时空认知能力的突破,在 多项权威具身智能基准上全面刷新纪录 ,此前发 布的 7B 版本,具备紧凑高效的模型结构,其轻量化设计完美 适配边缘设备部署需求 , 能在低资源环境下稳定运行,同时 相比主流的开闭源模型性能依旧强劲 。 Ro boOS 2.0作为 全球首个具身智能SaaS开源框架 ,创新性集成 MCP协议与无服务器 架构 ,实现轻量化部署,打通智能大脑与异构本体协同通路。同步推出 单机版产品线及 RoboSkill技能商店 ,通过深度集成实现机器人技能模块智能匹配与一键适配功能,标准 化接口有效 ...
具身智能大脑+首个SaaS开源框架,智源研究院刷新10项测评基准,加速群体智能新范式
量子位· 2025-07-14 13:23
允中 发自 凹非寺 量子位 | 公众号 QbitAI 具身智能大脑+全球首个具身智能SaaS开源框架,智源研究院在 具身智能 领域发力了—— "通用具身大脑" RoboBrain 2.0 ,面向真实物理环境,集感知、推理与规划于一体。 全新 32B 版本凭借时空认知能力的突破,在多项权威具身智能基准上全面刷新纪录。 RoboOS 2.0 ,作为 全球首个具身智能SaaS开源框架 ,创新性集成 MCP协议与无服务器架构 ,实现轻量化部署,打通智能大脑与异构本 体协同通路。 两招齐出,并且全部 开源 ,发布便在全球社交媒体和技术社区引发广泛热议。 不少具身智能专业人士就指出,具身大脑+跨本体大小脑协同框架,是推动机器人从"单机智能"迈向"群体智能"的有效路径,能加速具身智能技 术从实验室走向真实场景。 一起来看具体技术细节。 RoboBrain 2.0:突破三大核心瓶颈 当前主流AI模型在应对真实物理环境时,普遍存在三大核心瓶颈: 空间理解精度不足 、 时间依赖建模薄弱 、 长链推理能力欠缺 。 RoboBrain 2.0正是针对于此,在三大关键能力上实现了全面突破,显著提升了对复杂具身任务的理解与执行能力。 空 ...
人工智能“出屏” 机器人“登场”
人民日报· 2025-06-12 06:50
AI技术演进路径 - 人工智能正从单纯工具向能与现实世界互动的助手转变,具身智能和通用AI成为前沿议题 [1] - 生成式AI快速发展使大模型成为核心技术,能力边界从写作绘画扩展到编程视频生成 [2] - AI发展进入新阶段,需具备理解推理和行动能力,现有系统已在特定任务超越人类但存在行为不可控风险 [2] - 大模型发展触及人类数据极限,未来AI需从交互经验中学习而非依赖静态数据训练 [3] 技术突破方向 - 大模型性能提升可通过强化学习技术突破、高质量数据合成和多模态数据应用三种路径实现 [3] - 具身智能面临不好用不通用不易用问题,硬件不成熟和数据获取难制约模型训练与落地 [6] - 智源研究院发布开源"悟界"具身智能平台,包含RoboOS 2.0和RoboBrain 2.0,已与20多家企业建立合作 [6] 具身智能发展现状 - 具身智能成为行业热点,银河通用Galbot、宇树G1和天工2.0等机器人展示多样化应用场景 [4] - 机器人技术通过春晚表演和格斗比赛展示水平,未来将在家庭生活和医疗制造等领域广泛应用 [4] - 世界人形机器人运动会将在中国举办,比赛任务源自物流搬运和医疗分拣等真实企业需求 [5] - 当前具身智能处于初级阶段,初步展现物理智能能力但可靠性和泛化能力仍需突破 [5] 行业未来展望 - 具身智能研发门槛降低将吸引更多开发者参与,AI未来重点是与物理世界互动完成实际任务 [7] - 预计5-10年内具身智能可替代人类从事危险劳动,2045年有望代表人类进行星际探索 [7]
环球问策|智源研究院王仲远:当前正是AI产品爆发的“前夕”
环球网· 2025-06-10 12:42
大模型技术发展 - 多模态大模型技术成为主流,从单纯文本训练转向多模态能力,GPT-o3和GPT-4o为代表[1] - Scaling Law依然成立,未来可能通过人工智能合成数据实现自我学习和进步[3] - 大模型与硬件结合,通过具身智能解决实际生产生活问题成为可能[3] Agent产品化趋势 - 2025年被行业视为"Agent元年",基础大模型达到可用状态后,Agent成为产业界发力重点[1][3] - Agent领域可能出现"杀手级"应用,创业公司需聚焦专业领域而非通用领域[3] - 一人或少数人组成的创业公司有机会在特定领域创造独特的大模型产品[4] 智源研究院最新成果 - 推出"悟界"系列大模型,包含Emu3、Brainμ、RoboBrain 2.0和OpenComplex2四个模型[4] - RoboBrain 2.0任务规划准确率较1.0提升74%,空间智能性能提升17%并新增空间推理能力[4] - 已开源核心资源,与20多家具身智能企业共建协同生态[4] 产业发展环境 - 人工智能进入产业爆发期"拐点",需辩证看待技术快速发展阶段的落地现实[5] - 政府应创造良好创新创业环境,支持大中小企业及科研机构协同发展[5]
对话智源研究院院长王仲远:AI正加速从数字世界走向物理世界
21世纪经济报道· 2025-06-08 19:49
AI技术发展趋势 - AI技术从数字世界加速向物理世界转化,重点应用于人形机器人训练和落地[1] - 大语言模型性能提升遇到瓶颈,强化学习优化推理能力、合成高质量数据替代人类标注、激活海量多模态数据成为三大解法[1] - 多模态数据规模可达文本数据的"百倍乃至万倍",将成为未来技术突破的关键[1] 世界模型技术路线 - 大模型技术路线从大语言模型转向原生多模态世界模型,以实现对物理世界的感知和理解[2] - 智源研究院推出"悟界"系列大模型,包括Emu3、见微Brainμ、RoboOS 2.0、RoboBrain 2.0和OpenComplex2[2] - Emu3的核心突破在于建立对物理因果关系的理解,而非简单的多模态信息拼接[2] 具身智能发展现状 - 人形机器人长期价值显著,因其更易融入社会基础设施且利于模型训练,但短期内四足、轮式等形态将共存[3] - 具身智能面临"硬件能力不足限制数据采集,数据稀缺制约模型进化"的循环困局,可通过互联网视频数据训练基础能力再微调解决[3] - 工厂场景成为具身智能优先落地领域,因其封闭环境可规避安全风险且存在重复任务刚需[3] 大小脑融合与泛化性 - 当前具身智能数据量不足以支持大小脑融合模型训练,预计5-10年内可能成熟[3][4] - 具身智能VLA模型泛化性不足,未来需突破专有任务达到跨领域泛化性[4] - 具身大模型发展处于早期阶段,类似GPT-3前的探索期,面临技术路线分歧和产业落地挑战[5][6] Agent与产业应用 - Agent成为产业界发力领域,类比移动互联网APP,基于可用基础大模型开发[4][5] - 基础大模型竞争已收敛至少数玩家,未来可能出现基于基座模型+垂类数据的"千模大战"[5] - 具身智能需解决"感知-决策-行动"协同、多模态数据融合等基础问题才能实现大规模商用[6] AGI发展里程碑 - 物理AGI的重要标志是机器人能真正理解物理因果关系,如"咖啡杯放桌沿会摔碎"[7] - 当前AGI刚过起跑线,具身智能仍需突破技术路线共识和产业落地障碍[5][6]
从预训练到世界模型,智源借具身智能重构AI进化路径
第一财经· 2025-06-07 20:41
AI发展趋势 - AI发展速度被低估 技术进步呈现非线性特征 大模型作为基础设施未来将更关注上层应用 [1] - AI重点从大语言模型预训练转向世界模型培育 智源研究院宣布进入"具身智能"探索阶段 [1][3] - 大模型与机器本体深度耦合 推动机器人从1.0时代迈向2.0时代 加速数字与物理世界融合 [3] 世界模型技术 - 世界模型尚无统一定义 智源通过"悟界"系列产品体现技术理解 包括Emu3/Brainμ/RoboOS 2.0等 [3][4] - Emu3实现多模态技术突破 通过视觉tokenizer统一处理图像/视频/文本 简化跨模态知识迁移 [4] - 大模型需突破时空感知隔阂 才能实现数字世界向物理世界的跨越 [4] 底座大模型发展 - 大语言模型性能提升放缓 突破路径包括强化学习/数据合成/多模态数据 [5] - 多模态数据规模可达文字数据百倍至万倍 但利用率低下 成为技术突破重点 [5] - 原生多模态世界模型本质是让AI感知物理世界 通过与硬件结合解决实际问题 [5] 具身智能挑战 - 存在"数据-能力"循环悖论:具身能力不足限制数据采集 数据稀缺又制约模型发展 [6] - 技术路线尚未收敛 不同厂商采用差异化探索方式 智源方案仅为"一家之言" [6] - 跨本体小脑技能未达共识 需通过产业迭代实现硬件标准化 [8] 机器人行业痛点 - 场景泛化能力差 单一机器人难以适应多场景工作需求 [9] - 任务泛化能力差 需搭载不同程序完成同类场景不同任务 [9] - 本体泛化能力差 机器人设计高度依赖特定工作场景 [9] 控制技术现状 - MPC控制技术存在三大局限:仅适用结构化环境/固定流程/预编程任务 [10] - 具身大模型处于GPT-3前探索期 技术路径未统一 产业落地需突破多模态融合等基础问题 [10]
智源研究院发布“悟界”系列大模型:让AI看见并理解物理世界
经济观察网· 2025-06-07 10:55
智源研究院最新动态 - 北京智源大会开幕,吸引图灵奖得主约书亚·本吉奥、强化学习之父理查德·萨顿及谷歌、Meta、华为等全球知名AI机构学者参与[2] - 公司发布"悟界"系列四大模型,包括原生多模态世界模型Emu3、脑科学多模态通用基础模型Brainμ、具身智能框架RoboOS 2.0/RoboBrain 2.0及全原子微观生命模型OpenComplex2[2][3] - 院长王仲远提出大语言模型面临增长天花板,AI下一阶段需突破多模态世界模型以理解物理世界[2][4] 悟界系列模型技术细节 - Emu3采用视觉Tokenizer技术,实现文字/图像/视频的统一表征和生成[3] - Brainμ整合超100万单位神经信号数据,与清华、北大等机构合作验证脑疾病诊断等应用潜力[3] - RoboOS 2.0性能提升30%,全链路响应时延缩短至毫秒级;RoboBrain 2.0增强多机协同规划能力[3] - OpenComplex2实现原子级分子运动模拟,弥补AI静态结构预测短板[3] 战略方向与行业趋势 - 公司提出从语言模型转向世界模型,通过多模态技术让AI模拟物理世界运行与交互[4] - 具身智能短期面临商业化挑战,包括数据采集成本、伦理问题及适配成本[5] - 与香港投资管理有限公司达成战略合作,聚焦全球人才汇聚与技术全球化[6] 国际化与开源进展 - 坚持开源路线,累计开源200个模型,全球下载量达6.4亿次[7] - 通过新加坡"青源会"连接全球青年AI人才,加强欧洲合作并评估中东市场机会[6] - 历史模型"悟道"系列曾创1.75万亿参数纪录,2023年悟道3.0实现多模态突破并全面开源[6]