悟能具身智能平台

搜索文档
商汤王晓刚:世界模型将加快AI从数字空间进入物理世界,「悟能」想做那个桥梁
机器之心· 2025-08-12 15:34
具身智能与世界模型 - 具身智能「大脑」以「世界模型」为内核,成为AI下一阶段竞争焦点 [1] - 世界模型被视为通往「类人智能」的解法,业界形成新共识 [1] - 2025年下半年具身智能「大脑」成为全球AI领域焦点 [1] - 世界模型技术研究曲线与具身智能产业发展路径交汇,引发行业争夺战 [2] 行业动态与厂商布局 - 谷歌推出具身智能RT-2模型,AI教母李飞飞聚焦具身智能创业 [3] - 国内厂商密集发布具身智能平台:智源研究院RoboBrain、华为云CloudRobo、字节跳动GR-3、京东JoyInside、商汤「悟能」、腾讯Tairos [3] - 商汤优势在于计算机视觉起家、多模态大模型打磨经验、智能驾驶沉淀、大装置算力支持 [3] - 商汤通过「悟能」平台将多年积累赋能行业 [3] 技术突破与挑战 - 大模型带来导航、人机交互、VLA端到端操作三方面技术突破 [7][8] - 自动驾驶技术进步使机器人导航功能提升 [9] - 多模态大模型带来全新人机交互方式 [10] - 世界模型通过学习物理规律和交通法则实现更高层次智能 [12] - 硬件质量和数据缺乏是主要挑战,尤其是规模化数据生产困难 [13] - 仿真数据与现实差距大,计算机视觉技术可带来新动能 [14] 商汤的技术布局 - 「开悟」世界模型应用于智能汽车,衍生出「悟能」具身智能平台 [5] - 平台包含10万3D资产,支持多视角学习,保持150秒时空一致性 [5] - 世界模型三大技术优势:时空一致性(11摄像头同步)、内容可编辑、反应速度实时 [21][23][24] - 「悟能」平台提供第一视角和第三视角数据,推动端到端VLA实现 [27][29] - 与机器人厂商合作形式为提供SDK软件功能API调用 [33] 应用场景与未来展望 - 机器狗可实现陪伴守护,家庭机器人建立情感连接 [30] - 具身智能成熟后将形成人机社交网络,机器人可完成多项家庭功能 [36] - 每项功能突破都将带来巨大市场想象空间 [37] - 商汤规划提供包含视觉、交互、导航、操作的「机器人大脑」 [39]
AI动态汇总:智谱发布GLM-4.5,蚂蚁数科发布金融推理大模型Agentar-Fin-R1
中邮证券· 2025-08-06 10:33
根据提供的研报内容,未发现涉及量化模型或量化因子的具体构建与测试内容。该报告主要聚焦于AI领域的技术动态与产品发布,包括以下核心内容: 1. **智谱发布GLM-4.5大模型** - 采用混合专家架构,总参数量3550亿,激活参数320亿[12] - 三阶段训练流程:通用文本预训练、专项数据精调、强化学习对齐[12] - 在AGI评测中综合得分63.2,智能体任务准确率26.4%[15] 2. **蚂蚁数科金融推理大模型Agentar-Fin-R1** - 基于Qwen3架构的双引擎设计,支持金融场景专用推理[20] - 在FinEval1.0评测得分87.7,风险定价任务位列第一[23] 3. **商汤"悟能"具身智能平台** - 核心"开悟"世界模型支持4D环境构建与多视角视频生成[27] - 演示案例中机器人实现PPT讲解与动态交互[28] 4. **京东JoyInside附身智能品牌** - 整合RAG、TTS等多模态技术,支持情绪检测与长期记忆[33] - 教育机器人接入后对话轮次提升148%[33] 5. **字节Seed Diffusion Preview模型** - 离散扩散架构实现2146 tokens/秒的代码生成速度[37] - 在CanItEdit基准pass@1准确率54.3%[39] 6. **通义千问Qwen3-30B-A3B模型** - MoE架构每次推理仅激活33亿参数,支持256K长文本处理[44] - 数学推理测试AIME25得分61.3,较前代提升183%[47] 7. **腾讯Tairos具身智能平台** - "三脑协同"模型划分感知、规划、行动模块[52] - 复杂任务链成功率超80%,动态纠偏响应300毫秒[52] 8. **Goedel-Prover-V2定理证明系统** - 8B参数模型性能达DeepSeek-Prover-V2-671B的83.3%[58] - MiniF2F测试集Pass@32准确率88.1%[60] 注:以上总结未包含风险提示、免责声明等非核心内容[7][65][68][69]。报告重点为AI技术进展,未涉及量化投资相关模型或因子[1][2][3][4][5][6]。
产业观察:【AI产业跟踪】字节开源AI Agent Coze
国泰海通证券· 2025-08-04 23:13
AI行业动态 - 上智院等联合发布星河启智科学智能开放平台,具备六大核心能力,支持多学科众研和干湿实验闭环[7] - 燧原科技AI算力部署规模达七万卡,推理卡"燧原 S60"支撑互联网客户及智算中心需求[30] AI应用资讯 - 商汤发布悟能具身智能平台,日日新V6.5多模态推理大模型跨模态推理精度超Gemini 2.5 Pro,性价比提升5倍[8] - 华为发布异腾智算平台AI-Box,搭载异腾400I Pro芯片,支持多模态大模型本地运行,适配工业质检等场景[9] - 腾讯发布具身智能开放平台Tairos,提供多模态感知、规划等模型及云服务工具,与硬件厂商合作推动行业落地[10] AI大模型资讯 - 阶跃Step 3模型总参数321B,激活参数38B,推理效率达DeepSeek-R1的300%,2025年预计收入近10亿[11] - 字节开源AI Agent Coze,GitHub星标超6000,支持可视化开发和一键分享至主流平台[14] - 智谱发布GLM-4.5融合大模型,总参355B,激活参32B,API价格低且生成速度快,获全球开源模型第一[17][22] - 京东云开源企业级全栈智能体JoyAgent,支持多智能体协同与并行处理,已应用于零售采销等场景[18] 科技前沿 - 后摩智能发布存算一体端边AI芯片M50,物理算力160TOPS,典型功耗仅10W,支持多模态大模型本地推理[32] - 钛动科技发布全球营销Agent Navos,将传统营销周期从数月缩至几天,提升人力资源效率数十倍[28]
具身智能行业研究:智元宇树相继发布新品,文远Robotaxi 获沙特自驾牌照
国金证券· 2025-08-03 20:05
行业投资评级 - 智能驾驶和机器人行业景气度稳健向上,ROBO+赛道被视为汽车板块最强产业趋势 [3] 智能驾驶核心观点 - 文远知行Robotaxi获沙特自动驾驶牌照,成为全球唯一拥有六国自动驾驶牌照的科技公司(沙特/中国/阿联酋/新加坡/法国/美国)[1][7] - 长安汽车集团成立注册资本200亿元的新央企,拥有117家分公司和子公司,资产总额3087亿元 [1][10] - 理想汽车首款纯电SUV i8搭载VLA技术上市,售价32.18万元,实现舱驾大一统 [8] - 蔚来乐道L90上市首日订单暴增,BaaS方案起售价17.98万元,搭载全域900V高压架构 [9] - 智己汽车发布800V超级增程技术,CLTC续航1500公里,纯电续航450公里 [11] 机器人核心观点 - 宇树科技发布消费级人形机器人R1,售价3.99万元起,26个关节/25kg重量,集成多模态大模型 [2][25] - 智元机器人发布业界首个具身智能操作系统"灵渠OS",并推出动作驱动平台"Genie Envisioner" [18][51] - 特斯拉第三代机器人进入工厂实测,计划2026年实现百万台量产 [19] - 赛博格Cyborg-R01刷新工业负载纪录,单臂负重20kg [19] - 商汤科技发布"悟能"具身智能平台,腾讯开源混元3D世界模型1.0 [63][65] 产业链投资机会 智能驾驶领域 - 关注大算力芯片(地平线)、激光雷达(禾赛/速腾聚创)、光学器件(舜宇/宇瞳)[67][68] - 整车厂商建议关注华为系(赛力斯/江淮/北汽)、理想、小米等具备五大竞争要素的企业 [67] 机器人领域 - 本体环节关注特斯拉、智元、华为、小米等具备场景化能力的厂商 [72] - 供应链重点关注触觉传感器、谐波减速器、高功率密度电机、PEEK材料等技术迭代方向 [72][73] - 智元供应链垂直商业模式重构,特斯拉供应链预计H2重启定点 [72] 行业重大事件 - 世界人工智能大会展出3000余项产品,意向采购金额162亿元 [14][16] - 全球首家机器人"6S店"在深圳开业,200家产业链企业表达进驻意向 [19][23] - 科沃斯机器人核心部件项目签约,年产2000万件/产值超10亿元 [57]
赛道Hyper | 落地:商汤推出悟能具身智能平台
华尔街见闻· 2025-08-02 17:48
商汤科技"悟能"具身智能平台发布 - 公司在2025世界人工智能大会推出"悟能"具身智能平台,以具身世界模型为核心引擎,提供感知、视觉导航及多模态交互能力 [1] - 平台依托商汤大装置提供端侧和云侧算力支持,可嵌入到端侧芯片和机器人等终端硬件 [1] - 这是公司在具身智能领域的具体实践,为智能设备发展提供新的技术选项 [2] 具身世界模型技术特点 - 核心引擎具身世界模型通过持续学习和整合海量数据,构建能实时反映物理世界变化的数字化镜像 [2] - 模型运作逻辑类似人类认知过程,通过传感器收集环境数据形成"认知"并为设备提供决策依据 [3] - 模型能根据新输入数据不断更新自身"认知",类似人类调整对世界的看法 [3] 平台功能特性 - 感知层整合各类传感器数据,在家庭场景可识别家具布局、家庭成员及温湿度,在办公环境能区分办公设备和文件资料 [4] - 视觉导航功能通过解析空间为机器人规划路径,在仓库等结构化环境中可实现货物转运 [4] - 多模态交互支持语音与视觉方式,智能音箱既能响应语音指令也能依手势调音量 [4] 硬件适配与应用场景 - 平台可应用于人形机器人、服务机器人及部分智能设备,具有硬件适配灵活性 [5] - 支持嵌入端侧芯片减少对云端算力依赖,智能门锁本地处理人脸信息速度提升 [8] - 应用场景覆盖家庭、办公和工业领域,包括清洁搬运、文件分类、零部件搬运等 [8] 技术展示与发展方向 - 现场展示搭载具身世界引擎的人形机器人讲解PPT效果,语言自然幽默并可回答问题 [8] - 未来将通过收集应用数据迭代模型,提升平台稳定性和适用性 [9] - 行业合作对推动具身智能技术进步至关重要 [9] 平台价值与挑战 - 平台推动具身智能从概念走向实践,为智能设备发展提供更多技术路径 [11] - 使用体验取决于设备能否解决实际问题并保持稳定可靠 [11] - 成本控制是关键环节,公司和合作方正探索在保证功能前提下降低成本的路径 [13][14]
大厂竞逐具身智能生态位 头部机器人企业跑出“黑马”
南方都市报· 2025-08-01 07:14
互联网大厂具身智能投资布局 - 腾讯、阿里、美团、百度、京东、小米等7家大厂2024年对具身智能企业累计投资23笔 其中阿里6笔、美团5笔、京东4笔、腾讯和百度各3笔、小米2笔 [6][11] - 大厂通过投资和自建团队双路径布局 美团、腾讯、京东、网易已搭建自有机器人团队 商汤科技据传将成立独立具身智能公司 [6][11] 腾讯具身智能平台发布 - 腾讯Robotics X实验室与福田实验室联合发布具身智能开放平台Tairos 首创模块化方式提供大模型、开发工具和数据服务 [6][8] - 平台包含多模态感知模型、规划大模型及云服务平台 通过标准化接口和SDK对外开放 宇树G1机器人搭载该平台实现自主行走、物体识别和交互对话 [8] - 腾讯战略从整机研发转向技术开放 首批合作伙伴包括越疆科技、乐聚机器人等多家企业 [13][15] 京东具身智能生态构建 - 京东推出附身智能品牌JoyInside 与数十家机器人企业达成合作 覆盖陪伴类、教育领域和产业领域产品 [9][11] - 布局聚焦三层面:依托3C平台布局消费入口 利用供应链数据沉淀产业大模型 结合物流场景与投资企业协同 [12] - 2024年5月投资智元机器人 7月连续投资三家机器人企业 [9][11] 商汤科技技术平台突破 - 商汤发布"悟能"具身智能平台 以具身世界模型为核心引擎 支持自然语言生成多视角视频 破解仿真数据输出难题 [9][14] - 强调研发与商业落地对齐 未来可能扩展至机器人小脑、本体等方向 目前定位做"机器人大脑" [14] 网易垂直场景应用 - 网易灵动发布全球首款露天矿山挖掘机装场景具身智能模型"灵掘" 在内蒙古煤矿实测装车效率达人工80% 近70%作业时间无需干预 [10][13] - 明确不做机器人本体 专注提供智能化大脑解决方案 产品线包括智慧矿山挖掘机器人、港口清舱装载机器人等 [13] 行业技术竞争格局 - 大厂主要聚焦数据、平台和模型层 瞄准决策层算法能力延伸 但缺乏感知层和控制层经验 [16][18] - 智元机器人实现全栈闭环发展 构建"数据-模型-本体-场景"四轮驱动体系 发布行业首个通用具身基座模型启元大模型 [18] - 初创企业在硬件供应链和非标硬件打造方面具备优势 银河通用机器人已实现货架取货送货自动化 与美团合作智慧药房解决方案 [17] 具身智能发展阶段 - 行业处于"掐生态位"阶段 大厂通过平台开放和生态合作抢占关键位置 [16][19] - 未来可能通过并购感知层和执行控制层企业完善生态 解决算法与实际应用脱节问题 [18]
具身智能布局“交卷”,腾讯、京东、商汤猛掐机器人生态位
南方都市报· 2025-07-31 13:28
大厂具身智能布局 - 腾讯、阿里、美团、百度、京东、小米7家大厂今年以来对具身智能企业共投出23笔资金,阿里最激进投6笔,美团5笔,京东4笔,腾讯和百度各3笔,小米2笔 [6][7] - 大厂布局策略包括投资初创企业和自建团队,美团、腾讯、京东、网易已搭建自有机器人团队 [1][6][7] - 腾讯Robotics X实验室与福田实验室联合发布具身智能开放平台Tairos,首创模块化方式提供大模型、开发工具和数据服务 [2][8] - 京东成立附身智能品牌JoyInside,与数十家机器人企业达成合作,涵盖陪伴类、教育领域和产业领域 [4][7] - 网易推出全球首个露天矿山挖掘机装车场景具身智能模型"灵掘",单机装车效率达人工80% [5][9] 具身智能平台与产品 - 腾讯Tairos平台包含多模态感知模型、规划大模型及感知行动联合大模型,通过标准化接口和SDK提供服务 [2][8] - 商汤发布"悟能"具身智能平台,以具身世界模型为核心引擎,可生成符合物理规则的多视角视频 [3][10] - 京东JoyInside将角色大模型驱动对话智能体植入机器人,限时免费开放接入服务 [4][8] - 智元机器人实现"一体三智"全栈闭环发展,发布通用具身基座模型启元大模型和世界模型开源平台 [13][14] 行业发展趋势 - 具身智能行业进入"掐生态位"阶段,大厂侧重数据、平台和模型层布局 [11][14] - 互联网大厂在硬件供应链和快速响应方面存在短板,初创企业在非标硬件领域有机会 [12][14] - 商汤强调研发与商业落地对齐,未来可能涉及机器人小脑、本体等方向 [10] - 网易明确不做工程机械本体,专注提供智能化解决方案 [9][10]
人工智能跨越“炫技”分水岭
北京日报客户端· 2025-07-31 11:30
人形机器人技术进步 - 智元机器人灵犀X2展示人性化交互能力 通过电量不足时的拟人化吐槽体现共情能力 引发观众热烈反响[1] - 商汤科技基于"悟能"平台的人形机器人具备实时多任务处理能力 可同步讲解并响应突发提问 展示对物理世界的深度交互理解[2] - 商汤"绝影开悟"世界模型实现量产 单张A100 GPU日生成数据相当于10台真实车或100台路测车采集量 生产效率显著提升[2] 人工智能技术演进方向 - 行业从参数竞争转向应用深度竞争 重点聚焦AI使用的深度化、实用化及负责任发展[1] - 大模型发展进入物理世界理解阶段 需通过现实世界理解模型与3D深度模型协同提升 实现从认知到行动的跨越[2] - 智能体成为新竞争焦点 大模型作为智能体"大脑中枢" 智能体则为大模型提供"行动肢体" 形成完整行动体系[3] 智能体技术发展与挑战 - 阿里云推出首款智能体专用云端电脑无影Agent-Bay 具备代码运行、网页浏览、视觉理解等综合能力 显著简化开发配置流程[3] - 智能体面临算力瓶颈 本地设备难以支撑高并发GPU运算需求 云端解决方案成为破局关键[3] - 中国信通院界定智能体技术架构 强调大模型作为决策核心的基础地位[3] 大模型可靠性现状 - 顶尖大模型准确率达80%-90% 但距医疗、工业、金融等专业场景要求仍有显著差距[5] - 浙江大学陈纯教授指出可靠性问题本质 认为"幻觉"是智力必然代价 需通过工程化保障框架实现突破而非消除智力特征[5] - 诺贝尔奖得主辛顿警示高级AI可能带来灾难性风险 呼吁全球共享"保持AI良性"研究成果 重点研究如何使超级AI既保持高智能又甘于辅助人类[5]
从“能动”到“能想”再到“有温度”,这些企业让机器人“活过来”|聚焦2025WAIC
华夏时报· 2025-07-30 14:14
行业技术进展 - 2025世界人工智能大会展示3000余项前沿成果和上百款形态各异的机器人 涵盖格斗、舞蹈、长跑、叠衣及售货等多样化功能[1] - 具身智能成为行业焦点 企业通过赋予机器人记忆力、物理感知力、语言能力、行动力与视触觉提升其智能化水平[1] - 华为云CloudRobo平台结合具身多模态生成大模型、规划大模型和执行大模型 提供端到端具身智能解决方案[3] - 商汤发布"悟能"具身智能平台 以具身世界模型为核心引擎 支持机器人感知、视觉导航及多模态交互能力[6] - 复旦大学团队开发自适应视触觉AI传感器 使机器人具备人类级触觉灵巧度 可抓取豆腐、薯片、果冻及汤圆等脆弱物品[7] - 上海构建多层级语料供给体系 上线首个语料运营公共服务统一门户 聚焦具身智能和强推理数据集工程[8] 企业产品创新 - 国家地方共建人形机器人创新中心推出青龙全产品体系 包括185cm/85kg的青龙Pro和145cm/45kg的青龙Lite[2] - 青龙Pro集成五感感知、双臂协同等七大核心分系统 支持多自由度手臂组合和模块快拆快换 感知头集成可见光、红外及气体传感器[2] - 青龙Lite定位低成本开源小人形 具备轻量化开发平台和稳健运动性能 适用于教研与轻量服务场景[2] - 华为云与上海国地中心合作构建虚实融合数据生成流水线 节约90%数据采集成本 加速工业机器人应用进程[3] - 商汤具身世界模型支持多视角时空一致视频生成 可实现虚实融合街道导航及厨房物品抓取等复杂指令响应[6] - 游族网络依托全球十亿用户行为数据构建集成式AI工具平台 覆盖美术资产生成、代码生成、本地化翻译及智能化测试等功能[9] 应用场景拓展 - 华为云与北铁所合作开发高铁动车智能巡检机器人 与中铝打造有色金属行业大模型"坤安"[4] - 华为云与玖天气象通过AI+气象助力新能源发电 与能科科技合作推进AI工业链赋能智能制造[4] - 游戏领域动捕生成的仿生数据可作为具身智能高拟真训练素材 助力动态环境反应逻辑学习[10] - 机器人技术将在医疗、养老、工业生产及日常生活服务等领域发挥重要作用 推动人机协作新时代[10]
从“能动”到“能想”再到“有温度”,这些企业让机器人“活过来”
华夏时报· 2025-07-30 13:45
人工智能与机器人技术发展 - 2025世界人工智能大会(WAIC)展示3000余项前沿成果,上百款机器人展示多样化功能,包括格斗、舞蹈、长跑、叠衣、售货等[1] - 具身智能成为行业热点,机器人从"能动"升级为"能想"和"有温度",具备记忆力、物理感知力、语言能力、行动力与视触觉[1] 上海国地中心机器人技术 - 发布"青龙"全产品体系,包括青龙Pro(185cm/85kg)、青龙Lite(145cm/45kg)等,构建具身智能机器人生态[2] - 青龙Pro集成五感感知、双臂协同等七大核心分系统,支持多自由度手臂组合和模块快拆快换[2] - 青龙Lite定位低成本开源小人形,具有轻量化、稳健运动性能等优势,适用于教研与轻量服务场景[2] 华为云技术支持 - 华为云CloudRobo平台为上海国地中心提供具身智能开发支持,生成仿真数据集使工业机器人应用提速[3] - 华为云与多领域企业合作,包括铁路巡检机器人、有色金属行业大模型、气象AI、工业智能制造等[4] 商汤科技具身智能平台 - 商汤发布"悟能"具身智能平台,以具身世界模型为核心,提供感知、视觉导航及多模态交互能力[6] - 平台支持端侧芯片嵌入,演示机器人能流畅讲解PPT并互动,接近人类助理水平[6] - 具身世界模型可生成多视角视频内容,实现虚实融合体验和自然语言指令执行[6] 机器人感知技术突破 - 复旦大学团队开发"自适应视触觉AI传感器",使机器人具备人类级触觉,能处理豆腐、薯片、果冻等脆弱物品[7] - 传感器具备柔性界面和多维力学探测能力,结合AI算法实现精准交互[7] 语言能力与语料发展 - 上海构建多层次语料供给体系,上线首个语料运营公共服务统一门户,加速AI模型迭代[8] - 游族网络利用全球游戏用户行为数据开发AI工具平台,支持游戏研发全链路工作[9] - 游戏领域的仿生数据可作为具身智能训练素材,政策端加强语料基座建设[10] 行业前景展望 - 机器人技术将在医疗、养老、工业、服务等领域发挥更大作用,开启人机协作新时代[10] - 随着技术成熟和成本降低,智能机器人将逐步进入日常生活[10]