Workflow
icon
搜索文档
重磅分享!VR-Robo:real2sim2real助力真实场景下的机器人导航和运动控制
具身智能之心· 2025-07-08 17:31
点击下方 卡片 ,关注" 具身智能之心 "公众号 >>直播和内容获取转到 → 具身智能之心知识星球 足式机器人的运动控制得益于强化学习与物理仿真的结合, 但其实际应用受限于"仿真与现实差距" , 特别是缺乏真实感视觉渲染阻碍了需RGB感知的高阶任务(如本体感知导航)。 本文提出"真实-仿真- 真实"框架,通过多视角图像进行3D高斯溅射(3DGS)场景重建,构建兼具照片级真实感与物理交互特性 的"数字孪生"仿真环境,实现视觉导航与运动控制的协同学习 。在仿真器中训练强化学习策略执行视 觉目标追踪任务的实验表明, 该方法支持纯RGB输入的仿真到现实策略迁移,并能促进策略在新环境 中的快速适应与高效探索,在家庭和工厂场景中具有应用潜力。 论文标题:VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion 论文链接:https://arxiv.org/abs/2502.01536 项目链接:https://vr-robo.github.io/ ...
百亿机器人独角兽冲刺IPO,细分赛道收入第一
量子位· 2025-07-08 17:11
公司概况 - 镁伽科技是中国收入最高的机器人自主智能体供应商,近期向港交所递交招股书,估值超105亿元 [2] - 公司成立于2016年,专注于机器人技术领域,旨在通过"机器人科学家"解放人力 [3][4] - 创始团队来自电子制造巨头和华为,拥有电子制造基因 [42][45][48] 业务与技术 - 公司产品为自主智能体,能够在没有人类干预下感知环境、决策和执行任务 [5] - 主要聚焦两大应用场景:生命科学领域的智慧实验室和智能制造行业 [6][12] - 核心技术包括感知(微秒级响应)、构思(AI驱动决策)和执行(精准物理操作)三大模块 [15][16][17][18] - 已推出多智能体协同解决方案,可完成更复杂的工作流 [14] 市场表现 - 2022-2024年营业收入分别为4.55亿元、6.63亿元、9.3亿元,复合增长率43% [22] - 智能制造收入占比更高,2022-2024年分别为59.1%、75.7%和68.3% [23][24] - 毛利率从2022年28.1%波动至2024年29%,智能制造场景毛利率持续上升至32.3% [27][30] - 净亏损率从2022年-167%改善至2024年-83.9% [32][33] 客户与行业地位 - 截至2024年底服务超过880家客户,2022年新增客户复购率74%,收入留存率115% [20] - 核心客户包括药明康德和博世,这两家也是战略投资方 [21] - 按智慧实验室收入计,2024年在中国自主智能体供应商中排名第一 [65] - 全球十大供应商中排名第六,市场份额4.4% [67] 研发与资金 - 研发开支占总收入比重从2022年74.7%降至2024年42.4% [37] - 现金及等价物从2022年11.25亿降至2024年4.58亿 [39] - 计划将上市募集资金用于技术研发、产能扩张和销售网络建设 [41] 发展历程 - 创始团队基于劳动力成本上升和机器人替代趋势的判断而创立 [52][53] - 初期定位机器人本体制造商,后转型为解决方案提供商实现快速增长 [59] - 已完成8轮融资累计超27亿元,投资方包括高盛、经纬创投等知名机构 [61][62]
感觉捕手
36氪· 2025-07-08 17:04
人工智能与感知智能 - 当前AI系统擅长语言处理但缺乏对物理世界的理解 语言大模型通过词序列共现概率捕捉语义 但无法理解三维空间[21][22] - 世界模型是AI突破方向 通过多视角感知重建三维场景 预测遮挡与运动轨迹 实现物理推理和交互[23][24][27] - 语言大模型与世界模型互补 前者解析意图 后者执行物理操作 二者结合实现"说得明白+做得到"的完整智能[32][34] 智能的本质与进化 - 生物智能通过演化形成高效解决方案 如狗本能选择最优路径 棒球手使用凝视启发法接球 体现"具身认知"原理[41][44][45] - 预测性大脑理论认为智能是大脑-身体-环境统一体 通过最小化预测误差实现优化 不依赖显式计算[47][48][49] - 感知智能具有整体性、预测性、具身性和进化性特征 是超越符号操作的高级认知形式[52][53] 教育理念与认知发展 - 具身学习强调通过身体活动与环境互动培养理解力 挑战传统抽象知识灌输模式[78][79][80] - Taste是高维认知能力 表现为对事物本质的直觉判断 如杨振宁对物理学的鉴赏力 乔布斯的跨领域洞察[54][56][62] - 人类智能的独特性可能被AI超越 但具身体验形成的Taste仍是当前核心优势[71][74][81] 技术前沿与行业趋势 - 神经辐射场(NeRF)等3D视觉技术使AI具备场景重建能力 推动世界模型发展[27] - 多模态Transformer整合文本与3D潜变量 实现语义与空间控制的统一[32] - 莫拉维克悖论揭示感知运动智能的复杂性 是世界模型需攻克的核心难关[75][76]
美心门荣膺“筑梦品牌”,宋韵新风引爆2025建博会首日
荣耀加冕:"筑梦品牌"实至名归 为了激发居住设计领域的创新活力,"城市筑梦家.设计合伙人计划"项目应运而生,该项目由中国建博会(广州)、KSM卡撒传媒联合发起,旨在汇聚全球优秀 的室内设计师和团队以及品牌、服务商,凝聚极致的室内设计力与选材服务力,推动居住空间的优化与升级,共同为城市的未来发展贡献力量,共筑城市梦 想家园。 (2025年7月8日,广州)今日,备受业界瞩目的2025中国(广州)国际建筑装饰博览会(简称:建博会)在广州盛大启幕。作为门业领域的民族标杆品牌,美心门 以"山水本心宋韵新生"为主题,盛装亮相(展位:B馆.9.2.B1)。开展首日上午,美心门展位即人气爆棚,已接待逾1000组专业观众及合作伙伴,成为展会焦 点。更令人振奋的是,经过层层严选,美心门还荣膺主办方权威颁发的"筑梦品牌"称号,品牌实力与行业贡献再获高度认可。 这一殊荣,是对美心门品牌理念、产品创新力及市场影响力的权威背书。 宋韵新境:山水本心演绎东方美学 本次美心门的展陈设计,正是其品牌理念"山水本心宋韵新生"的具象化表达。步入展区,观众瞬间被带入一幅流动的宋韵山水画卷。黛色与素白的主色调营 造出静谧悠远的意境,展台布局如山峦起伏 ...
金信投教 | 华四附中学子“小小金融家”职场体验圆满收官
搜狐网· 2025-07-08 15:48
公司活动 - 金信期货开展为期三天的"小小金融家"沉浸式职场体验活动,通过企业参访、互动教学、模拟实操等形式提升青少年金融素养 [1] - 首日活动以"认知-启蒙-体验"为主线,涵盖企业发展史讲解、金融与期货本质案例拆解、模拟交易系统实操演练以及经济学视角解读日常生活现象 [3] - 次日活动聚焦职业认知升级,研究员通过角色扮演、案例研讨展示期货研究员的核心能力图谱,包括行业洞察力、产研结合能力和专业分析表达力 [6] - 结业日活动以创意输出和职业对话为主,学生独立完成品种研究报告并进行观点阐述直播,实现从知识输入到能力输出的闭环 [9] 公司价值观 - 金信期货践行"成人达己、专业务实"价值观,将社会责任融入企业基因,通过校企合作、公益科普等形式助力提升国民金融素养 [11][12] - 此次活动不仅普及金融知识,更是对青少年财商教育模式的创新探索,未来公司将持续深耕金融知识普惠领域 [11][12] 行业影响 - 活动通过模拟交易系统实操演练,让学生体验真实的数据更新和收益变动,深度感知期货行业魅力 [3] - 研究员展示期货行业核心能力,包括从海量数据中抽丝剥茧的行业洞察力、服务实体企业的产研结合能力以及专业分析转化为投资策略的表达力 [6]
2025年度10大前沿科学问题、工程技术难题及产业技术问题发布,哪些仪器受热捧?
仪器信息网· 2025-07-08 15:38
导读: 第二十七届中国科协年会主论坛7月6日在北京举行,发布2025年10个前沿科学问题、10个工程技术难题和10个产业技术问题,旨在推动原创性、颠覆性 特别提示 微信机制调整,点击顶部"仪器信息网" → 右上方"…" → 设为 ★ 星标,否则很可能无法看到我们的推送。 第二十七届中国科协年会主论坛7月6日在北京举行。主论坛上,发布了2025重大科学问题、工程技术难题和产业技术问题。 中国科协自2018年开始,持续组织开展重大科技问题难题征集发布活动。2025年活动,从前沿性、引领性、创新性、战略性四个方面严格把 关,经过严谨规范的审读、评议、投票等程序,最终选出10个前沿科学问题、10个工程技术难题和10个产业技术问题,为持续性产出原创 性、颠覆性科技成果树立"风向标"。 十大前沿科学问题 | 01 | 流形的拓扑和几何分类 | | --- | --- | | 02 | 希格斯粒子性质和质量起源 | | 03 | 准金属替代过渡金属用于精准合成与催化反应的可行性研究 | | 04 | 台风路径异常与强度突变 | | 05 | 宏观生态系统空间格局形成机理与系统间相互作用机制 | | 06 | 基于密码学视角 ...
智能自动化实验平台+AI最新发展及实践,全国顶尖学者报告实录
仪器信息网· 2025-07-08 15:38
导读: 2025年6月28-29日,"合成化学研究新范式——机器人融合AI研讨会" 在上海举办,探讨技术赋能 科研新范式。 特别提示 微信机制调整,点击顶部"仪器信息网" → 右上方"…" → 设为 ★ 星标,否则很可能无法看到我们 的推送。 当 下 , 合 成 化 学 领 域 正 经 历 一 场 深 刻 的 范 式 转 型 , 其 研 发 核 心 动 力 加 速 从 传 统 的 " 经 验 驱 动 " 向 " 数 据 驱 动 " 和 " 智 能 驱 动 " 跃 迁 。 引 领 这 一 历 史 性 变 革 的 核 心 引 擎 , 正 是 " 机 器 人 融 合 AI"——即智能自动化实验平台与人工智能技术的深度耦合。 主办方代表马健博士在致辞中呼应了麻院士的洞见。他表示:" 人工智能和机器人自动化技术 正在以前所未有的速度驱动着科学范式的变革 。计算机科学与合成化学的融合正在 重构物质 创造的理论体系和实现路径 ,更推动着该领域实现从经验驱动向数据驱动和智能驱动的历史性 复旦大学麻生明院士致开幕词 值此关键转型节点," 合成化学研究新范式—机器人融合AI研讨会 "于6月28日—29日在沪成 功举办。本次会议由 ...
突破全模态AI理解边界:引入上下文强化学习,赋能全模态模型“意图”推理新高度
量子位· 2025-07-08 15:30
多模态大语言模型技术突破 - 当前多模态推理模型存在两大核心问题:全局上下文理解不足(模型错误解读多模态证据)和捷径问题(忽视关键线索直接给出答案)[2][3][4] - 阿里巴巴通义实验室推出HumanOmniV2解决方案,强调模型需基于全局上下文理解进行推理,避免遗漏多模态线索[4] - 创新性采用强制上下文总结机制,要求模型在推理前先输出对多模态输入的概括,确保全面性[12] 技术架构优化 - 引入三维奖励机制:上下文奖励(评估上下文一致性)、格式奖励、准确性奖励协同作用[13][14] - 通过LLM评估逻辑奖励,激励模型融合反思/演绎/归纳等高级逻辑分析方法[15] - 改进GRPO训练策略:采用令牌级损失解决长序列不平衡、移除问题级归一化项消除优化偏差、动态KL散度提升探索能力[16][19][20] 数据集与基准创新 - 构建全模态推理训练数据集,涵盖图像/视频/音频理解任务,附带多模态输入总结和推理路径[23] - 推出IntentBench评估基准,包含633个视频和2,689个问题,专注测试复杂人类意图理解能力(对比Daily-Omni/WorldSense更侧重社会关系推理)[23] 性能表现 - HumanOmniV2在Daily-Omni达到58.47%、WorldSense 47.1%、IntentBench 69.33%准确率,超越现有开源模型[24] - 在视频-音频多模态任务中,7B版本以58.47%平均准确率显著领先VideoLLaMA2(35.17%)和Qwen2.5-Omni 7B(47.45%)[25] - 在文化/科技等细分领域评估中,7B模型以47.1%平均准确率超越GPT-4o(42.6%)和Claude 3.5 Sonnet(34.8%)[27] 开源与资源 - 完整开源代码/模型/数据,提供GitHub/arXiv/ModelScope/HuggingFace多平台访问入口[29]
多模态模型学会“按需搜索”,少搜30%还更准!字节&NTU新研究优化多模态模型搜索策略
量子位· 2025-07-08 15:30
核心观点 - 字节与南洋理工大学联合开发的MMSearch-R1系统通过强化学习训练多模态模型实现自主按需搜索能力 在知识密集型视觉问答任务中性能超越同规模传统RAG模型 并减少32 9%搜索次数[1][3][21] - 该系统集成图像和文本搜索工具 采用GRPO强化学习算法 通过奖励函数优化搜索行为 构建了搜索需求均衡的FVQA数据集进行训练[11][13][14][15][17] - 实验显示7B参数的MMSearch-R1模型在FVQA-test和InfoSeek等任务中平均准确率比同规模RAG基线高3 同时达到32B模型RAG基线的性能水平[21][22] 研究方法 多模态搜索工具 - 集成Google Lens图像搜索工具 可匹配网页标题和缩略图以识别视觉元素[13] - 文本搜索工具链路由Google Search JINA Reader和语言模型组成 可获取相关网页内容摘要[13] 强化学习训练 - 采用GRPO算法实现多轮对话与搜索的Rollout过程 模型可选择调用搜索工具或直接回答[14] - 奖励函数包含0 9权重的准确性得分和0 1权重的格式得分 对依赖搜索的正确答案施加0 1惩罚因子[15] 数据集构建 - FVQA数据集通过MetaCLIP元数据采样 GPT-4o生成问答对 InfoSeek样本补充等方式构建 包含3400个需搜索样本和1600个无需搜索样本[17][19][20] 实验结果 - 7B模型在减少32 9%搜索次数(SR)情况下 准确率(Acc)达到54 6 超过同规模RAG基线51 6 接近32B模型RAG基线55 1[21][22] - 强化学习相比监督微调能以更少训练样本获得更大性能提升 搜索惩罚机制有效塑造按需搜索行为[24][25] - 模型同时提升RAG工作流性能(左图)和自主回答能力(右图) 显示更强的知识挖掘与结果处理能力[22]
融到D轮的明星独角兽,要IPO了
投中网· 2025-07-08 14:54
公司背景与发展历程 - 镁伽科技由三位拥有通信和自动化背景的创始人黄瑜清、乔志新、张琰于2016年6月在北京创立,初期聚焦生命科学领域智能自动化[7] - 创始人团队曾因资金链紧张多次抵押房产渡过难关,2019年从机器人本体研发转型为解决方案供应商,并重新调整组织架构[7][8] - 公司将总部迁至苏州工业园区和杭州青山湖科技城,以贴近产业链资源,业务范围扩展至生命科学、化工、餐饮、农业、集成电路、新能源等领域[9] 核心技术与产品 - 公司开发智慧实验室自主智能体和智能制造自主智能体,兼容非标实验室环境并支持分子诊断等场景,例如25天内完成核酸检测样机研发并服务数亿检测量[12] - 智能制造自主智能体应用于晶圆缺陷检测等场景,具备高精度量测技术[12] - 2022-2024年累计研发投入超10亿元,截至2024年底拥有450+授权专利和550+专利申请[12] 财务表现与客户 - 收入从2022年4.55亿元增长至2024年9.3亿元,复合年增长率43%,毛利率从24%提升至29%[13] - 服务安捷伦科技、药明康德、金域医学等880+客户,2024年净亏损7.8亿元,但手握15亿元订单及4.5亿元现金[13][14] 融资与估值 - 累计融资超27亿元,投资方包括高盛、药明康德、经纬创投、创新工场等,D轮后估值达105亿元[4][15][18] - 创新工场为第一大外部股东(持股15.07%),持股价值近16亿元[18] - 创始人黄瑜清强调融资策略需确保长期战略执行,避免短期目标干扰[19] 行业定位与认可 - 被经纬创投评价为"国内少有的生命科学自动化专家",药明康德与其合作探索新药研发自动化[17] - 创新工场李开复称其为"AI+Science典范",入选《2025全球独角兽榜》[18]