Workflow
具身多模态大模型
icon
搜索文档
每周十大股权投资:银河通用吞下3亿美元热钱,复杂世界交互进入倒计时;这家公司狂吸谷歌英伟达,程序员高薪饭碗还能端稳几年?
36氪· 2025-12-22 18:46
银河通用机器人 - 公司完成B+轮融资,融资金额高达3亿美元,投资方包括中移创新产业基金、中金资本、苏创投等知名机构 [1] - 融资将用于推进“具身多模态大模型”与通用机器人本体的深度融合,目标是造出真正实用的通用型智能体 [1] - 公司产品核心是一个能理解物理世界、具备通用智能的机器人平台,而非单一功能机器人 [1] - 公司技术涵盖人形机器人、工业机器人等多个前沿领域,是人工智能与机器人交叉领域的明星公司 [1] Momenta - 自动驾驶公司获得东南亚出行巨头Grab的战略投资,投后估值飙升 [2] - 融资将用于强化其“数据驱动的飞轮”技术和全球化布局 [2] - 核心产品是基于海量真实驾驶数据持续自我演进的自动驾驶算法系统 [2] - 获得Grab投资后,其产品将能接入东南亚庞大且独特的出行场景,获取关键数据以加速算法适应全球多样化路况 [2] - 公司通过“量产自动驾驶+完全无人驾驶”双线战略,提供不同级别的自动驾驶解决方案,已在全球多国布局业务 [2] 中盐碱业 - 公司完成战略投资,金额达39.2亿人民币,投资方包括国调基金、山东海化等产业资本 [3] - 融资资金将用于扩大天然碱资源的高效、绿色开采与加工 [3] - 项目产品是食品级、工业级的天然碱,与合成碱相比,其工艺更环保、成本更低 [3] - 融资将直接用于产能扩张,以抢占市场份额,响应下游玻璃、光伏、洗涤剂等行业对高品质、低成本原料的旺盛需求 [3] 工源三仟 - 公司完成B轮融资,融资金额为数亿人民币,投资方包括悦达集团、成都科创投等 [4] - 公司专注于研发基于AI的工业“智能质检员”系统,将传统X射线探伤设备与AI视觉识别结合 [4] - 产品能在线实时检测半导体、精密零部件内部的微观缺陷 [4] - 融资资金将用于迭代算法、拓展应用行业,解决高端制造业对全检、高精度、零漏判质量控制的迫切需求 [4] - 公司是“AI+工业”的典型代表,产品应用于工业在线检测,并致力于服务半导体和3D打印行业 [4] 栈略数据 - 公司完成C+轮融资,投资方为香港创科创投基金,投后估值约36亿人民币 [5][6] - 融资用于完善健康险智能风控与理赔自动化平台 [5] - 核心产品是一个能自动识别医疗票据欺诈、过度医疗等风险的AI系统 [5] - 资金将帮助其深化数据处理能力,为保险公司和医保部门提供更精准的赔付成本控制工具 [6] - 公司是保险科技领域的领先企业,主要为保险公司、医保局等机构提供健康险运营及风控系统解决方案 [6] 中科鸿泰 - 公司获得A轮融资,金额高达数千万元,由金达莱投资 [7] - 公司致力于推进血管介入手术机器人等精准医疗设备的临床与量产 [7] - 产品旨在通过机器人手术系统,实现更稳定、更精细的微创介入操作,减少医生辐射暴露和手术差异 [7] - 融资将推动产品从样机走向市场,切入手术精准化与标准化的蓝海市场 [7] - 公司专注于康复机器人、血管介入手术机器人的自主研发与生产 [7] 微醺24小时小酒馆 (芜湖麟动科技) - 公司完成天使轮融资,投资方未透露 [8] - 公司特点是复制其“无人值守智能社交空间”的商业模式 [8] - 产品是一个融合了智能门禁、自助酒饮、环境管控的实体空间模块 [8] - 天使轮融资将用于验证单店模型,并快速扩张 [8] - 公司探索在传统酒吧与居家场景之外,打造一个满足年轻人私密、灵活、低社交压力需求的新消费场景 [8] - 公司采用“无人值守+智能安防”的轻运营模式,打造全天候开放、自主私密的“城市第三空间” [8] Lovable - 瑞典AI公司完成B轮融资,吸引了科技巨头谷歌和英伟达参投 [9] - 公司通过开发能替代部分初级开发工作的“自主软件工程师”AI [9] - 产品不是一个代码补全工具,而是一个能理解用户自然语言描述,并直接生成、部署完整功能应用的平台 [9] - 谷歌和英伟达的投资意味着巨头看好其能重塑软件开发流程,降低应用构建门槛 [9] - 公司平台由大型多模态模型驱动,允许用户通过描述功能来实时生成生产就绪代码 [9] Cyera - 美国数据安全公司获得战略投资,融资额达4亿美元,投资方为全球顶级投资机构黑石集团 [10] - 融资资金用于推广其“以数据为中心”的主动安全平台 [10] - 产品不是传统的防火墙或加密工具,而是一个能自动发现、分类企业所有数据,并持续评估其安全与合规风险的AI系统 [10] - 黑石的巨额投资是对其在数据爆炸和强监管时代,提供新一代数据资产管理与保护基础设施这一产品定位的肯定 [10] - 公司平台采用以数据为中心的方法,帮助企业了解数据位置和风险暴露情况,并即时修复安全漏洞 [10] Neural Concept - 瑞士软件公司完成C轮融资,金额为1亿美元,投资方包括Alven Capital, HTGF等多家国际风投机构 [11][12] - 公司通过深化其“AI驱动工程设计”软件在复杂制造业的应用 [11] - 产品能让工程师输入设计目标,由AI自动生成并仿真优化数万种几何形状,极大缩短如汽车、航空部件的研发周期 [11] - 融资将用于证明AI可以成为核心研发环节的“性能加速器”,而不仅仅是辅助工具 [12] - 公司是工业软件智能化的重要参与者,其软件主要应用于工业设计、工程仿真等环节,通过AI提升研发效率 [12]
星源智T5域控制器亮相百度大会 赋能智元精灵G2开启机器人新纪元
证券日报网· 2025-11-13 14:11
产品发布与性能 - 星源智公司在百度世界大会2025上展示了自主研发的机器人大小脑域控制器T5 [1] - T5域控制器集超大算力、低功耗与高性能于一体,搭载NVIDIA最新JetsonThor处理器,算力高达2070TFLOPS [1] - 该产品具备大型Transformer模型加速能力,广泛支持深度学习、计算机视觉等先进算法,可满足机器人在实时感知、智能决策与精准控制方面的需求 [1] 商业合作与应用 - 智元机器人与星源智公司已达成深度合作并联合参展 [1] - 搭载T5控制器的新一代工业级交互具身作业机器人智元精灵G2于今年10月份发布,并在展台同步亮相 [1] 公司背景与技术实力 - 星源智机器人公司由北京智源研究院孵化,致力于实现多模态空间智能,构建物理世界的通用具身大脑 [1] - 公司拥有世界领先的具身多模态大模型能力和空间智能能力,打造了内涵极为丰富的具身技术栈 [1] - 技术栈包括物理世界的多模态感知与数字化重建、多模态具身世界模型、机器人本体的运动控制、用于感知规划、决策、导航、操作的各类具身基础大模型、软硬一体的端侧具身系统等 [1]
从近1000篇工作中,看具身智能的技术发展路线!
具身智能之心· 2025-09-05 08:45
机器人操作技术演进 - 机器人操作从机械编程向具身智能演进 从简单夹爪发展到多指灵巧手[5] - 灵巧操作依赖数据采集与技能学习框架 包括模拟 人类演示和遥操作三种数据采集方式以及模仿学习与强化学习两种学习框架[5] - 面临三大关键挑战 涉及复杂被操作对象和多样操作类型[5][8] - 核心技术方向包括灵巧操作 多指手 人工智能赋能机器人 数据采集 模仿学习和强化学习[6] 具身导航与物理模拟器 - 导航与操作是具身智能核心能力 现实训练存在高成本问题 Sim-to-Real迁移受域差距制约[9] - 物理模拟器分为室内型 室外型和通用型 包括Habitat AI2-THOR CARLA AirSim ThreeDWorld和Isaac Sim等[14][15] - 导航从显式记忆转向隐式记忆 操作从强化学习拓展至模仿学习 扩散策略及VLA模型[15] - 操作任务按复杂程度和自由度递增 硬件演进涵盖多种类型[13] 具身多模态大模型发展 - 具身多模态大模型可弥合感知 认知与动作鸿沟 基础构成包括具身智能体 大语言模型 大视觉模型和视觉语言模型等[16][19] - 核心任务涵盖具身感知 导航 交互和仿真 感知分GPT与非GPT模型 导航分通用与专用模型 交互分短长视域动作策略[19] - 数据集包括Open X-Embodiment和HM3D等 面临跨模态对齐难 计算资源消耗大 领域泛化性弱等技术挑战[19] 具身仿真与研究任务 - 具身AI模拟器存在真实感 可扩展性和交互性问题 研究任务面临长轨迹记忆设计等多重挑战[20][24] - 视觉探索通过运动或感知构建环境内部模型 方法分好奇心驱动 覆盖最大化和重建驱动 核心数据集为Matterport3D和Gibson V1[24] - 视觉导航含点导航 物体导航 带先验导航和视觉语言导航 评估指标以成功率和路径长度加权成功率为主[24] 强化学习在视觉领域应用 - 强化学习在大语言模型中成效显著 近年拓展至视觉多模态领域 面临高维视觉输入等挑战[25] - 基础理论涵盖RLHF DPO和RLVR三大对齐范式 以及PPO和GRPO两种策略优化算法[26] - 核心研究方向包括多模态大语言模型 视觉生成 统一模型和视觉语言动作模型[28] 遥操作与人形机器人 - 人形机器人遥操作可结合人类认知与机器人物理能力 适配人类环境与危险场景如核救援和空间探索[29] - 系统架构含人类状态测量 运动重定向 机器人控制和多模态反馈 支持单向或双向遥操作[32] - 应用包括远程存在和危险作业等 挑战集中在非专家操作门槛 动态环境适应和长延迟稳定性[35] 视觉语言动作模型进展 - VLA模型从跨模态学习架构演化至融合视觉语言模型和动作规划器的通用智能体 涵盖80多个近三年发布的模型[33] - 按架构范式分类 提出基于任务复杂度 模态多样性和数据集规模的新型评估标准 涉及102个VLA模型和26个基础数据集[36] - 发展历程分萌芽 探索和快速发展三阶段 从模型架构 训练数据 预训练方法 后训练方法和模型评估五个维度剖析现状[38] - 横向整合VLA建模实践 提出单体模型与分层模型的分类体系 探索强化学习融合等前沿方向[41]
申万宏源银河通用投资项目突破融资新纪录
公司融资与业务进展 - 北京银河通用机器人有限公司完成新一轮11亿元融资 刷新具身大模型机器人领域单笔和累计融资双纪录 [1] - 本轮融资由宁德时代及溥泉资本领投 吸引国资投资平台、战略产业方及国际机构参与 累计融资规模超24亿元 [1] - 公司2023年5月成立后快速获得市场化机构、产业资本、科研基金及国资平台认可 [1] 技术研发与商业化落地 - 专注具身多模态大模型通用机器人研发 2024年申万宏源投资后业务加速发展 [1] - 推出全球首个人形机器人智慧药房解决方案Galbot 实现药品全流程自动化 已获100家门店订单 [1] - 工业领域与国际知名车企合作 执行天窗玻璃搬运、料箱拆垛等任务 完全基于视觉引导无需二维码 [1] 战略投资方向 - 申万宏源集团加大"投早、投小、投硬科技"力度 以长期股权资金支持科技创新企业 [2] - 未来将围绕新质生产力发展 加强战略新兴产业和未来产业投资布局 [2]