具身智能

搜索文档
大话一下!具身里面视觉语言导航和目标导航有什么区别?
具身智能之心· 2025-08-01 18:30
点击下方 卡片 ,关注" 具身智能 之心 "公众号 说到机器人导航,技术路线已经逐渐从早期传统的建图定位导航,到后期基于大模型方案的导航演变。而 基于大模型方案的导航又分为视觉语言导航和目标导航! VLN更进⼀步,是目标导航任务(Object Navigation),目标导航要求智能体在陌生的三维环境中,仅凭目 标描述(如坐标、图片、自然语言)等,即可自主完成环境探索与路径规划。 如果说一句话说明这两个任务的区别,视觉语言导航是""听懂指令走对路",目标导航是""看懂世界自己找 路"。 视觉语言导航是什么? 视觉语言导航本质上是个指令跟随的任务。任务囊括了三个方面,理解语⾔指令、感知周围环境,规划运 动策略。一般来说,VLN机器人系统主要由视觉语言编码器,环境历史信息表征,以及动作策略三个模块 构成。 机器人从环境中获取语⾔指令和每⼀步的视觉观测,首先需要同时视觉语⾔编码器从中压缩出有效信息。 采用怎样的编码器,视觉和语言的表征是否应该投影到⼀个共同的表征空间,是否应该首先对语言指令在 指令级别的拆分然后在压缩是其中的关键问题。这其中,采用在大规模数据集上预训练的视觉语⾔模型, 利用LLM做指令拆解和任务拆分 ...
腾讯、京东的机器人战略:不造机器人,搭平台
36氪· 2025-08-01 16:22
行业趋势 - 具身智能成为世界人工智能大会(WAIC)的热门焦点,参展机器人数量从去年的18款增长至今年的90余款[1] - 美国明星具身公司Physical Intelligence联创和"伯克利四子"等顶尖人才齐聚WAIC,显示行业热度[1] - 大模型带动云上AI算力井喷式增长,具身智能成为云计算厂商和互联网巨头争夺的新增量市场[5] - 机器人赛道处于爆发前夜,做产业链"卖水人"(提供模型、算力等基础设施)比直接造机器人商业化更快[5] 腾讯战略 - 腾讯Robotics X实验室负责人张正友宣布要成为机器人厂商的合作伙伴,但不直接造机器人[1][4] - 腾讯发布Tairos具身智能开放平台(中文名"钛螺丝"),提供模型算法和云服务两部分能力[13] - Tairos平台的"SLAP3"体系包含三类大模型:规划大模型(右脑)、感知大模型(左脑)、感知行动联合大模型(小脑)[13][14] - 平台提供模块化服务,厂商可根据需求选择特定模块,不强制使用端到端方案[18] - 腾讯强调平台中立性,目标不是赚钱而是推动行业发展[18] 京东战略 - 京东在WAIC前后三个月连续五次官宣领投具身智能公司,要求被投企业在宣传中突出"京东投资"[3] - 京东发布AI业务品牌"JoyAI"和JoyInside平台,提出"附身智能"概念,专注提升人机交互能力[7][8] - JoyInside平台整合RAG、TTS、ASR、LLM等多模态能力,并提供主动对话、情绪检测等功能模块[8][9] - 平台已落地到十几家机器人厂商,如AI潮玩Fuzozo芙崽成为爆品[10] - 京东为机器人厂商提供渠道支持,"618"期间智能机器人自营销售额同比增长3倍,具身智能机器人增长17倍[12] 商业模式 - 两家巨头短期内都不直接造机器人,而是充当软件平台角色,整合技术储备[4] - 通过提供模型、算力等基础设施切入市场,满足机器人厂商的共性需求[4][5] - 京东同时利用电商渠道优势为合作伙伴提供销售支持[12] - 腾讯通过战投方式与机器人公司合作,但不直接参与投资决策[17]
无人叉车带来叉车行业的新增量
新财富· 2025-08-01 16:05
本文约 3 7 0 0 字,推荐阅读时长 1 0 分钟,欢迎关注新财富公众号。 应用场景为先,无人叉车基础深厚 2025年机器人领域逐渐走出了"一纵一横"两条路线,纵深路线是头部人形机器人厂商在通用人形机器人方面不断发力,特斯拉、Figure、优必选等厂商 都将人形机器人部署在工业场景,最终目标是人形机器人能够满足工业端、消费端全场景需求。而横向路线是在具体应用场景上重点发力,针对适配的 场景运用现有的技术,实现智能化,机器代人,提高效率,比如今年在物流、纺织、环卫等领域催生出了很多解决方案。 在物流领域,今年以来具身智能应用的案例很多,亚马逊已在全网络部署100万台机器人,由生成式AI模型 "DeepFleet"驱动,可优化路径规划,缩短 10%移动时间。新推Vulcan机器人能智能拣选散装物品,配备力反馈传感器和AI触觉系统,可精准操作75%仓库货物,速度堪比人工,实现高效自动化 补货。6月8日,Figure AI发布了Helix机器人60分钟无剪辑物流分拣视频,声称仅仅三个月的物流环境部署后,Helix的操作速度和灵活性已开始接近人 类水平。亚马逊的Vulcan和Figure主要是对于不同物品的适用性强 ...
智元机器人获LG电子、韩国未来资产集团联合领投
新浪科技· 2025-08-01 15:49
责任编辑:刘万里 SF014 新浪科技讯 8月1日下午消息,新浪科技获悉,智元机器人新获国际集团战略入股,本次投资由LG电子 (LG Electronics)、韩国未来资产集团(Mirae Asset)联合领投。根据公开信息,这是LG电子在具身 智能领域全球首次对外布局。(文猛) ...
长盈精密(300115.SZ):目前为具身智能系统提供“小脑”和身体部分
格隆汇· 2025-08-01 15:13
格隆汇8月1日丨长盈精密(300115.SZ)在互动平台表示,公司目前为具身智能系统提供"小脑"和身体部 分:"小脑"部分负责运动控制和动作生成、主要通过运动控制算法、反馈控制系统来实现。身体部分负 责动作执行,包括机器人机械结构、传感器、执行器等。公司提供的小脑和身体部分交付给客户,接入 客户的"大脑"部分(负责感知、理解和规划,主要通过大语言模型、视觉语言模型来驱动),形成完整 的具身智能系统。目前公司已与国内外多家人形机器人头部品牌建立合作,并已有订单进入量产。随着 AI及高速通讯技术的快速发展,公司看好该方向未来的发展,并将积极跟进客户和市场需求,为公司 的发展提供新的增长支撑。 ...
智源研究院具身智能大模型研究员岗位开放了 ,社招、校招、实习都可!
自动驾驶之心· 2025-08-01 15:05
欢迎投递简历到pwwang@baai.ac.cn 更多内容欢迎加入我们的求职星球了解,一个转为自动驾驶、机器人和大模型求职打造的社区。 1. 负责具身智能大模型(VLA大模型或者分层架构)的研究和开发。 2. 设计,优化模型架构,完成对模型的数据处理,训练与真机部署工作。 3. 深入调研具身智能领域相关的前沿技术,跟踪业内大模型领域的最新进展并推进相关研究,探寻将最新 技术应用到具身智能领域的可能性。 智源研究院招募具身智能大模型研究员岗位了 ,开放了社招、校招、实习等形式,都可以!!! 岗位职责 职位要求 简历投递 1. 计算机科学、人工智能、机器人、自动化、数学等相关领域的硕士及以上学历; 2. 精通 Python,具有良好的深度学习基础,熟悉 TensorFlow、PyTorch 等深度学习框架; 3. 具备大模型领域的研究经验,对主流视觉与语言大模型有深入理解,具备预训练、微调、部署等流程的 工作经验; 4. 具备机器人控制经验,对主流具身模型训练以及部署有良好的经验优先 5. 具备优秀的学习能力,英语水平,动手能力以及良好的团队沟通与协作能力; 有相关机器人、自然语 言处理以及计算机视觉顶会论文(R ...
不差钱的大模型公司才敢IPO
投中网· 2025-08-01 14:38
以下文章来源于东四十条资本 ,作者张雪 东四十条资本 . 聚焦股权投资行业人物、事件、数据、研究、政策解读,提供专业视角和深度洞见 | 创投圈有趣的灵魂 将投中网设为"星标⭐",第一时间收获最新推送 作者丨 张雪 来源丨 东四十条资本 相较于具身智能,大模型"上市第一股"的战火没那么显眼。 争夺"大模型第一股"。 说来有些落寞,两年前,大模型公司还在金字塔尖上,资本和舆论镜像竞相追捧。一年前,业内关注的焦点就从"谁能获得破 纪录融资"转到了"谁的联创在出走,谁的业务在收缩"上。而DeepSeek爆火后,大模型创业公司热度进一步下滑,如今就连 DeepSeek R2的发布进度也一再落后于市场预期。到如今二级市场IPO开闸,大模型谁先IPO好像也没那么重要了。 但实际上,大模型创业公司依旧在迅猛发展,"大模型第一股"的争夺可能潜藏着暗流,争夺远比想象中激烈。7月28日,一位 投资人在WAIC(世界人工智能大会)上表示,MiniMax有可能成为中国基础大模型公司上市第一股。 这并不是MiniMax近期唯一的重磅消息。 同样在WAIC期间,MiniMax创始人闫俊杰紧随图灵奖得主Geoffrey Hinton之后,成 ...
寻找行业风向标:投中榜·2025投资人榜单、有限合伙人榜单和国有资本榜单评选启动
投中网· 2025-08-01 14:38
将投中网设为"星标⭐",第一时间收获最新推送 来源丨 投中网 2025年,一级市场回暖了吗?答案是肯定的。 01.退出端:IPO大船要开了,"从缺"两年的最佳投资回报投资人花落谁家? 2025年上半年有73家获得VC/PE投资的企业成功IPO,这一数据与去年同期相比,增长了 32.73%。而这73家公司为VC/PE机构提供了1058亿元的账面回报,同比大涨了54.68%。 其中4月在纳斯达克上市的霸王茶姬,为早期投资者创造了逾百倍回报;6月在科创板挂牌的影石创 新,以当天的收盘价计,带给早期投资人的回报率也突破了800倍。这些经典案例无疑给市场打了一 剂强心针。而且接下来我们还将迎接摩尔线程、沐曦集成、宇树科技等一批明星项目的上市,正如前 几天投中网的文章所写"IPO的大船要开了"。 我们也希望"从缺"两年的投中榜最佳投资回报投资人 能有所归属。 02.投资端:市场信心修复与资本活跃度不断提升 今年上半年,VC/PE市场投资数量5074起,同比上升28%;市场交易规模共计5748亿元,同比上 升18%。数据虽然并未恢复至2016年的峰值水平,但已经接近三年来最高点。这无疑反映了市场信 心修复与资本活跃度的提升 ...
创业大街,又热闹起来了
投中网· 2025-08-01 14:38
将投中网设为"星标⭐",第一时间收获最新推送 "你看今天的中关村,好像互联网爆发的那几年。" 作者丨 刘燕秋 来源丨 投中网 最近听说了两则消息:一是,每个月大概有两万名外地招商人员活跃在海淀400多平方公里的土地上。二是,王兴兴当初之所 以决定再来海淀开一间分公司,是因为他想找一个离某海淀机器人独角兽更近的地方。 两个传说,指向同一个事实,人人都盯着海淀的企业。招商人员盯上的是成熟的项目,顶级独角兽创始人盯着的,是海淀最具 实力的竞争对手。归根结底,大家的目光离不开海淀,因为这里是科技创新的源头。从1992年北大科技园播下种子,到1994 年清华科技园扎根生长,再到2000年后东升大厦、中关村智造大街等相继崛起……三十余年来,高校实验室、企业研发中心 和五道口的咖啡馆密集交织,沉淀出了海淀厚重的创新生态。 "产学研用"的深度融合让海淀不仅诞生众多独角兽,更持续孕育着颠覆行业的源头技术。曾经,王兴、宿华、程一笑……众多 互联网巨头在这里萌芽、壮大。如今,智谱、月之暗面、面壁智能、银河通用等一批AI独角兽成为海淀的新名片。智谱华章地 处中关村东路,DeepSeek北京总部在融科资讯中心,月之暗面总部位于知春路的 ...
买故事不如买订单,人形机器人赛道进入Alpha阶段,谁能先跑出商业闭环?
格隆汇APP· 2025-08-01 13:27
作者 | 科技那些事儿 数据支持 | 勾股大数 据(www.gogudata.com) 7 月 26 日, 2025 世界人工智能大会( WAIC )在上海拉开帷幕,资本市场也再度迎来了 AI+ 机器人概念的火热。 回望整个上半年,机器人概念行情火爆,特别是宇树科技的 H1 人形机器人亮相央视春晚,把"人形机器人"推至风口。而在经历 2 、 3 月份 的狂飙后,市场情绪逐步回归理性,而后续伴随特斯拉 Optimus 进度不及预期等消息扰动,板块迎来回调。 如今进入下半年 , 板块情绪底的出现, "难有大的下跌基础"业已成为市场共识,风险偏好修复之下,叠加一系列商业化利好密集落地,有望 对板块后续表现形成强有力的催化。 如果将 2025 年的 AI 、器人赛道比作一场从"实验室"走向"生产线"的接力赛,显然一场从"讲故事"到"交作业"的硬核淘汰赛已经拉开。对投 资者而言,上半年是" Beta 行情",买赛道即可,下半年则是" Alpha 厮杀",只有能把概念兑现为真实现金流的公司才能享受到市场真金白 银的青睐,获得估值溢价的机会。 当故事讲到 " 兑现 " 这一集,镜头自然要聚焦到 行业中 能拿出合同、跑出产能 ...