Workflow
具身AI
icon
搜索文档
李飞飞站队LeCun,AGI全是炒作,80分钟重磅爆料出炉
36氪· 2025-11-17 17:52
【导读】世界模型,着实有点火!今天,李飞飞重磅访谈放出,从AI革命兴起到下一个智能前沿——具备空间智能的世界模型。一场访谈,可以窥见AI 教母关于AI未来的深刻洞察。 二十年前,李飞飞主导创建的ImageNet,像一束火种,彻底点燃了深度学习的革命。 如今,AI热潮席卷全球,她坚信「世界模型」才是未来十年AI的下一个前沿。 就在今天,李飞飞在Lenny Rachitsky的新一期播客中,回顾了AI从寒冬如何走到了今天这一步。 全程1小时20分钟访谈中,李飞飞还谈了自己对AI未来影响人类的看法,以及当前技术能走多远,为何对「世界模型」如此着迷,以及「世界模型」究竟 是什么.... 在这场深度访谈中,李飞飞搭建了一座通往未来的阶梯,让我们得以一窥AI的下一个十年。 有趣的是,她揭秘了鲜为人知的AI发展的秘辛—— 大概在九到十年前,自称AI公司的无异于「商业自杀」,因为没有人相信AI真正能用。 谁能想到,现如今每家公司都在争相自称是「AI公司」。 · 人工智能没有任何是「人为」的,无论AI现在/将来做什么,都取决于人类自身。 · 大数据+神经网络+GPU构成了现代AI的「黄金三件套」。 · 不仅仅是机器人,人类也是 ...
大摩:市场低估了xAI对特斯拉的意义,FSD 14.3或将成为自动驾驶的“蒸汽机时刻”
华尔街见闻· 2025-11-11 13:59
当全市场的目光集中在马斯克的天价薪酬上,大摩指出市场忽略了特斯拉股东大会的战略要点。 据追风交易台,摩根士丹利分析师Adam Jonas在最新的报告中表示,股东们批准马斯克惊人的薪酬方案早已是意料之中,但这只是噪音。报告的真正价值在 于,它揭示了几个被市场忽视、却将在未来6-12个月内深刻影响股价的关键信号。 摩根士丹利认为,特斯拉与xAI的关系、全自动驾驶(FSD)的突破性进展、芯片垂直整合战略、分布式推理云网络、太空AI卫星,以及Cybercab的革命性生产方 式,都将重塑特斯拉的长期价值。这些战略布局远超传统汽车制造商的范畴,指向一个由AI驱动的"马斯克经济体"(Muskonomy)。 大摩认为,两家公司在数据、软硬件和制造上形成递归循环,其价值体系更源于同一位创造者。这种深度绑定对特斯拉物理AI和自动驾驶的未来成败起着决定 性作用。 同时,为支撑数以十亿计的机器人(汽车、人形机器人等)宏大计划, 马斯克暗示特斯拉可能亲自下场建造"巨型芯片工厂",以确保这个"机器人大脑"最宝贵 资源的供应与创新。 机器人最重要的部分是推理大脑,特斯拉希望在推理芯片制造方面实现一定程度的垂直整合。 股东大会上,马斯克对于 ...
大摩:市场低估了xAI对特斯拉的意义,FSD 14.3或将成为自动驾驶的“蒸汽机时刻”
华尔街见闻· 2025-11-11 10:48
核心观点 - 摩根士丹利认为市场过度关注马斯克薪酬方案而忽略了特斯拉股东大会揭示的多个关键战略信号 这些AI驱动的战略布局将重塑公司长期价值 指向一个超越传统汽车制造的"马斯克经济体" [1] 战略要点:AI与生态系统 - 特斯拉与xAI存在唇亡齿寒的共生关系 在数据、软硬件和制造上形成递归循环 对特斯拉物理AI和自动驾驶的未来成败具有决定性作用 [4] - 为支撑数十亿规模的机器人计划 特斯拉可能自建巨型芯片工厂 以实现推理芯片制造的垂直整合 [4] - 马斯克提出构建庞大的分布式推理云网络 计划向车主支付每月100或200美元以利用闲置车辆算力 该网络在美国潜力超3亿个等效英伟达Blackwell GPU 全球潜力达12亿个 未来15年可能增至20亿个 [5] 技术突破:自动驾驶与生产制造 - FSD V14.3实现将驾驶责任从人类转移给纯视觉算法 被视为交通领域的"蒸汽机时刻"和历史性技术突破点 [4][5] - Cybercab目标生产节拍为每10秒一辆 远超传统汽车制造业60-90秒的节拍 通过无盒式生产线、极简设计、免喷涂工艺和卡扣式车身面板等颠覆性创新实现 [6] 未来蓝图:太空计算与协同 - 马斯克提及"太阳能AI卫星" 暗示特斯拉与SpaceX在太空计算领域的战略协同 外太空2.7开尔文的低温环境为数据中心提供显著散热优势 [6] 投资评级与目标 - 摩根士丹利维持特斯拉增持评级 目标价410美元 隔夜股价收于445.23美元 牛市情景下目标价高达800美元 [3]
阿里下场,通义千问牵头组建机器人AI团队
选股宝· 2025-10-09 08:14
公司战略动向 - 阿里巴巴集团已成立内部“机器人和具身AI小组” 标志着公司从AI软件向硬件应用领域的战略延伸 [1] - 阿里巴巴通过阿里云领投了深圳机器人初创公司自变量机器人1.4亿美元的A+轮融资 这是阿里云首次布局具身智能领域 [4] - 阿里巴巴计划在未来三年为云和AI硬件基础设施投入3800亿元 并计划追加投入 以保持与全球AI投资总额加速增长到4万亿美元的同步趋势 [1] 技术发展与愿景 - 多模态基础模型正被转化为基础智能体 可以利用工具和记忆通过强化学习执行长时序推理 这些应用理应从虚拟世界迈向现实世界 [2] - 自变量机器人采取软件和算法优先的路线 发布了开源具身智能基础模型“Wall-OSS”及Quanta X2机器人 该机器人配备能感知细微压力变化的机械手 [5] - 阿里巴巴的技术负责人林俊旸参与开发了可处理声音、图像及文本输入的多模态模型 公司正寻求将大模型优势向机器人等实体产品延伸 [3] 行业竞争格局 - 全球科技巨头纷纷布局机器人领域 日本软银集团宣布以54亿美元现金收购ABB的工业机器人业务 以强化其在“物理AI”领域的布局 [1][6] - 英伟达CEO黄仁勋表示AI和机器人是公司的两大技术机遇 将带来“数万亿美元”的长期增长机会 并预测自动驾驶汽车将成为机器人技术的首个主要商业应用领域 [6] - 风投资本大举涌入人形机器人赛道 花旗预计到2050年全球机器人市场规模将达到7万亿美元 [6] 被投公司概况 - 自变量机器人成立不到两年已完成八轮融资 累计融资额达到约2.8亿美元 [4] - 自变量机器人的人形机器人Quanta X2售价为8万美元 目前已向学校、酒店和养老院等机构销售产品实现收入 并计划于明年开始筹备IPO [5] - 自变量机器人预计“机器人管家”将在五年内成为现实 但承认用于机器人的AI技术仍落后于聊天或代码生成等领域 [5]
阿里巴巴通义千问技术负责人组建内部机器人AI团队
新浪财经· 2025-10-08 23:57
公司战略与组织架构 - 阿里巴巴已成立隶属于通义千问的"机器人和具身AI小组" [1] - 该团队由公司高管、通义千问技术负责人林俊旸领导 [1] 技术研发方向 - 团队专注于将多模态模型转化为能够执行长时序推理任务的基础智能体 [1] - 林俊旸参与了可处理声音、图像及文本输入的多模态模型研发 [1] - 公司认为相关应用"理应从虚拟世界迈向现实世界" [1]
具身AI开启4020亿美元市场机遇!瑞银详解“Beyond AI”投资策略
智通财经网· 2025-09-29 16:28
文章核心观点 - 人工智能正在推动自主系统(如类人机器人、高级驾驶辅助系统、机器人出租车)的飞跃发展,并改变航空航天、农业、智能眼镜和医疗等传统产业 [1] - 视觉-语言-动作模型的出现是机器人和高级驾驶辅助系统的变革性转折点,使系统能将感官输入和语言指令直接转化为动作 [1][17] - 人口老龄化、劳动力萎缩及制造业回流趋势加速了对具身人工智能解决方案的快速采用需求 [1] - 由具身人工智能垂直产业推动的整体市场机会规模预计达到4020亿美元 [1][2] 市场机遇与预测 - 类人机器人与自动化的总目标市场在十年内预计达到4020亿美元,年复合增长率为11% [2] - 到2035年,全球类人机器人总目标市场达400亿美元,全球自动化硬件总目标市场达1000亿美元 [2] - 到2035年,私人汽车高级驾驶辅助系统收入池将达880亿美元,机器人出租车总目标市场为400亿美元 [2][6] - 农业科技、机器人手术、电动垂直起降飞行器和智能眼镜等其他人工智能驱动产业预计年复合增长率达23%,2035年总目标市场达1340亿美元 [2] - 到2035年,电动垂直起降飞行器全球市场预计达230亿美元 [16] - 到2035年,智能眼镜市场规模预计达600亿美元,用户数量将达到3.2亿 [12] 细分领域发展动态 - 人工智能进步速度约每七个月翻一番,引发跨行业的“AI in motion”趋势 [2] - 中国电动车渗透率达50%,推动L2+智能驾驶渗透率从2021年的24%升至2023年的52% [6] - 全球类人机器人数量到2035年将超过200万台,到2050年将超3亿台,对应总目标市场分别为400亿美元和1.4-1.7万亿美元 [7] - 2024年新医疗机器人出货6200台,同比增长36% [14] - 智能眼镜平均售价降至约400美元,比2013年下降70%,2025年市场规模预计为10亿美元 [12] 技术与供应链融合 - 自主系统垂直产业共享重叠的软硬件供应链、对训练和数据收集的依赖,以及需要演进监管框架的特征 [5] - 视觉-语言-动作技术应用于高级驾驶辅助系统和类人机器人,推动对高性能芯片、电源管理芯片、运动控制芯片、通信IC和激光雷达的需求 [8] - 80%的机器人关节部件由汽车零部件公司生产,汽车与类人机器人硬件供应链高度重叠 [8] - 每台高端类人机器人所需半导体价值约1400美元,半导体是计算强度提升的最大受益者 [9] - 到2050年需将粮食产量提升60%以养活约100亿人,预计将出现14亿吨粮食缺口,相当于全球需求的23% [13] 投资布局与主题组合 - 建议投资者广泛布局具身人工智能垂直产业,包括类人机器人、高级驾驶辅助系统、机器人出租车、工业自动化、农业科技、智能眼镜、机器人手术和无人机等细分领域 [19] - 类人机器人生态涵盖芯片商、软件开发商、零部件制造商、整机厂、汽车公司、高级驾驶辅助系统开发者、电池厂商和终端用户 [19] - 主题组合包括38只股票,如阿里巴巴、禾赛科技、Autodesk、艾默生电气、霍尼韦尔、罗克韦尔自动化、直觉外科公司、强生、史赛克等 [19] - 该主题组合预计明年营收与利润将重新加速增长,实现连续两年盈利提速 [20]
“人形态”机器人遭遇梦醒时分? iRobot创始人预言:最终的机器人赢家或许“不像人类”
智通财经· 2025-09-29 12:21
核心观点 - iRobot联合创始人罗德尼·布鲁克斯质疑人形机器人的商业化可行性 认为当前技术无法复刻人类灵巧操作和高效行走能力 大量投资可能面临损失 未来成功机器人形态将采用轮子、多臂和专用传感器而非人形设计 [1][2][4][5] 技术挑战 - 人类手部拥有约17,000个触觉感受器 空间细节敏感度精细至单条指纹脊线尺度 当前人形机器人无法匹配这种灵巧度 [1][4] - 现有人形机器人依赖高增益控制维持直立 需持续注入能量 耗能高且易失稳跌倒 对人类近身工作场景构成安全风险 [2][4] - 人类行走利用弹性弹簧系统和被动动力学回收能量 而机器人难以复制这种高效运动方式 [2][4] 投资风险 - 数十亿美元资金正投入人形机器人领域 但该形态大概率无法实现大规模量产 可能造成投入产出的严重错配 [2][4][5] - 大量资本耗费在尝试提升现有人形机器人性能 但这些投资可能最终被市场快速遗忘 [3][4] 未来发展方向 - 成功机器人将配备车轮、多个手臂和专业传感器 通过专用形态匹配任务需求与安全成本 而非强行复刻人类外形 [2][4][5] - 行业需聚焦特定任务导向的非人形设计 重点发展高端传感、触觉材料、力控与规划软件等底层能力 [4][6] - 机器人发展将从"炫技视频"转向可靠性和经济性指标 包括平均故障间隔时间(MTBF)、跌倒安全性和场景覆盖能力 [6] 行业前景 - 机器人仍是全球高景气赛道 英伟达CEO黄仁勋认为机器人技术和具身AI是数万亿美元规模的最大增长市场 [7][8] - 英伟达聚焦具身AI算力平台供应 通过云端训练、边缘推理和物理仿真工具三线协同 为全行业提供AI GPU集群和开发平台 [8] - 公司预测未来将出现数十亿台机器人和数亿辆全自动驾驶汽车 其软硬件生态技术将驱动超级机器人工厂发展 [8]
人形态”机器人遭遇梦醒时分? iRobot创始人预言:最终的机器人赢家或许“不像人类
智通财经· 2025-09-29 12:20
人形机器人技术挑战 - 人形机器人难以在数年内实现人类高效率工作能力 是纯粹幻想[1] - 人类手部拥有约17,000个专业触觉感受器 当前机器人技术无法匹配这种精细触觉灵敏度[1][4] - 现有机器人缺乏高保真触觉训练数据和触觉与分层任务规划耦合的算法路径[4] 运动控制系统缺陷 - 现有人形机器人依赖高增益控制和持续能量输入维持直立 耗能高且易失稳重摔[2] - 人类行走利用弹性弹簧系统和被动动力学回收能量 而机器人难以复制这种非线性优势[2][4] - 全尺寸人形机器人保持直立需注入巨大能量 跌倒时对近身工作场景构成安全风险[2][4] 未来机器人形态演进 - 成功机器人将配备车轮/多臂/专业传感器 形态不再酷似人类[1][2][5] - 15年后规模落地机器人将采用轮式底盘 多臂结构和非人类频段主动光传感[5] - 行业更可能发展特定任务导向的非人形形态 配备高端传感/触觉材料/力控软件[6] 投资与产业化错配 - 数十亿美元资金正投入难以量产的人形机器人形态[2][4] - 当前对通用人形机器人的押注可能导致投入产出大规模错配[5] - 大量投资资金将消失 现有人形机器人可能被市场快速遗忘[1][3] 产业生态与发展前景 - 机器人产业仍是全球高景气赛道 长期前景被结构性看好[7] - 英伟达将机器人技术视为最大规模增长市场 总体规模达数万亿美元[7] - 英伟达聚焦具身AI算力平台供应 通过GPU集群/边缘计算/仿真工具链服务全行业[8] - Isaac/Omniverse平台有望成为机器人工业标配 带来高粘性经常性营收[8]
基于移动设备采集的3DGS实现个性化Real-to-Sim-to-Real导航
具身智能之心· 2025-09-25 08:04
研究背景与核心问题 - 具身AI(如导航机器人)的训练高度依赖仿真环境,但面临保真度与成本的矛盾,导致仿真中表现优异的策略在真实机器人上难以落地,即sim-to-real迁移难题 [2] 现有技术潜力与局限 - 3D高斯Splatting技术能从普通设备捕获的图像生成高保真3D表征,渲染速度快,但此前相关研究如SplatNav和GaussNav存在局限,未针对室内图像目标导航实现端到端策略训练和真实机器人评估 [3] - 全合成环境(如HSSD)缺乏真实世界细节,导致策略在真实场景性能骤降;高保真真实场景重建(如HM3D、Matterport3D)依赖昂贵专业设备,流程繁琐,无法覆盖多样化部署环境 [6] - 本研究是首个针对室内图像目标导航,实现端到端策略训练、真实机器人评估及明确sim-to-real迁移的基于3D高斯Splatting的方案 [3] 核心方法:EmbodiedSplat的四阶段流程 - 研究设计了从真实场景捕获到机器人部署的完整流程,核心是通过手机低成本捕获结合3D高斯Splatting高保真重建,构建与真实环境对齐的仿真训练场景,实现策略个性化微调与高效sim-to-real迁移 [4] - 阶段1场景捕获使用iPhone 13 Pro Max和Polycam应用记录RGB-D数据,单一场景捕获仅需20-30分钟,无需云台等额外设备 [11] - 阶段2网格重建采用DN-Splatter实现3D高斯训练与网格生成,通过深度正则化(λd=0.2)和法向量正则化维持几何一致性,GS训练迭代30000次后转换为仿真支持的网格格式 [11] - 阶段3仿真训练在Habitat-Sim中进行,每个捕获场景生成1000个训练Episode和100个评估Episode,策略网络采用2层LSTM,使用DD-PPO框架训练 [12][13] - 阶段4真实部署使用Stretch机器人,通过Flask服务器连接远程集群进行策略推理,Episode终止条件为输出停止动作或达到100步,成功判定为机器人最终位置与目标点距离≤1米 [14][17] 实验设计与关键结果 - 实验围绕预训练策略的零样本性能、微调提升效果以及sim-to-real迁移能力三个核心问题展开,数据集涵盖HM3D、HSSD预训练场景和Captured大学场景、MuSHRoom室内评估场景 [19] - 在零样本性能方面,HM3D预训练策略在小场景(如会议室)成功率可达85%-88%,但在大场景(如教室、休息室)性能骤降至50%-53%;HSSD预训练策略零样本性能更差,如在教室场景成功率仅1% [20][24] - 微调后性能显著提升,HM3D预训练策略微调后所有场景成功率超过90%,HSSD预训练策略微调后多数场景成功率超过80%,大场景提升幅度最为显著 [25][28] - 在sim-to-real迁移方面,HM3D预训练策略零样本真实世界成功率仅50%,微调后提升至70%;HSSD预训练策略零样本真实成功率仅10%,微调后提升至40%-50%,重建网格的sim-to-real相关系数高达0.87-0.97 [29][32] - 过拟合实验表明,仅在单个场景训练的过拟合策略在仿真中成功率接近100%,但真实世界性能差(POLYCAM mesh 50%,DN mesh 10%),证明大规模预训练对泛化能力至关重要 [33][35] - 场景规模与PSNR分析显示,零样本成功率随起点-目标点平均最短距离增大而下降,随3D GS的验证PSNR升高而提升,捕获稳定性对重建质量有重要影响 [36][40] - 预训练步数分析发现,HM3D预训练至400M步后零样本性能停止提升甚至下降,HSSD预训练至300M步后进入平台期,说明过度训练会损害对新场景的泛化能力 [38][44]
露笑科技入局具身机器人 2025年上半年营收、净利润双降
犀牛财经· 2025-09-22 17:05
战略合作与市场拓展 - 控股子公司宁波君屋与上海开普勒机器人及某国内头部跨境电商签订战略合作协议,入局具身机器人赛道 [1] - 三方围绕家庭具身AI服务机器人产品供应链、AI具身模型算法及欧美市场拓展进行合作 [2] - 计划未来3年在美国及欧洲市场累计销售不少于100万台具身机器人产品 [1] 技术合作与产品能力 - 宁波君屋拟采购开普勒的具身AI模型及硬件模块,使机器人具备VLA自主移动和Agent视觉语言交互能力 [2] - 技术合作旨在实现家庭场景的自然交流与执行指令闭环 [2] 公司近期财务表现 - 2025年上半年营业收入为17.52亿元,同比减少7.73% [2][3] - 归属于上市公司股东的净利润为1.50亿元,同比减少16.68% [2][3] - 扣除非经常性损益的净利润为1.40亿元,同比减少10.10% [3] 业务转型与增长前景 - 公司通过跨界布局家庭具身AI服务机器人领域,试图开拓新的增长曲线 [3]