视觉数据
搜索文档
大摩:视觉数据重构AI机器人竞争格局 特斯拉(TSLA.US)为核心关注标的
智通财经网· 2025-09-24 21:36
文章核心观点 - AI机器人竞争焦点从算法迭代转向数据争夺 视觉数据成为VLA模型训练的核心资源 企业通过场景覆盖和数据积累构建技术壁垒 [1] - 光子之争将随具身人工智能技术成熟而加剧 能平衡数据收集效率 用户隐私与商业化落地的企业有望脱颖而出并重塑产业格局 [1] 视觉数据价值与行业共识 - 视觉-语言-动作模型是AI机器人实现自主交互的核心 现实捕捉数据成为全球科技与制造巨头争夺焦点 [2] - 视觉数据被比喻为胖金枪鱼 需配备数据处理能力才能释放价值 企业需掌握尧级次浮点运算能力处理数据 [3] - 高质量多场景视觉训练数据稀缺 Figure AI联合创始人强调大规模获取家庭场景超高清视频是获胜关键 [3] 特斯拉数据采集策略 - 特斯拉Optimus通过人类演示视频自主执行任务 从第一视角转向第三人称视角 实现数据驱动自主学习 [4] - 2025年8月预训练彻底去人工化 通过录制工厂工人执行任务视频获取数据 降低训练成本并学习复杂操作逻辑 [4] - Skild AI构建机器人基础模型 使用互联网人类动作视频作为核心训练数据 印证现实场景数据通用性价值 [4] 巨头竞争格局 - Meta在眼镜产品嵌入2个超高清摄像头 捕捉手部动作现实数据 预计2年内设备保有量达2000万台 [5][6] - 用户脸部成为数据战场 全栈式布局为抢占下一代计算平台奠定基础 视觉数据收集是核心环节 [6] - 布鲁克菲尔德开放超过100万套住宅单元 5亿平方英尺商业办公空间和1.6亿平方英尺物流仓储空间用于数据收集 [6] - 场景多样性提供多维度训练素材 帮助机器人学习在人类为中心场景中移动感知与行动 形成数据收集-模型训练-场景落地闭环 [7] 投资关注方向 - 特斯拉被列为核心关注标的 获增持评级和目标股价410美元 AI机器人技术突破与数据积累支撑长期估值 [8] - 行业面临传统车企 中国车企及科技巨头竞争加剧 特斯拉多工厂投产与技术迭代执行风险等挑战 [8]
光子之争:AI机器人视觉数据成核心战场,特斯拉与Meta竞逐现实捕捉赛道
智通财经· 2025-09-24 20:58
视觉数据在AI机器人领域的核心地位 - 视觉-语言-动作模型是AI机器人实现自主交互的核心 训练这类模型需要现实捕捉数据 现实捕捉数据成为全球科技与制造巨头争夺焦点[1] - 视觉数据是AI机器人的燃料 企业需要掌握尧级次浮点运算数据处理能力才能释放其价值 高质量多场景视觉训练数据稀缺[2] - AI机器人竞争从算法迭代下沉至数据争夺 视觉数据获取能力直接决定企业行业地位[8] 特斯拉的纯视觉训练策略 - 特斯拉Optimus机器人通过人类演示视频自主执行任务 从第一视角转向随机部署摄像头捕捉的第三人称视角 实现从人工操控辅助向数据驱动自主学习的关键跨越[3] - Optimus预训练彻底去人工化 不再依赖动作捕捉服与VR远程操控 转而录制工厂工人执行任务视频获取训练数据 降低训练成本并学习真实工业场景复杂操作逻辑[3] - 特斯拉被列为核心关注标的 获得增持评级 目标股价410美元 AI机器人技术突破与数据积累是支撑长期估值关键变量[7] 科技巨头在视觉数据领域的布局 - Meta在眼镜产品中嵌入2个超高清摄像头 重点捕捉用户手部动作现实数据 包括弹钢琴织毛衣倒咖啡倒垃圾等日常动作[5] - Meta眼镜设备保有量未来2年内或达2000万台 接近当前全球特斯拉汽车数量的2倍 用户脸部成为数据争夺战场[5] - Meta全栈式布局包括自主研发硬件AI操作系统内容生态 为抢占下一代计算平台奠定基础 视觉数据收集是核心环节[5] 不动产资源在数据收集中的应用 - 布鲁克菲尔德与Figure AI合作 开放超过100万套住宅单元5亿平方英尺商业办公空间1.6亿平方英尺物流仓储空间用于AI机器人训练数据收集[6] - 合作核心价值在于场景多样性 住宅办公物流等不同场景提供多维度训练素材 帮助机器人学习在以人类为中心场景中移动感知与行动[6] - 计划探索在不动产中部署人形机器人的长期商业化机会 形成数据收集模型训练场景落地闭环[6] 行业竞争格局与发展趋势 - 传统车企中国车企及科技巨头在AI机器人领域竞争加剧[7] - 特斯拉多工厂投产与技术迭代存在执行风险 FSD搭载率用户平均收入不及预期可能影响Dojo超级计算机赋能服务业务的价值认可[7] - 光子之争将愈发激烈 能平衡数据收集效率用户隐私与商业化落地的企业有望脱颖而出 重塑全球AI机器人产业格局[8]
大摩:视觉数据决定AI未来,特斯拉(TSLA.US)站上“光子竞赛”前沿
智通财经· 2025-09-24 17:55
文章核心观点 - 摩根士丹利指出,一场针对现实世界视觉数据的“光子竞赛”正在爆发,视觉数据已成为AI训练中最稀缺、最具战略价值的资源 [1] - 特斯拉、Meta和Figure AI等公司正通过不同路径积极布局视觉数据的收集与利用 [1][3] - 视觉数据是训练下一代AI模型的核心资源,其价值正在被重新定义 [3] 特斯拉的战略转向 - 特斯拉据称将转向“纯视觉”方法预训练Optimus,使用录制工人执行任务的视频作为训练数据,标志着训练范式的重大调整 [2][3] - 特斯拉前Optimus负责人发布的视频显示,其最终目标是转向通过“随机摄像头”和互联网视频获取的第三人称视角数据进行学习 [2] - 特斯拉车主在驾驶时间模拟世界输送数据以训练最新FSD模型 [3] 视觉数据的价值与应用 - 视觉数据是训练视觉-语言-行动模型(VLA)不可或缺的资源 [1] - 未来视觉数据将不仅用于训练模型,更将用于构建“机器人训练健身房”(模拟环境),从而在数字世界中迭代数十亿种场景 [3] - Meta眼镜用户的行为(如弹钢琴、织毛衣)也在为模型提供视觉数据 [3] 相关ETF数据 - 食品饮料ETF(515170)近五日下跌2.84%,最新份额87.0亿份,增加2700.0万份,主力资金净流入147.6万元 [5] - 游戏ETF(159869)近五日下跌1.25%,最新份额58.5亿份,增加1.0亿份,主力资金净流入1.2亿元 [5] - 科创半导体ETF(588170)近五日上涨18.18%,最新份额8.1亿份,增加400.0万份,主力资金净流出1.2亿元 [5] - 云计算50ETF(516630)近五日上涨1.94%,最新份额3.6亿份,增加600.0万份,主力资金净流出6.3万元 [6]
大摩:特斯拉、Meta与Figure--一场“光子争夺战”正在上演
美股IPO· 2025-09-23 20:26
行业核心趋势 - 视觉数据成为人工智能训练的新“金矿”,拥有数据收集能力的公司在人工智能机器人竞赛中占据优势地位 [1][3][4] - 人工智能机器人领域正经历“光子争夺战”,科技巨头疯狂收集现实世界视觉数据以训练视觉语言行动模型 [3] - 视觉数据的价值需要强大的处理能力(yottaflop级算力,1 yottaflop = 1万亿teraflops)才能实现,一旦具备收集和处理能力,数据将变得极其珍贵 [4] 特斯拉的战略与进展 - 特斯拉在Optimus机器人训练上经历重大战略转变,从遥控操作转向“纯视觉”训练方法,通过记录工人执行任务的视频作为训练数据 [5] - 训练数据视角从第一人称视角(摄像头安装在人类演示者身上)扩展到由“随机摄像头”及互联网内容捕获的第三人称视角 [6] - 驾驶特斯拉汽车的行为被视为在向模拟世界输入数据,以训练最新的全自动驾驶模型 [6] Meta的数据收集战略 - Meta通过智能眼镜收集用户日常活动数据(如弹钢琴、织毛衣、倒咖啡),以训练人工智能模型 [6] - 该战略被视作长期看涨期权,若2年内有2000万台设备投入运营(接近特斯拉车辆数量的两倍),每个用户都可能在元宇宙中训练一个在数十亿场景中迭代的人形化身 [7] Brookfield与Figure AI的合作 - Brookfield与Figure AI合作,利用其庞大的房地产组合部署数据收集网络,为在快速发展的人形机器人领域创建专业知识 [10] - Brookfield拥有超过10万个住宅单元、超过5亿平方英尺的商业办公空间和1.6亿平方英尺的物流办公空间,其全球足迹使其成为构建最大预训练数据的独特合作伙伴 [10] - 合作旨在积累关键的人工智能训练数据,教机器人如何在以人为中心的空间中移动、感知和行动,数据收集工作已展开并预计在未来几个月扩大规模 [10]