Workflow
数据飞轮
icon
搜索文档
中国企业全球抢滩:Robotaxi订单纷至 商业化落地加速
新京报· 2025-09-19 11:31
核心观点 - 中国自动驾驶技术公司加速海外市场拓展 通过技术输出和跨国合作改变全球竞争格局 头部企业频获大额订单 [1][2] - 中国公司在算法技术方面具备优势 复杂道路环境训练出优秀的问题处理能力 无图方案在全球化扩展中具有竞争优势 [4][5] - 成本大幅降低推动行业商业化进程 Robotaxi制造成本五年下降80% 激光雷达等关键部件成本显著下降 [6] - 行业从技术验证转向规模化运营 2026年成为多家企业商业化落地目标 资本市场关注点转向商业化时间表和现金流 [7] 海外市场拓展 - 禾赛科技获得美国头部Robotaxi公司超过4000万美元激光雷达订单 [1] - 均胜电子新获两家头部品牌主机厂汽车智能化项目 全生命周期订单总金额约150亿元 [1] - Momenta与Uber签约 计划2026年在德国慕尼黑开启L4级自动驾驶Robotaxi测试 [1] - 轻舟智航与高通达成深度合作 2026年实现智驾方案全球交付 在德国设立欧洲总部 [2] - 百度将在Uber平台投放"萝卜快跑"自动驾驶汽车 2025年晚些时候在亚洲和中东地区投放 [2] - 文远知行与Uber、迪拜道路交通管理局签约 2026年第一季度实现纯无人商业运营 [2] - 小马智行在迪拜落地Robotaxi车队 2026年推进全无人商业化运营 [2] 技术优势 - 中国道路环境复杂训练出优秀算法 具备优秀的问题处理能力 [4] - Momenta的"数据飞轮"算法通过40多万辆量产车回收海量极端案例 持续优化模型 [4] - 无图端到端方案在全球化扩展中具优势 避免高精地图的高成本和扩展慢问题 [4] - 高精地图需要厘米级精度地图 采集制作维护成本高昂 每进入新城市都需要漫长审批流程 [4] 成本控制 - Robotaxi制造成本过去五年大幅下降80% [6] - 禾赛科技AT512激光雷达实现规模化生产 大幅降低原本数万美元的成本 [6] - 小马智行第七代自动驾驶套件总成本较前代下降70% 车载计算单元成本下降80% 激光雷达成本下降68% [6] 资本与商业化 - 哈啰出行Robotaxi业务完成超过30亿元战略融资 蚂蚁集团提供资本和技术支持 [3] - 资本市场关注点从技术可行性转向商业化时间表与现金流预期 [7] - 行业可能迎来并购与整合潮 仿真软件、传感器公司等细分领域头部企业受资本关注 [7] - 科技公司与出行平台结合盈利速度可能快于传统车企 高效整合技术、车辆与运营 [7] 全球化策略 - 均胜电子表示将积极把中国领先的汽车智能化技术向海外市场拓展 争取更多海外订单 [3] - 中国资本从纯粹投资者变成合作者 参与技术支持和解决方案提供 [3]
商汤:市值突破千亿,高盛目标价跳涨50%,券商集体唱好
格隆汇· 2025-09-17 21:01
公司业绩表现 - 上半年收入24亿元 同比增长36% 超出市场预期[3] - 生成式AI收入同比激增73% 连续三次大幅提升 占总收入比重77%[3] - 毛利率维持在39% 经调整净亏损同比收窄50%[3] - 经营现金流净流出同比收窄82% 现金储备达132亿元[3] - 贸易应收回款金额同比大增96%至32亿元 应收账款周转天数缩短49%[3] 业务发展策略 - 采用"一基两翼"业务发展策略 产品矩阵快速渗透各行业[4] - 企业服务"小浣熊"系列拥有超300万用户 金融教育政务版本完成规模化落地[4] - 日日新多模态大模型V6.5支持多模态流式交互 交互时长年内增长超五倍[4] - 传统视觉AI服务客户超660家 复购率57% 计算机视觉市场份额连续九年第一[4] - 汽车座舱视觉AI软件市占率连续五年第一 海外商机储备与新订单显著增长[4] 技术创新能力 - 大装置运营总算力突破2.5万PetaFLOPS 国产芯片异构集群规模达5000卡[7] - 集群利用率达80% 异构训练效率达95% 上海临港AIDC二期持续扩容[7] - 日日新V6.5预训练吞吐量提升20%以上 强化学习效率提升40% 推理吞吐量提升35%以上[8] - 多模态推理成本降至原始30% 性能提升5倍 性价比提升3倍以上[8] - 获得OpenCompass和SuperCLUE评测双冠军 通过中国信通院大模型通用能力成熟度4+级测评[8] 资本市场反应 - 高盛将评级从"中性"上调至"买入" 目标价上调幅度接近五成[1] - 高盛设定目标价2.72港元 隐含约30%上行空间 远超大中华科技股平均9%水平[10] - 股价年初至今累涨近80% 区间最高涨幅逾110% 总市值突破千亿港元[12] - 多家券商集体看多 中泰证券首次覆盖给出"增持"评级 华泰证券维持"买入"评级[10][11] - 生成式AI收入占比预计2030年达91% 几乎构成核心业务全部[10] 行业政策环境 - 香港特区政府成立AI效能提升组 推进"AI+"发展 促进AI政务发展[1] - 国务院提出到2027年重点行业AI Agent渗透率达70% 2030年提升至90%[9] - 企业客户AI资本性支出预算2025年同比增长超40% 私有云大模型订单排至2026年[9]
豆包为什么能反超DeepSeek?
混沌学园· 2025-09-16 20:01
市场地位与用户增长 - 字节跳动旗下豆包月活跃用户规模达到1.5742亿,环比增长6.6%,登顶中国原生AI应用月活榜首[2] - 豆包从2024年5-7月,日新增用户从20万迅速飙升至90万,并在9月成为国内用户规模破亿的首个AI应用[9] - 截至2024年11月底,豆包累计用户规模已超过1.6亿[9] 产品定位与核心优势 - 产品定位生活化和娱乐化,反应速度快、说话语气像真人、回答情商高,满足大众日常需求[4] - 应用场景包括聊天伙伴、高情商沟通导师、恋爱军师和旅游向导,实现“谁都可以用”的低门槛[4] - 豆包并非单一模型,而是一个模型家族,包含文本、视频生成、实时语音及语音播客模型等多种模态[8] 公司战略与资源投入 - 采用“大力出奇迹”战略,依托字节跳动的超级流量、专业数据和算法优势[6] - 国内十款大模型产品在2024年合计已投放超625万条广告,投放金额达15亿元,豆包在2024年6月上旬一轮广告投放金额就高达1.24亿元[6] - 豆包团队在2025年2月提出全新稀疏模型架构UltraMem,推理速度较MoE架构提升2-6倍,推理成本最高可降低83%[7] 数据飞轮效应与技术基础 - 庞大的用户基数为模型优化提供了海量的真实、多样化用户交互数据[6] - 字节跳动丰富的产品生态(如抖音、剪映等)为豆包训练和迭代多模态能力提供了潜在的数据基础[7] - AI产品的本质是数据智能,更多用户意味着更多数据,更多数据意味着更聪明的AI,形成正向循环[9] 行业启示与发展方向 - AI产品需要回归场景,用户不关心参数,只关心能否解决实际问题[11] - 数据智能的核心是数据飞轮,而非孤立模型,AI应用必须降低使用门槛才能实现大众化[11] - 豆包的成功逆袭是AI应用大战的新起点,技术持续演进和应用场景不断拓展是未来方向[11]
张小珺对话OpenAI姚顺雨:生成新世界的系统
Founder Park· 2025-09-15 13:59
文章核心观点 - 语言是人类实现泛化的核心工具,是构建通用人工智能系统的最本质要素 [4][7][77] - AI Agent发展已进入下半场,重点从模型训练转向任务定义和环境设计 [5][62][63] - 创业公司最大机会在于设计新型人机交互界面,而非重复ChatGPT模式 [110][112][113] - 未来AI生态将呈现既单极又多元格局,由不同超级应用共同定义智能边界 [5][146][154] 姚顺雨背景与研究历程 - 清华姚班本科、普林斯顿博士,2019-2024年在普林斯顿攻读博士学位 [13] - 2016年接触多模态嵌入技术后转向深度学习,2018年系统性开始深度学习研究 [14][15] - 博士期间从计算机视觉转向语言模型研究,因认为语言是实现AGI的更核心方向 [15] - 专注Language Agent研究6年,2024年加入OpenAI [4][19] AI Agent技术演进 - 技术发展三阶段:符号主义AI(规则系统)→深度强化学习(环境特定)→大语言模型(泛化推理)[40][41][43] - 语言智能体与传统Agent本质区别在于具备推理能力从而实现泛化 [36][38][39] - ReAct框架成为最通用方案,实现推理与行动的协同 [26][50] - 代码环境是数字智能体最重要的"手",提供天然机器表达形式 [53][54][55] 任务与环境设计 - 当前瓶颈从方法创新转向任务定义和环境设计 [62][63] - 优秀任务需具备:结果导向奖励机制、基于规则的白盒评估、可解释性 [64][66][71] - 任务分类标准:可靠性需求型(如客服)vs创造力需求型(如证明猜想)[70][72] - 评估指标需区分Pass@k(多次尝试成功率)和Pass^k(每次成功率)[74] 产业发展与创业机会 - 模型能力溢出为创业公司创造机会,关键在于设计新型交互界面 [110][112] - 成功案例包括Cursor(编程副驾驶)、Manus(通用交互)、Perplexity(研究型搜索)[117][127][129] - 数据飞轮形成需三个条件:自主训练能力、清晰奖励信号、数据好坏分离 [123][124] - 成本不是核心瓶颈,真正关键在于找到价值超过成本的应用场景 [139][141] 未来生态展望 - OpenAI五级能力划分:聊天机器人→推理者→智能体→创新者→组织者 [44][45] - 未来12-24个月趋势:Chatbot系统自然演进为Agent系统,新型Copilot应用涌现 [165][166] - 记忆系统(Memory)将成为核心竞争壁垒,特别是上下文管理能力 [51][158][159] - 最终生态将由多个超级应用共同定义,呈现中心化与分布式并存格局 [146][152][154]
金融行业大模型应用落地白皮书:AI原生开启金融智能新未来
产业信息网· 2025-09-02 11:37
算法技术突破 - 大模型算法核心跃迁从被动处理任务转向主动进化策略 金融行业作为数据密集型和计算密集型场景迎来深度变革机遇[1] - OpenAI GPT-强化长文本因果推理能力 支持10万token以上上下文 突破金融机构对超长篇幅风控/投研文档处理瓶颈[1] - Google Gemini升级多模态动态交互算法 实现文本-图表-数据实时联动 高盛用其构建动态利率走势模型[1] - AlphaEvolve通过生成式策略优化(GSO)实现模型自动迭代 国内百度文心4.5和X系列模型、DeepSeekV\R等采用多模态+长思维链推理+智能工具调用架构[1] 业务融合与模型适配 - 核心业务与AI融合深度成为金融机构核心竞争力 大模型在员工场景(知识问答/报告撰写/资料汇总)优势明显[2] - 面向客户业务场景(信贷/风控/营销)和实时场景(反欺诈/秒级授信)存在准确率低和延迟反馈问题[2] - 专精模型结合金融合规规则库与动态风险因子库 通过领域数据定制实现深度场景适配[2] - 通用大模型在金融领域存在意图理解不准确/专业知识覆盖不足/幻觉率高等短板 未达生产级要求[2] 开发工具与平台演进 - 大模型工具链从技术导向转向业务导向 通过低代码/无代码平台让金融机构快速构建业务智能体[3] - 智能体在投研/投顾/信贷决策/风险管理等核心场景持续创造价值 开发平台支持MCP/AA及SFT工具链[3] - 2025年通用模型+专精模型协同管理成为主流 工具平台降低AI使用门槛 让业务人员用AI解决问题[3] 数据与知识体系构建 - 数据飞轮将零散数据转化为可复用结构化知识 形成业务-数据-模型闭环 适配高合规/高精准/高动态要求[4] - 金融机构对数据按敏感度分级构建可信环境 通过跨模态数据整合实现内外部协同 打破数据壁垒[4] - 构建高质量向量知识库和高价值知识工程 缓解高价值数据稀疏现状 促进模型多维度系统性升级[4] 算力架构演进 - 大模型向万亿级参数演进 训练算力呈指数级增长 异构计算集群和多芯混合训练兼顾高性能与低成本[4][5] - 百亿参数模型场景单机单卡可完成推理与微调 更高算力密度机器在训练微调与复杂推理中具效率优势[5] - 千亿/万亿参数场景采用DP+EP分离的大集群部署方案 通过数据拆分与专家层分工解耦提升算力利用效率[5]
Robotaxi的“新游戏”已然启幕
华尔街见闻· 2025-08-28 20:01
核心观点 - 百度Robotaxi在武汉实现单车层面扭亏为盈 标志着行业从技术愿景转向商业化阶段 [2] - 自动驾驶车辆成本降至30万元人民币以下 单位经济模型可行性显著提升 [3] - 中国政策支持与数据积累优势推动规模化落地 2030年市场规模或达1830亿美元 [4][5][6] 商业化进展 - 百度二季度在武汉实现单车层面运营盈利 突破行业长期亏损困境 [2] - 上海将Robotaxi运营范围扩展至陆家嘴核心区 所有一线城市均已开放全无人商业化运营 [4] - 头部企业计划2025年底将车队规模扩大至千辆以上 进入规模化扩张阶段 [3] 成本结构突破 - 自动驾驶车辆总成本压降至30万元人民币以下 其中车辆本体与自动驾驶套件各占50% [3] - 激光雷达成本从2022年5000元人民币降至200美元(约1300元人民币) 降幅超70% [3] - 中国产业链极致效率追求为成本优化提供核心支撑 [3] 市场规模预测 - 瑞银预测2030年代初中国一线城市将形成30万辆Robotaxi车队 全国总需求达400万辆 [4] - 对应市场规模1830亿美元 成为全球资本关注的新兴产业 [4] - 政策测试许可互认机制(如深圳广州)降低企业测试成本和时间 [5] 技术竞争壁垒 - 自动驾驶本质是数据竞赛 真实路跑数据驱动算法迭代与场景处理能力 [4] - 商业化落地加速数据飞轮效应 核心区24小时运营使数据价值指数级增长 [4] - 数据壁垒一旦形成将难以逾越 快速巩固领先企业市场地位 [4] 政策环境支持 - 北京2024年4月实施新自动驾驶法规 为L3+级别运营提供法律框架 [5] - 政府要求科技企业与出租车公司合作 平衡新技术与传统行业关系 [6] - 政策将Robotaxi视为发展"新质生产力"和突破"中等收入陷阱"的关键环节 [6] 行业终局展望 - Robotaxi与量产车辅助驾驶(ADAS)路线长期必将交融 重塑社会出行形态 [6] - 出行成本下降与通勤时间再利用将重新定义城市物理边界 [6] - 全球科技巨头(Waymo/Cruise/百度/Pony.ai/特斯拉)竞争下一代城市基建定义权 [7]
对话优理奇CEO杨丰瑜:00后创业不押注VLA,把机器人先送进酒店干活
36氪· 2025-08-28 15:13
公司商业化进展 - 机器人运动会获奖后公司400咨询电话被打爆 比赛后第二周有十几家酒店客户组团参观公司[1][7] - 公司机器人已进入小规模化交付阶段 与多家酒店集团 物业公司与养老社区签订订单[1] - 公司采用边量产出货边采集数据的商业策略 通过实际场景铺量实现数据飞轮迭代[3][12] 技术路径选择 - 公司未选择主流的VLA端到端路线 因当前行业缺乏海量机器人数据[2][18] - 采用感知操作解耦模型UniFlex 基于关键点模仿学习技术 通过5-10次数据采集即可学会新任务[16][17] - 开发UniTouch视触觉融合系统 但未安装实体高精度触觉传感器 因单个手指需增加6000-8000元成本且耐用性不足[20][21] 产品性能特点 - Wanda二代机为量产版本 定价8.8万元 采用自研关节方案实现可观毛利[24] - Wanda三代机配备全向四驱底盘 移动速度更快且负载更高 但尚未正式发布[26][28] - 机器人可完成酒店清洁 整理 收垃圾 铺床及打扫洗手间等复杂任务[9][12] 数据战略 - 通过酒店等类C端场景采集自然分布数据 强调数据多样性比质量更重要[13] - 目标部署数十万台机器人 认为需达到自动驾驶行业相近数量级才能训练优质模型[13] - 酒店场景数据回传不受工业保密限制 且容错率高利于机器人持续作业[10][11] 硬件开发策略 - 坚持全栈自研硬件 首要考虑硬件稳定性 上半年重点攻克供应链稳定性和生产品控[23][25] - 自研硬件可避免技术黑盒问题 成本更可控 并保障多代机型数据一致性[24] - 机器人底盘针对75-80厘米常规门宽设计 比赛遇到1米宽门时通过VR设备紧急重训技能[16] 应用场景规划 - 聚焦酒店清洁类C端场景 该场景技能可迁移至家庭 养老院 餐厅 快餐店及咖啡厅等场景[9] - 清洁场景相对容错率高 允许机器人关门独立作业 减少人机交互隐患[1][11] - 迎宾项目需处理机器人前进方向与拖拽行李车方向的非直线运动等硬件难题[7]
独家对话元客视界CTO:揭秘具身智能大模型的“数据飞轮”密码
机器人大讲堂· 2025-08-28 12:07
具身智能与人形机器人发展现状 - 具身智能仍处于"幼儿园孩子水平" 仅能完成抓取 走跑跳等简单动作 复杂长程任务能力薄弱 缺乏流畅性与协调性[1] - 面临硬件长期稳定性与一致性不足 软件泛化能力弱 数据匮乏无标准三重困境[1] - 需要搭建感知—推理—执行的完整链路 并通过数据飞轮实现模型能力与产品性能的持续提升[1] 数据规模与Scaling Law关系 - 模型性能遵循Scaling Law 参数规模突破阈值后才会涌现上下文学习 复杂推理等能力[2] - 依据Scaling Law经验推演 1亿条高质量行为轨迹数据是支撑具身智能大模型能力跃迁的关键门槛[2] - 行业正加速搭建"仿真-真机融合"数据训练场 通过并行机器人 远程操控等机制高效采集大规模数据[2] 数据采集技术方案 - 光学动捕精度达0.1毫米级 适用于手指灵巧作业等精度要求高的情况[8] - 惯性动补数据连续性更好 不怕遮挡 得应急救援等领域青睐[8] - 光惯融合技术方案实现集成化 智能化高质量数据采集 保证精度同时解决遮挡问题[8] 数据采集效率指标 - 单次采集任务实现83%稼动率 60秒任务时长中高效采集50秒有效数据[10] - 人机工效比从1:10优化到1:2 效率提升5倍 机器人完成任务时长仅是人工耗时的一倍[10] - 开发人体Human to Robot映射重定向算法 将人体25个关节30个手指关节参数转化为机器人运动控制参数[11] 仿真与真实数据融合训练 - 行业采用"仿真+真机"比例混合训练模型 理想模型基于10%真机数据生成80%仿真数据 再用10%真机数据验证Sim2Real效果[7] - 真实数据用于纠偏与对齐 仿真数据用于规模扩展和多样性覆盖 二者融合训练可有效兼顾效率与表现[7] - 通过设定URDF模型物理参数维度 保证仿真环境训练动作序列迁移真机过程中物理量的一致性[12] 全栈数据解决方案 - 从数据采集延展到多模态数据整合 结构化处理 存储 标注 仿真等环节 形成全栈数据解决方案[13] - 已与宇树 智元 傅利叶 睿尔曼等市占率较高头部企业实现适配 新款机型适配能在两三周完成[13] - 标注支持自动识别框选和人工标注框选 借鉴自动驾驶矩形框选 圆形框选模式[14] 数据量需求场景分析 - 商业服务场景如咖啡店需十万到五十万条数据 最多不超过一百万条可实现99%成功率[18] - 环境变化较大场景如便利店理货与分拣可能需要百万条以上数据[18] - 工业场景需达到99.99%成功率 需要千万条级别数据规模[19] 能耗与性能评估 - 人形机器人行走功耗约1000瓦 而人类行走仅需70瓦左右 能效远低于人类[18] - FZMotion Transformer评测软件15分钟完成160+项测试 实现动作自动语义分割[17] - 通过运动学与动力学分析优化关节运动轨迹 系统优化机器人功耗模型[18] 技术优势与产业布局 - 母公司凌云光2010年布局空间视觉领域 依托光学技术29年积累构建全链路能力[21] - 单条数据采集价格是国外同行的1/10[23] - 未来将持续深耕光惯融合方案 联合大模型技术公司提供结构化数据 优化训练效率[24]
讯飞医疗(2506.HK)中报信号:营收稳健跃升,以技术壁垒抢占价值高地
格隆汇· 2025-08-25 11:30
行业背景与政策环境 - 人工智能医学指南数量在2018年至2024年期间持续增长,行业对AI的认知、重视与规范化需求日益提升 [1] - 《关于深入实施"人工智能+"行动的意见》于7月底审议通过,推动AI医疗进入规模化、商业化、生态化发展的新阶段 [1] 公司财务表现 - 2025年上半年实现营收2.99亿元人民币,同比增长30.26% [5][7] - 净亏损为7408.6万元人民币,同比大幅收窄42.86% [5][7] - 毛利润为1.54亿元人民币,同比增长26.96% [7] GBC三端业务发展 - G端业务中基层业务收入8381.2万元人民币,同比增长52.3% [8] - 区域解决方案业务收入5762.5万元人民币,同比大幅增长178.1% [8] - 核心产品"智医助理"覆盖全国697个区县、超7.5万个基层机构,累计完成超10.1亿次AI辅助诊断 [8] - B端医院业务短期回落10.0%,但需求有望在下半年集中释放 [8] - 医院解决方案在全国500余家等级医院落地,讯飞星火医疗大模型在全国20余家龙头医院应用 [8] - C端业务收入1.04亿元人民币,稳健增长10.1% [8] 技术研发与创新 - 3月发布星火医疗大模型X1,基于全国产算力训练,在诊断推荐、健康咨询等核心医学任务中表现超越GPT-4o及DeepSeek R1 [12] - 6月推出星火医疗大模型V2.5国际版及升级版AI健康助手"讯飞晓医APP" [12] - 8月21日星火医疗大模型以100.2分登顶MedBench榜单,在复杂医学推理、医学语言理解、医疗安全和伦理等多项核心能力位居第一 [13] - 讯飞晓医APP慢性病主动管理功能可为高血压、高血糖等患者自动跟踪关键指标、评估心肾风险并生成个性化干预方案 [15] 行业生态与标准化 - 公司在安徽省打造中国最大的区域影像数据互联互通互认的影像云平台,接入国家医保信息平台并实现异地读取数字医疗影像胶片 [9] - 上半年超1970家医疗机构和超3300名专家在安徽省影像云平台上注册,开展远程会诊服务量近980万次,数据服务使用量超1.3亿次 [9] - 5月参与编写《医疗场景下大模型应用效果评测专家共识》,7月牵头《医疗健康行业智能体标准体系》研制,主导10项子标准的制定 [16] 资本市场认可 - 万家健康产业基金将讯飞医疗列为第六大重仓股 [20] - 招银国际维持"买入"评级,目标价143.59港元;招商证券国际重申"增持"评级,目标价141.5港元;国泰海通维持"增持"评级,目标价上调至154.48港元 [20] - 多家券商目标价对应超30%潜在上涨空间 [20]
我们距离真正的具身智能大模型还有多远?
2025-08-13 22:56
行业与公司 - 行业涉及**人形机器人产业链**,重点关注**大模型端**和**硬件端**的发展[1] - 公司提及**特斯拉**作为硬件定型的核心推动者[3][4],以及国内企业如**银河通用**、**心动剂元**、**青铜视觉**、**凌云光**、**天奇**等[22][23][24] --- 核心观点与论据 **1 大模型是行业发展的关键卡点** - 当前行业瓶颈在于**模型端**,尤其是多模态大模型的智能水平,而非硬件控制成熟度[1][2] - 大模型为人形机器人提供“智能大脑”,是推动本轮发展的底层逻辑[2] **2 大模型发展的三条主线** - **多模态输入**:从C-CAN(仅语音)到RT1(动作+视频)、RT2(动作整合),再到Helix(200Hz频率)[5][6][11] - **频率提升**:RT2(1-5Hz)→ 派林(50Hz)→ Helix(200Hz,超过人类反应速度)[6][10][11] - **泛化能力**:通过增强推理能力(如PALM-E引入大模型分析)实现任务迁移[6][9] **3 数据飞轮与硬件定型的关系** - **数据不足**是模型停滞的主因,需真机数据形成闭环,但当前硬件未定型导致数据采集风险高[3][15] - **特斯拉的核心作用**:硬件定型后,行业才能规模化采集真机数据,推动模型迭代[3][4][16] **4 模型架构演进** - 从**分层模型**(大脑与小脑分开训练)到**端到端模型**(联合训练,效果更优但难度大)[7][8] - **快慢脑架构**(如Helix):快脑(80兆Transformer)+慢脑(7B BLM),数据回传实现200Hz高频动作[11][12] **5 数据采集的现状与挑战** - **数据类型**:低质量互联网数据(预训练)、仿真数据(成本低但真实性不足)、真机数据(质量高但效率低)[13][14][15] - **动捕设备**: - **光学动捕**(亚毫米精度,成本高,如青铜视觉、凌云光)[19][23] - **惯性动捕**(IMU,灵活低成本,如诺伊腾,特斯拉采购Xs为观察指标)[18][19] - 当前真机数据采集效率极低(每小时3-4条,单条成本超10元)[16] --- 其他重要内容 **1 未来大模型方向** - 融入更多模态(语言、视觉、传感器等)[20] - **世界模型**:用数学符号模拟物理规律,实现仿真数据≈真机数据(英伟达Cosmos目前效果不佳)[21] **2 国内企业布局** - **银河通用**:全仿真数据路线,发布Grasp VLA模型(无序抓取高成功率)[22] - **心动剂元**:ERA大模型采用双系统架构(快慢脑),早于Figure提出[22] - **天奇**:工业数据采集代工+仿真数据训练[24] **3 投资标的建议** - **动捕设备**:凌云光(光学动捕)、青铜视觉[23] - **摄像头**:阿比[26] - **遥操作**:当红科技、景业智能(工厂及协作场景刚需)[25][26] --- 关键数据引用 - 动作频率:RT2(1-5Hz)、派林(50Hz)、Helix(200Hz)[6][11] - 动捕成本:真机数据单条采集成本超10元,100台机器人日采8-10万条[16] - 光学动捕精度:亚毫米级[19]