真实数据 - 财报，业绩电话会，研报，新闻

真实数据

搜索文档

我要的是真实数据，真实数据！

新浪财经· 2026-02-06 04:15

文章核心观点 - 用户明确要求获取真实数据，而非预测或分析性内容 [2] 用户数据需求 - 用户强调其需求为“真实数据”，表明对信息准确性和原始性的高度重视 [2]

真实数据

高德扫街榜100天：生活服务超级入口加速进化

21世纪经济报道· 2026-01-07 19:23

高德扫街榜产品表现与市场影响 - 产品于2025年9月10日上线，首日用户规模即突破4000万人 [1] - 上线100天后，累计用户规模突破6.6亿，或已成为全球最大生活服务榜单 [1] - 巨大的用户拉动下，超86万商家主动入驻，入驻商家过去100天的营业额环比增长超270% [1][10] - 产品助推高德APP月活跃用户数（MAU）在2025年10月达到9.96亿，逼近10亿大关，较9月的9.5亿新增近4600万月活用户 [1][10] 产品核心逻辑与行业痛点解决 - 产品摒弃流量思维，以真实行为为核心逻辑，做现实世界的忠实映射 [1] - 通过“用脚投票”机制，将海量用户的真实选择汇聚成“烟火小店榜”的信任网络，重构本地生活供需关系 [4] - 旨在破解传统评价体系下的行业顽疾，如虚假好评、刷单炒作，以及小店因缺乏营销预算难以获得高曝光的问题 [3][4] - 一个真实可靠的线上渠道，能够抹平物理位置的劣势，让坚守品质的“烟火小店”获得平等竞争机会 [7] 具体商家案例与效果 - 以北京胡同深处的“锅儿挑”面馆为例，该店因位置偏僻、停车困难面临客流局限 [3] - 上榜“烟火小店榜”后，店内日均客流从过去的“二十来桌”增长到“三十来桌”，增幅达50% [6] - 上榜海报显示“食客导航总里程超7576公里”，体现了用户真实到店行为 [4] - 案例证明基于真实到店行为的榜单能让不善营销但品质过硬的商家获得公平曝光 [8] 公司的战略考量与技术支撑 - 公司拥有海量的时空数据，连接了10亿级别有真实需求的用户 [10] - 从2025年开始攻坚“流量虚假”难题，上线扫街榜并引入“信任”评价体系，以巩固在本地生活市场的真实性壁垒 [12] - 扫街榜2026的沉浸式体验（如“飞行街景”）由高德世界模型提供硬核技术支撑 [14] - 该世界模型基于多源感知数据，通过跨模态统一表征，将物理世界映射为连续、可计算的数字世界 [14] - 在国际权威空间智能评测基准WorldScore中，高德世界模型位居静态场景综合第一名，在可控性、一致性等关键指标上领先 [14] 对行业与公司生态的深远影响 - 基于真实线下行为数据的模式，是本地生活行业下阶段的一大增长锚点，有助于破解传统平台边际收益递减、流量成本激增的困局 [8] - 产品激发的势能反哺高德整体生态，使其从出行、打车服务向生活服务扩展，用户认知发生变化 [10][11] - 公司通过重构信任基石、普惠空间智能技术，为中国本地生活服务的数字化转型提供了一个全新范本 [14] - 模式助力生活服务产业穿越周期，让“真实”成为连接数字世界与烟火生活的桥梁 [14]

直播分享！“具身数据困境”：仿真技术、真实数据与世界模型的碰撞交融

具身智能之心· 2025-08-30 00:03

行业技术路径 - 具身智能发展主要围绕仿真技术、真实数据与世界模型三大路径展开这些路径既存在竞争又相互融合 [3] - 物理仿真技术已进入深水区真实数据到仿真的转换技术（real2sim）正推动仿真路线发展 [11] - 业界构建了超大规模训练场Agibot World 包含百万真机与千万仿真数据集系统研究具imbing智能的Scaling Law方法论 [4] 核心技术突破 - 端到端自动驾驶方案UniAD获IEEE CVPR 2023最佳论文奖其技术方案被特斯拉2023年推出的FSD采用 [4] - 开发全球首个开源模块化真实感自动驾驶仿真器MARS 并获得CICAI 2023最佳论文Runner-up奖项 [5] - 神经渲染方法SlimmeRF实现渲染阶段精度与速度的可调节获得3DV 2024最佳论文奖 [5] - Open X-Embodiment项目获得ICRA 2024最佳论文奖 CAST项目获得SIGGRAPH 2025最佳论文奖 [7] 数据争议与解决方案 - 针对真实数据不可替代性的争论行业探讨这是策略选择问题还是AI演进必经之路 [3][11] - Genie3世界模型的问世引发行业关注世界引擎可能成为解决具身智能数据问题的终极方案 [11] - 俯视图感知方法BEVFormer成为业界广泛使用的纯视觉检测基准入选2022年百强影响力AI论文榜单 [4] 学术与产业贡献 - 研究团队在CVPR/ICCV/ECCV/SIGGRAPH/NeurIPS/ICLR等顶级会议发表50余篇论文多次获得最佳论文奖项 [5][7] - 学术成果获得多项荣誉包括2024年中国吴文俊人工智能青年科技奖香港博士政府奖学金等 [4][7] - 构建的具身智能训练场包含百万级真机与千万级仿真数据集为行业提供大规模训练基础设施 [4]

钛媒体APP· 2025-08-11 11:48

具身智能行业现状 - 国内外科技大厂纷纷布局具身智能领域，数亿级融资频繁 [1] - 世界机器人大会（WRC 2025）展示200余家企业的产品落地能力，包括宇树科技Unitree G1机器人拳击赛、银河通用机器人Galbot零售场景应用等 [1] - 行业技术路径从大语言模型（LLM）向多模态模型（VLA）演进，推动机器人复杂交互能力 [4] 具身智能技术定义 - 具身智能通过实体产品（如机器人）实现"感知-行动"学习，模拟人类与环境交互的决策能力 [2] - 与非具身智能（如AlphaGo）相比，具身智能强调物理世界实践性学习，而非纯数据驱动的概念性学习 [2] - 上海交通大学教授卢策吾提出"第三人称智能"与"人类视角智能"的区分框架 [2] 数据瓶颈与挑战 - 行业面临多模态数据稀缺问题，主因是采集成本高（需视觉/触觉/力觉等传感器）和规模不足 [5][7] - 数据孤岛现象严重：企业间数据格式不统一且因隐私/成本拒绝共享，导致重复投入和资源浪费 [8] - 合成数据使用比例达80%-90%（具身智能领域），显著高于自动驾驶的30%-40% [10] 合成数据应用 - 合成数据通过Sim-to-Real技术模拟虚拟环境，成本比真实数据低且无需人工标注 [9] - 局限性包括可能生成不合理场景，环境细节差异（如光照）易导致AI行为偏差 [12] - 当前主流策略是"合成数据为主+真实数据为辅"，需对齐时空维度以优化训练效果 [12] 商业化前景 - 人形机器人被视为具身智能最佳载体，但量产落地仍需数年时间 [12] - 训练成本和生产成本过高是制约商业化进度的核心因素 [12] - 行业仍处训练阶段，未来生产力将决定竞争格局 [12]

机器之心· 2025-08-10 09:30

数据困局下的具身智能 - 具身智能面临真实数据严重不足的挑战，目前多数机器人基础模型仅依赖不足1%的真实操作数据，导致物理常识缺失和泛化能力受限[5] - 行业对数据类型选择存在分歧：真实数据能反映物理交互但采集成本高，合成数据成本低且易扩展但存在"domain gap"问题[6][7] - 真实数据派代表Levine指出，模型能力提升会放大仿真与现实的差异，削弱泛化能力，认为只有真实数据才能实现通用具身智能[7] - 合成数据派代表王鹤提出需要上万亿token规模数据，但当前最大数据集仅百万级别，认为具身智能爆发必须依赖合成数据先行[8] - 合成数据应用案例：GraspVLA模型通过十亿级合成数据预训练+少量真实数据微调，已在零售、导航场景实现商业部署[8] 技术路线之争 - 遥操作成为真实数据主要采集方式，依赖人类示范支持模仿学习，但面临控制效率与扩展能力的平衡问题[9] - Sim2Real技术路径依赖合成仿真数据，优势在于可控性强、成本低，适合大规模预训练与策略泛化[9] - 多模态遥操作系统探索语言+手势+触觉融合，可能降低人类操控门槛[1] 商业模式创新 - OpenAI董事会主席Bret Taylor批判"按token计费"模式，认为市场终将选择"按成果付费"[2] - 提出"应用AI"是创业方向，"长尾Agent公司"可能取代传统SaaS[2] - Sierra公司正在实践结果导向的商业模式，探索AI编程新范式[2] 行业动态 - Skild AI最新进展聚焦解决真实数据不足问题，倡导融合多样化数据尤其是大规模视频数据[5] - 本期通讯包含30项AI&Robotics要事，其中国内8项、国外9项、技术13项[2]

Jinqiu Select | Physical Intelligence 联创：AI训练的真实数据不可替代

锦秋集· 2025-07-22 23:04

核心观点 - 过度依赖替代数据源会严重限制AI模型的最终能力真正的技术突破必须建立在真实数据基础之上 [1] - 当前AI研究面临"勺叉困境"：试图用模拟器人类视频或手持设备等廉价替代方案训练机器人结果导致模型在真实场景中表现不佳 [1][3] - 机器学习的铁律是训练数据必须与测试条件相匹配替代数据无法完全替代真实数据在物理世界中的实践 [10] 权宜之计的替代方案 - **模拟训练**：通过sim-to-real方法在模拟环境中训练机器人但最佳模拟往往不是精确复现现实而是编码机器人需要应对的各种变化 [3] - **人类视频学习**：需定义人机对应关系但需弥合人类动作与机器人动作在动力学和外观上的差异 [3] - **手持夹爪设备**：让人们使用模仿机器人夹爪的设备收集数据但仍受限于设备的工作空间和运动学差异 [3] 替代方案的局限性 - 替代数据将模型限制在三个条件的交集中：系统有效行为能用替代方法实现的行为不会暴露领域差异的行为 [4] - 模型越强大越能区分替代数据与真实数据导致交集缩小任何扩大交集的尝试都会削弱模型能力 [6] - 替代数据优化针对特定场景无法保证在新场景下的匹配度模型的泛化能力反而成为推广到新场景时的累赘 [7] 真实数据的重要性 - 构建机器人基础模型必须依赖真实数据才能实现像LLM和VLM在虚拟世界中的广泛泛化能力 [11] - 替代数据应作为辅助知识源用于了解"世界可能发生什么" 而非"智能体该怎么做"的直接指令 [12] - 在大量真实机器人经验基础上加入人类数据或模拟数据等多样化来源比完全回避真实数据更有效 [11] 勺叉现象的普遍性 - "勺叉"现象不仅存在于数据替代方案还包括混合系统手工约束学习系统等方法都试图用人工设计应对训练不充分问题 [13] - 手工设计的归纳偏置会成为性能瓶颈违背机器学习通过数据驱动获取能力的核心优势 [13]