替代数据
搜索文档
美联邦政府“长假”追平纪录 信息断崖,美联储也“雾中行车”
搜狐财经· 2025-11-05 01:14
大量官方数据的"停产"使得市场参与者与政策制定者面临前所未有的信息真空。上周(10月29日),美 联储不得不在缺乏关键就业数据的情况下召开利率决议会议。 美联储主席鲍威尔(Jerome H. Powell)在会后的发布会上直言,政府停摆导致关键数据缺失,这使美 国联邦储备公开市场委员会难以像往常那样精准感知经济状况。他将当前的决策处境比作"在浓雾中行 车",并暗示在此情况下,美联储或需"减速"前行。 在这一信息断崖的背景下,投资者和政策制定者不得不转而依赖各类非官方调查,试图从中捕捉经济基 本面的真实动向。他们开始密切关注工资单数据、信用卡消费动态、餐厅预订情况、百老汇票房表现, 甚至自由女神像的游客数量等替代性指标。 然而,分析人士也同时警告,尽管一些来自私营部门的调查在当前环境中具备一定参考价值,却不应被 过度解读或赋予过高权重。 例如,全球投资咨询公司BCA研究银行信贷部门主管拉贝奇(Jonathan Laberge)在4日的研讨会上告诉 第一财经记者,衡量AI商业化采用的一个主要指标是美国人口普查局发布的商业趋势和展望调查 (BTOS),但由于政府关门,这项调查的数据暂时中断。"其他公司也有提供AI采 ...
Alternative labor data validating slow down, points to more Fed easing, says BlackRock's Rosenberg
Youtube· 2025-10-08 05:30
shutdown drags on. Increasingly, investors are seeking safety. We told you about the big gains for gold.Many are buying Bitcoin. Where should bonds fit into the equation. Where should fixed income in general fit into the equation.Well, joining us now with his fixed income outlook for the fourth quarter is Jeff Rosenberg, portfolio manager for Black Rockck Systematic Multistrategy Fund. It's great to have you here on set. >> Great to be here.Thanks. >> Let's start right there. You just put out your Q4 outloo ...
Government shutdown leaves investors in a data void. Here's how they get around it.
MarketWatch· 2025-10-04 02:29
行业趋势 - 投资者正转向所谓的另类数据和其他资源以把握美国劳动力市场和经济状况 [1]
新加坡媒体:美劳工统计局局长被解雇后,美政府数据真实性遭质疑
环球时报· 2025-09-01 07:02
政府数据独立性受挑战 - 美国总统特朗普解雇劳工统计局局长并提名保守派经济学家E J 安东尼 后者曾提出暂停发布就业数据[1] - 劳工统计局拥有庞大专业团队和多重数据检查机制 局长无法单方面伪造数据[2] - 政府采取系列措施逐步削弱经济数据质量与独立性 包括解雇官员和更换负责人[1][2] 关键经济数据面临缺失风险 - 就业数据作为核心经济指标 反映每月新增或流失岗位数量 若缺失将影响数百万人评估经济状况[1] - 因大规模裁员导致8000多个政府网页和数百个数据集消失 学术界启动"数据拯救项目"保全数据[3] - 政府预算削减导致员工裁减 调查样本减少和更新放缓 数据准确性下降却反被政府指责不可靠[3] 替代数据应用存在局限性 - 部分对冲基金使用卫星图像数据预测企业业绩 如通过沃尔玛停车场汽车数量预测季度销售额[4] - 卫星数据在原油等数万亿美元市场已替代政府数据 但对其他宏观经济领域覆盖有限[4] - 替代数据获取成本高昂 仅限财力雄厚投资者使用 造成市场公平性问题 且短期内无法取代传统统计数据[4] 数据公共属性遭受侵蚀 - 劳动力市场 通货膨胀和GDP等关键数据作为公共产品原由政府收集发布[3] - 高质量数据对政策制定至关重要 如美联储依据就业和通胀数据制定利率政策[3] - 数据消失导致公共资源流失 而替代数据无法面向全体公众开放共享[3][4]
Jinqiu Select | Physical Intelligence 联创:AI训练的真实数据不可替代
锦秋集· 2025-07-22 23:04
核心观点 - 过度依赖替代数据源会严重限制AI模型的最终能力 真正的技术突破必须建立在真实数据基础之上 [1] - 当前AI研究面临"勺叉困境":试图用模拟器 人类视频或手持设备等廉价替代方案训练机器人 结果导致模型在真实场景中表现不佳 [1][3] - 机器学习的铁律是训练数据必须与测试条件相匹配 替代数据无法完全替代真实数据在物理世界中的实践 [10] 权宜之计的替代方案 - **模拟训练**:通过sim-to-real方法在模拟环境中训练机器人 但最佳模拟往往不是精确复现现实 而是编码机器人需要应对的各种变化 [3] - **人类视频学习**:需定义人机对应关系 但需弥合人类动作与机器人动作在动力学和外观上的差异 [3] - **手持夹爪设备**:让人们使用模仿机器人夹爪的设备收集数据 但仍受限于设备的工作空间和运动学差异 [3] 替代方案的局限性 - 替代数据将模型限制在三个条件的交集中:系统有效行为 能用替代方法实现的行为 不会暴露领域差异的行为 [4] - 模型越强大 越能区分替代数据与真实数据 导致交集缩小 任何扩大交集的尝试都会削弱模型能力 [6] - 替代数据优化针对特定场景 无法保证在新场景下的匹配度 模型的泛化能力反而成为推广到新场景时的累赘 [7] 真实数据的重要性 - 构建机器人基础模型必须依赖真实数据 才能实现像LLM和VLM在虚拟世界中的广泛泛化能力 [11] - 替代数据应作为辅助知识源 用于了解"世界可能发生什么" 而非"智能体该怎么做"的直接指令 [12] - 在大量真实机器人经验基础上 加入人类数据或模拟数据等多样化来源 比完全回避真实数据更有效 [11] 勺叉现象的普遍性 - "勺叉"现象不仅存在于数据替代方案 还包括混合系统 手工约束学习系统等方法 都试图用人工设计应对训练不充分问题 [13] - 手工设计的归纳偏置会成为性能瓶颈 违背机器学习通过数据驱动获取能力的核心优势 [13]
关于机器人数据,强化学习大佬Sergey Levine刚刚写了篇好文章
机器之心· 2025-07-22 12:25
大模型训练数据挑战 - 训练大模型难度随规模扩大和应用领域拓展而增加,需要海量数据[2] - 不同类型模型对数据需求差异显著:LLM依赖文本、VLM需图文结合、VLA要求真实机器人行动数据[3] - Agent训练需带行动标签的真实交互数据,成本远高于网页文本/图像采集[4] 替代数据方案探索 - 研究者尝试通过仿真、人类视频、手持夹爪设备等低成本方案替代真实数据[8][10][12][13] - 仿真方案通过人为设计训练环境并引入随机变化提升鲁棒性,但高度依赖预设条件[11] - 人类视频方案需建立人体-机器人动作映射,受限于动力学差异和预设策略[12] 替代数据局限性 - 所有替代方案本质是妥协,会削弱模型本应具备的泛化能力[14] - 模型能力越强,越容易识别替代数据与真实领域差异,导致有效策略空间缩小[19][23] - 信息隐藏手段(如限制观察空间)会损害模型整合复杂信息的关键优势[20][21] 真实数据不可替代性 - 替代数据仅在特定假设场景有效,无法像真实数据那样揭示世界运行机制[33][34] - 机器人基础模型要具备物理世界泛化能力,必须依赖真实世界数据[36] - 替代数据应定位为辅助知识来源,而非主要训练数据[37][38] 通用AI研发启示 - "叉勺"式方案(如混合系统、人工约束)虽能降低数据需求,但会成为性能瓶颈[41][43] - 人工设计的归纳偏置会限制自主学习系统的扩展潜力[42][44] - 当前替代数据方案使机器人学习人类解决方式,而非发展自主策略[26][27]