替代数据
搜索文档
美联邦政府“长假”追平纪录 信息断崖,美联储也“雾中行车”
搜狐财经· 2025-11-05 01:14
美国政府停摆导致经济数据发布停滞 - 美国政府停摆进入第35天,追平历史最长纪录,导致人口普查局、劳工统计局和经济分析局等关键数据机构暂停大部分工作[1][4] - 建筑支出、工厂订单、就业报告、贸易差额、零售销售、生产者物价指数及新屋开工与销售等关键经济数据已无限期延后发布[4] - 原定10月15日发布的消费者物价指数被推迟至10月24日,但下一次CPI数据可能历史上首次不会发布[4] 美联储决策面临信息真空 - 美联储主席鲍威尔将当前决策处境比作"在浓雾中行车",暗示或需"减速"前行[1] - 美联储在缺乏关键就业数据的情况下召开利率决议会议,难以精准感知经济状况[1] - 若12月议息会议时经济前景不确定性仍非常高,可能成为美联储谨慎行动的理由[5] 市场转向依赖替代数据源 - 投资者和政策制定者转而密切关注工资单数据、信用卡消费、餐厅预订、百老汇票房及自由女神像游客数量等替代性指标[1] - 对私营部门数据的需求显著增强,Indeed上与数据相关的咨询数量近日已翻倍[6] - 凯雷集团全球研究与投资策略主管指出当前市场对替代数据来源的兴趣明显增强[6] 私营机构积极填补数据空白 - ADP研究公司每月基于超过2600万名员工样本发布私营部门工资单估算[5] - 全美房地产经纪人协会正考虑对其150万会员启动更广泛调查,将数据收集范围延伸至失业、工资等领域[7] - 招聘网站Indeed、私人数据提供商Revelio Labs、私募巨头凯雷集团与美国银行定期更新劳动力市场动态和薪资增长估算[5] 替代数据的局限性引发担忧 - 分析人士警告私营部门调查不应被过度解读或赋予过高权重,因其计算方式可能不可靠[1][2] - 美国劳工统计局前局长指出私人数据虽更及时细致,但根本上仍依赖于联邦数据进行重新加权以代表全体人口[7] - 瑞银集团首席经济学家认为在缺乏权威数据时,人们可能对私营数据结果赋予不应有的可信度,调查回复率下降及政治极化加剧了可靠性问题[8] 不同数据源呈现矛盾经济图景 - ADP报告显示9月私营企业削减职位,但其新的周度数据又显示10月初有所回升[9] - Revelio Labs的数据认为招聘虽降温但从未暂停,各州层面发布的失业救济申请数据增加幅度相对温和[9] - 耶鲁大学预算实验室执行主任表示私营部门数据表明劳动力市场以令人担忧的方式放缓,但难以判断哪项数据准确[9]
Alternative labor data validating slow down, points to more Fed easing, says BlackRock's Rosenberg
Youtube· 2025-10-08 05:30
固定收益市场展望 - 全球固定收益市场的核心主题是“脱节”,即全球经济的非同步性,不同经济体的央行在各自通胀环境下采取不同政策[3] - 当前投资机会在于欧洲处于降息周期尾声而美国处于降息周期中段,这为美国市场带来投资机会[4] - 收益率曲线呈现陡峭化走势,长端收益率相对短端上升,估值改善,因此在投资组合中增加长端配置[5] 投资策略与偏好 - 强调投资重点集中在收益率曲线的短端至中端,但年内长端估值已改善,可适度增加配置[4][5] - 市政债券提供极具吸引力的收益率溢价,其收益率曲线的陡峭化程度甚至优于国债,被视为投资者的机会[9] - 在不确定性环境下,投资者寻求国债等传统安全资产,但曲线长端因财政政策、债务和赤字问题存在不确定性[11] 数据与市场分析 - 在政府停摆导致官方数据缺失的背景下,转向使用替代数据来评估宏观经济环境,特别是劳动力市场数据[6][7] - 替代数据如职位发布数据和工资数据有效性高,目前验证了经济放缓趋势,这已反映在市场定价和美联储继续宽松的预期中[8] - 美元整体走弱及对替代性避险资产的寻求,是推动黄金等资产表现的重要因素[10] 黄金市场驱动因素 - 美元走弱以及对替代价值储存手段的寻求,使黄金成为主要受益者[10][12] - 通胀并未实质性下降,而美联储降息的预期和现实均已减弱,导致实际利率下降,这通常对金价构成支撑[12] - 当固定收益提供的实际收入替代选择下降时,黄金吸引力上升[12]
Government shutdown leaves investors in a data void. Here's how they get around it.
MarketWatch· 2025-10-04 02:29
行业趋势 - 投资者正转向所谓的另类数据和其他资源以把握美国劳动力市场和经济状况 [1]
新加坡媒体:美劳工统计局局长被解雇后,美政府数据真实性遭质疑
环球时报· 2025-09-01 07:02
政府数据独立性受挑战 - 美国总统特朗普解雇劳工统计局局长并提名保守派经济学家E J 安东尼 后者曾提出暂停发布就业数据[1] - 劳工统计局拥有庞大专业团队和多重数据检查机制 局长无法单方面伪造数据[2] - 政府采取系列措施逐步削弱经济数据质量与独立性 包括解雇官员和更换负责人[1][2] 关键经济数据面临缺失风险 - 就业数据作为核心经济指标 反映每月新增或流失岗位数量 若缺失将影响数百万人评估经济状况[1] - 因大规模裁员导致8000多个政府网页和数百个数据集消失 学术界启动"数据拯救项目"保全数据[3] - 政府预算削减导致员工裁减 调查样本减少和更新放缓 数据准确性下降却反被政府指责不可靠[3] 替代数据应用存在局限性 - 部分对冲基金使用卫星图像数据预测企业业绩 如通过沃尔玛停车场汽车数量预测季度销售额[4] - 卫星数据在原油等数万亿美元市场已替代政府数据 但对其他宏观经济领域覆盖有限[4] - 替代数据获取成本高昂 仅限财力雄厚投资者使用 造成市场公平性问题 且短期内无法取代传统统计数据[4] 数据公共属性遭受侵蚀 - 劳动力市场 通货膨胀和GDP等关键数据作为公共产品原由政府收集发布[3] - 高质量数据对政策制定至关重要 如美联储依据就业和通胀数据制定利率政策[3] - 数据消失导致公共资源流失 而替代数据无法面向全体公众开放共享[3][4]
Jinqiu Select | Physical Intelligence 联创:AI训练的真实数据不可替代
锦秋集· 2025-07-22 23:04
核心观点 - 过度依赖替代数据源会严重限制AI模型的最终能力 真正的技术突破必须建立在真实数据基础之上 [1] - 当前AI研究面临"勺叉困境":试图用模拟器 人类视频或手持设备等廉价替代方案训练机器人 结果导致模型在真实场景中表现不佳 [1][3] - 机器学习的铁律是训练数据必须与测试条件相匹配 替代数据无法完全替代真实数据在物理世界中的实践 [10] 权宜之计的替代方案 - **模拟训练**:通过sim-to-real方法在模拟环境中训练机器人 但最佳模拟往往不是精确复现现实 而是编码机器人需要应对的各种变化 [3] - **人类视频学习**:需定义人机对应关系 但需弥合人类动作与机器人动作在动力学和外观上的差异 [3] - **手持夹爪设备**:让人们使用模仿机器人夹爪的设备收集数据 但仍受限于设备的工作空间和运动学差异 [3] 替代方案的局限性 - 替代数据将模型限制在三个条件的交集中:系统有效行为 能用替代方法实现的行为 不会暴露领域差异的行为 [4] - 模型越强大 越能区分替代数据与真实数据 导致交集缩小 任何扩大交集的尝试都会削弱模型能力 [6] - 替代数据优化针对特定场景 无法保证在新场景下的匹配度 模型的泛化能力反而成为推广到新场景时的累赘 [7] 真实数据的重要性 - 构建机器人基础模型必须依赖真实数据 才能实现像LLM和VLM在虚拟世界中的广泛泛化能力 [11] - 替代数据应作为辅助知识源 用于了解"世界可能发生什么" 而非"智能体该怎么做"的直接指令 [12] - 在大量真实机器人经验基础上 加入人类数据或模拟数据等多样化来源 比完全回避真实数据更有效 [11] 勺叉现象的普遍性 - "勺叉"现象不仅存在于数据替代方案 还包括混合系统 手工约束学习系统等方法 都试图用人工设计应对训练不充分问题 [13] - 手工设计的归纳偏置会成为性能瓶颈 违背机器学习通过数据驱动获取能力的核心优势 [13]
关于机器人数据,强化学习大佬Sergey Levine刚刚写了篇好文章
机器之心· 2025-07-22 12:25
大模型训练数据挑战 - 训练大模型难度随规模扩大和应用领域拓展而增加,需要海量数据[2] - 不同类型模型对数据需求差异显著:LLM依赖文本、VLM需图文结合、VLA要求真实机器人行动数据[3] - Agent训练需带行动标签的真实交互数据,成本远高于网页文本/图像采集[4] 替代数据方案探索 - 研究者尝试通过仿真、人类视频、手持夹爪设备等低成本方案替代真实数据[8][10][12][13] - 仿真方案通过人为设计训练环境并引入随机变化提升鲁棒性,但高度依赖预设条件[11] - 人类视频方案需建立人体-机器人动作映射,受限于动力学差异和预设策略[12] 替代数据局限性 - 所有替代方案本质是妥协,会削弱模型本应具备的泛化能力[14] - 模型能力越强,越容易识别替代数据与真实领域差异,导致有效策略空间缩小[19][23] - 信息隐藏手段(如限制观察空间)会损害模型整合复杂信息的关键优势[20][21] 真实数据不可替代性 - 替代数据仅在特定假设场景有效,无法像真实数据那样揭示世界运行机制[33][34] - 机器人基础模型要具备物理世界泛化能力,必须依赖真实世界数据[36] - 替代数据应定位为辅助知识来源,而非主要训练数据[37][38] 通用AI研发启示 - "叉勺"式方案(如混合系统、人工约束)虽能降低数据需求,但会成为性能瓶颈[41][43] - 人工设计的归纳偏置会限制自主学习系统的扩展潜力[42][44] - 当前替代数据方案使机器人学习人类解决方式,而非发展自主策略[26][27]