Workflow
数据准确性
icon
搜索文档
美国年度消费者支出数据将推迟发布,美劳工统计局“罕见”拒绝解释原因
华尔街见闻· 2025-09-20 10:32
数据发布推迟事件 - 美国劳工统计局突然宣布将原定下周二发布的2024年度消费者支出数据重新安排至稍后日期 未解释原因也未提供新发布时间表 [1] - 此次数据发布的推迟异乎寻常 公告仅提及延期但未提供任何背景说明 其上级部门美国劳工部也未对此事发表评论 [4] - 此次推迟与去年情况形成对比 去年延迟发布时美国劳工统计局明确说明了新发布日期并解释延迟原因为需要修正错误 [5] 年度消费者支出数据的重要性 - 该年度报告是美国政府唯一提供消费者支出和收入完整信息的家庭调查数据 涵盖消费者活动、支出、收入和人口统计信息 [3] - 该数据用于确定来年消费者价格指数中特定商品和服务的权重 [3] - 2023年数据显示所有消费者单位平均支出为77,280美元 较2022年增长5.9% 税前收入增长8.3% [3] 对数据延迟的分析与影响 - 分析人士指出如果年度数据能在年底前最终确定 则有充足时间在2026年2月中旬发布2026年1月CPI时纳入新权重 [6] - 前美国劳工统计局局长认为延迟可能仅因发布工作未完全准备好 但如果出现进一步延迟才会感到担忧 [6] 美国劳工统计局面临的挑战 - 该机构正面临政治压力、人员短缺和资源有限的困境 [7] - 上个月美国就业数据出现大幅下修证实劳动力市场放缓后 特朗普总统解雇了时任局长 [7] - 劳工部内部的监察机构已启动对该机构经济数据收集工作的调查 理由是其遇到挑战 [7] - 由于人手和预算问题 美国劳工统计局已经削减了部分CPI分类和特定地区的数据收集工作 [8] - 美国统计局普遍面临调查回复率骤降问题 对就业等数据的准确性造成严重破坏 [9]
独家洞察 | RAG如何提升人工智能准确性
慧甚FactSet· 2025-06-10 13:12
生成式人工智能在金融服务业的应用 - 数据准确性是金融服务公司使用生成式人工智能和大语言模型的最关键要求之一 不准确、低质量或脱节的数据会影响公司战略、运营、风险管理和合规 [1] - 文章探讨AI数据不准确的主要原因以及检索增强生成在缓解这一问题中的作用 [3] 数据不准确的主要原因 - 幻觉是导致数据不准确的主要原因之一 表现为模型生成看似可信但实际错误、误导或虚构的文本 这是由于大语言模型基于训练数据预测文本而非事实核查 [4] - 数据录入和验证错误:手动录入财务数据和质量检查不足可能导致转录错误、数据不完整、格式错误或丢失 [5] - 信息过时:缺乏定期管理会导致数据劣化 进而产生不准确分析和误导决策 [5] - 集成问题:旧系统与新技术衔接不畅造成信息不匹配或丢失 [5] - 数据标准不一致:不同部门采用不同治理标准或格式 导致信息难以整合或比较 [5] 检索增强生成(RAG)的重要性 - RAG是提高生成式人工智能准确性、减少幻觉的关键技术 通过为提示语添加上下文将生成回答与真实数据结合 [6] - RAG结合大语言模型的生成能力与有效数据检索系统 例如可提供上市公司具体投资风险并链接来源如10-Q报告 [6] - RAG可同时处理非结构化和结构化数据 统一呈现信息 连接旧系统和数据孤岛作为知识源 无需耗时迁移或重新训练模型 [7] RAG的益处 - 无需重新训练或优化调整大语言模型 [8] - 基于专有数据的回答更准确 幻觉更少 [8] - 提供回答内容来源 更具可审核性 [8] - 可集成最新知识和用户权限管理 [8] 金融业前沿应用 - 从证券到资产管理领域均有案例 [8]