什么构成“坏数据” - 脏数据是指不完整、不准确、过时或重复的信息,会对组织造成严重破坏,滋生不信任、浪费资源并损害决策 [1] - 数据质量差每年给企业造成数百万美元的损失,导致销售团队追踪无效线索、财务报告错误以及营销活动目标受众错误 [2] - 基于错误数据做出的决策会使整个公司偏离正轨,导致错失良机、资源错配和战略失误,在医疗和金融等行业可能引发严重后果 [2] - 脏数据问题几乎在每个组织中都持续存在,根本原因通常是数据治理实践不善、系统孤立以及缺乏责任感 [3] - 许多公司将数据视为业务运营的副产品,而非需要精心呵护和维护的资产 [3] 数据质量差的影响与成本 - 糟糕的数据质量像一颗定时炸弹,其隐性成本会迅速失控,后果远不止几份错误报告 [6] - 当数据不可靠时,整个组织对数据的信任度下降,导致决策者质疑报告,各部门自行其是 [6] - 催生出“影子数据团队”,即非官方、分散的团队基于自认为更可信的数据构建自己的报告和指标,游离于标准数据治理结构之外 [6] - 影子数据团队导致对事实的不同解读,使销售、市场和财务部门基于不一致的数据做决策,阻碍协作并造成效率低下 [7] - 影子数据团队缺乏适当监督,可能导致数据被不当处理或误解,引发潜在的法律或监管后果 [7] - 研究表明,糟糕的数据每年可能导致企业损失数百万美元,包括生产力下降、运营效率低下和错失良机 [7] - 数据质量差会滋生不信任的文化,员工更关注证明自己的业绩,而非齐心协力实现共同目标 [7] 清理不良数据的解决方案 - 解决方案始于强有力的数据治理,在整个企业范围内建立清晰的政策、标准和问责机制 [9] - 采用数据治理框架,制定数据收集、存储和更新的规则,确保数据在其生命周期每个阶段(涵盖人员、流程和技术)的质量 [9] - 投资数据清洗工具,自动检测、清洗和标记脏数据,以维护高质量数据集并减少人工工作 [9] - 让数据质量成为每个人的责任,跨部门协作至关重要,市场营销、销售、运营和财务部门都需要干净的数据 [9] - 从小处着手,衡量成效,逐步扩大规模,首先清理优先级高、能够清晰衡量影响并快速见效的领域 [9] 治理框架的人员视角 - 数据质量应成为所有知识工作者的必备素质,而不仅仅是IT或数据团队的责任 [10] - 修复错误数据的责任往往被推给数据团队,导致他们陷入无休止的善后工作,而非从源头预防错误 [11] - 根本原因是数据被视为一种技术资产,而非共同的业务责任,数据使用与责任之间存在差距 [12] - 解决方案是将数据质量融入到每个角色中,从被动应对转变为主动出击 [13] - 具体措施包括:将数据质量与绩效指标挂钩;将数据素养作为一项核心技能进行培训;从数据所有权转向数据问责制;将数据质量融入工作流程,实施自动化验证和实时反馈;由高层领导引领,培育数据驱动型文化 [16] - 成功将数据质量融入企业各个岗位的组织将获得更快的决策速度、更低的风险以及更高的客户信任度 [13] 治理框架的流程视角 - 数据治理必须发展成为一个自我维持的功能,确保每一项投资都能产生切实回报,并能适应变化的商业环境和技术进步 [14] - 关键步骤包括:使指标与业务目标保持一致;明确所有权和领域边界;持续评估和重新定义不断变化的业务目标 [14] - 组织需要制定与总体业务目标相符的具体、可衡量的目标,并配备关键绩效指标 (KPI) 来跟踪进展 [15] - 将业务关键绩效指标与数据治理绩效挂钩至关重要,以展示对收入增长、成本降低和运营效率提升等最终收益的直接影响 [17] - 赋予组织内部人员数据管理员的权力,负责确保各自领域内的数据质量和治理 [18] - 利用技术和自动化工具可以简化数据治理流程,减少人工工作量并提高效率 [18] - 组织必须定期评估其流程,征求反馈意见,并适应不断变化的业务需求和行业标准 [19] 治理框架的技术视角 - 新的技术栈本身无法解决未定义数据所有权、相互冲突的关键绩效指标以及业务团队各自为政等问题 [20] - 如果流程存在缺陷、治理不清、文化抵制,那么最好的平台只会让情况变得更糟,成本更高 [22] - “技术优先”思维的陷阱在于工具容易购买和演示,但数据战略关乎如何运作,而非购买什么 [23] - 平台可以整理元数据,但无法解决“客户”定义的冲突;人工智能模型可以处理数据,但无法使销售和财务部门围绕相同的KPI开展工作;云数据仓库可以集中数据,但无法说服业务团队共享数据 [24] - 真正的数据平台战略应从员工开始,明确要解决的业务问题,明确责任归属,制定实现价值所需的最低规则,然后才大规模引入技术以增强工作流程 [25] - 投资数据治理技术的时机应考虑数据环境的复杂性、数据治理成熟度、监管合规要求、数据质量问题、业务增长与扩张、高管认可与支持以及成本效益分析等因素 [26][27] - 进行成本效益分析以确定实施数据治理工具的潜在投资回报率 (ROI),评估前期成本、持续维护费用、预期生产力提升、风险降低和合规成本节省等因素 [28]
数据治理框架:贯穿人员、流程和技术的三重要素
36氪·2025-12-25 17:44