How M&T Bank ensures data quality as it implements gen AI
M&TM&T(US:MTB) American Banker·2025-09-19 02:03

生成式AI在银行业的应用与价值 - 银行日益重视为生成式AI模型提供准确、相关且来源可信的数据[1] - 生成式AI与数据紧密耦合,其成功部署依赖于可信的数据[2] - M&T银行有22,000名员工,其中16,000名使用Microsoft Copilot生成AI模型来撰写邮件和报告的初稿,并总结呼叫中心对话[7] - 生成式AI能够提升人类效率,使工作更好、更快、更强,例如总结通话内容可为每次通话节省约6分钟[9] - 在大多数用例中,生成式AI可完成60%的工作,再由人工审查并完成剩余的40%[8] - 员工对该工具依赖度高,在试点项目暂停时收到强烈反对,认为其具有变革性[9] 数据溯源的重要性与风险 - 数据溯源是指维护数据生命周期的详细记录,展示其从源头到最终目的地的完整旅程[1] - 缺乏适当的数据溯源和治理会导致生成式AI出错,例如加拿大航空聊天机器人提供错误折扣信息的事件[3][4] - 对于银行而言,数据溯源失败或疏忽会带来合规、运营和声誉风险,最坏情况可能导致诉讼、品牌声誉受损以及对公司财务的负面影响[4][5] - 数据溯源是银行的一项核心能力,旨在确保了解数据的来源、用途以及如何使其达到可被分析的水平[12] M&T银行的AI与数据战略实施 - M&T银行的首席数据官职责包括定义和执行银行的AI战略与数据战略[2] - 银行最初因安全考虑阻止员工使用大型语言模型,后选择Microsoft Copilot作为稳定、强大的合作伙伴[6][7] - 银行建立了名为Edison的存储库,包含所有银行政策的权威文件和数据[13] - 银行部署了来自Solidatus和Monte Carlo的数据溯源软件,以加速数据溯源生产并创建单一数据存储库[14] - 该银行通过检索增强生成技术将生成式AI模型的训练数据限制在内部受治理的数据范围内[18] - 银行希望数据溯源软件能与Microsoft集成,使从业务部门开始的数据溯源能持续通过Copilot体现[18] 数据治理与技术整合 - 数据溯源软件Solidatus可与数据库、应用程序以及Microsoft Power BI和Tableau等商业智能工具集成[14][15] - 该软件最具挑战性的整合对象是大型机应用程序,需要通过集成来解读COBOL等语言以捕获真实的数据流[16] - 数据治理是数据溯源的关键,明确数据的所有权、管理责任以及来源和消耗的问责制至关重要[21] - 加强数据溯源的技术方法包括自动化元数据捕获以及追踪进出生成式AI模型的数据的可追溯性[21] - 清晰的政策和强化这些政策的培训非常重要[21]