全栈自研大模型技术体系,招商银行“金融为民”的AI实践
经济观察报·2026-02-12 18:42

获奖与战略定位 - 公司在2025深圳金融创新大赛中,凭借大模型全栈技术体系与金融业务深度融合的系统性创新,荣获一等奖 [2] - 公司的创新项目并非单一技术突破,而是涵盖了从底层基础设施到上层业务应用的全链条创新 [2] - 公司提出“AI First”战略,围绕大模型全栈自研技术体系与全业务场景深度融合两条主线协同推进,旨在构建安全、可靠、高效的智慧金融样本 [2] - 公司选择通过自主构建大模型技术体系,将人工智能能力深入渗透至业务核心环节,而非行业内常见的单点技术合作或场景试点 [2] 技术体系架构与创新 - 公司探索并率先自主研发大模型全栈技术体系,为行业从“单点智能”迈向“体系智能”贡献实践范式 [3] - 技术体系围绕“基础设施—模型—应用”三层构筑:基础设施层通过全栈自研建成全面领先的大模型基础设施;模型层构建了通用模型与领域专精模型的模型矩阵;应用层打造了高效的应用开发工具体系,加速智能体应用规模化落地 [3] - 在关键技术环节实现多项突破:自研智算云底座实现秒级调度与统一纳管,并通过动态网络拓扑感知方案显著提升大容量集群的训推效率 [3] - 通过自研高性能融合算子,实现异构算力卡推理吞吐量的倍级跃升 [3] - 针对多模态与长上下文需求,创新落地大规模PD分离架构,结合KV Cache池化、PrefixCache、SuffixDecoding等技术,通过存算解耦机制有效突破硬件“显存墙”限制 [3] - 对视觉编码器进行优化,实现跨模态交互的端到端极致加速 [3] 开源生态贡献 - 公司积极参与开源生态建设,累计向多个主流开源项目贡献关键特性数十个 [4] - 公司凭借促进行业技术生态发展,获得两大主流开源项目的维护者资格,是国内金融机构中领先的一家 [4] - 在AI底座方面,与开源社区合作主导解决超节点调度问题 [4] - 在推理方面,首发实现LoRA核心算子优化、Qwen3-Next混合注意力模型加速、CANN社区sum_lstm等算子研发优化等多个关键特性 [4] - 在训练方面,首发实现分组前缀复用功能、RMSNorm、RotaryPosEmb、MoE_Block、TiledMLP主流算子优化等,大幅提升模型训练效率 [4] - 公司的实践为行业提供了成熟、可靠且可演进的技术方法论,为推动开放、创新的技术生态贡献了重要力量 [4] 业务场景应用与价值 - 公司通过系统的场景梳理方法,已识别出超过1000个具有业务价值的潜在场景,并在零售、对公、风控、投金、办公及研发等多个领域落地了数百项大模型应用 [6] - 在客户服务一线,客户经理使用的“投研小助”工具,能够快速完成市场数据的量化分析和产品筛选,将以往耗时数小时的研报整理工作缩短至几分钟内生成清晰的分析要点 [6] - 在技术开发领域,自研的“研发智能体”可协助工程师完成日常开发任务,通过理解自然语言指令、感知编程环境、调用相关工具,每月可自动处理超过9万个开发任务,加速了产品迭代 [6] 客户体验与普惠金融 - 公司将技术创新深度融入服务全流程,推动金融服务朝着更国际化、更普惠的方向发展 [7] - 为方便外籍人士,招商银行App提供了多语种实时翻译功能,关键操作界面和产品信息可一键切换语言,大幅降低了外籍客户的使用门槛 [7] - 针对中国企业“出海”需求,运用AI技术重塑跨境服务流程,通过智能文档处理与风控模型,将传统开户与尽调流程压缩至原来的三分之一左右,在提升效率的同时增强了跨境业务的风控能力 [7] - 在普惠金融方面,推出了支持语音交互的“小招语控”系统,实现“一句话办理业务” [7] - 通过多模态技术,将复杂的理财产品图示转化为语音提示,协助视障用户独立完成理财操作 [7] - “电话小招”AI助手已支持超过300个业务场景的语音服务,方便了老年客户及方言使用者 [7]