Workflow
千亿级推理大模型
icon
搜索文档
单卡部署千亿大模型!江苏银行人工智能产能跃升
中金在线· 2025-08-28 09:20
技术突破与部署 - 公司依托国产芯片混合算力架构实现单张GPU计算卡千亿级推理大模型的规模化部署 [1] - 通过完全自主编译与适配构建新一代技术架构框架 成功兼容MXFP4量化算法 [1] - 相较传统方案实现计算性能3倍加速与硬件资源占用减少75%的优化 [1] 应用场景与效率提升 - 千亿大模型构建具备多种能力的智能体 在业务材料录入与审核场景率先落地 [1] - 电子流水授信材料鉴伪场景中智能体通过自动化匹配规则及工具链调用 实现图片细节定位/二值化处理/元数据比对及外部机构交叉验证 [1] - 针对询证函填写及商户进件场景 智能体调度多模态识别工具完成文本抽取与结构化表单生成 [1] - 智能体已累计处理业务数万笔 实现运营效率显著提升 [2] 战略意义与未来规划 - 国产算力底座实践验证支撑金融核心智能场景的可行性 提供更安全可控的技术路径 [2] - 公司将持续深化人工智能技术研究 构建全栈自主技术体系 推动科技与业务深度融合 [2] - 通过拓展大模型在数字化经营与风控等领域场景赋能 打造基于国产算力的人工智能驱动金融新生态 [2]