Workflow
金融大模型评测体系
icon
搜索文档
2025金融大模型评测体系在沪发布,引领智能金融高质量发展
国际金融报· 2025-12-27 18:57
事件概述 - 2024年12月26日,上海人工智能实验室与上海库帕思科技有限公司联合主办“2025金融大模型评测体系发布会” [1] - 活动在上海市委金融办、市委网信办、市经信委及徐汇区人民政府指导下举办,汇聚了来自金融机构、行业协会、高校、科研院所等百余位代表 [6] 核心观点与意义 - 人工智能正在深刻重塑金融行业发展格局,大模型技术在应用场景深化、关键要素强化和应用生态协同推进三方面加速赋能 [1] - 评测体系的全面升级将助力上海建设具有全球影响力的金融科技中心 [1] - 标志着“人工智能+金融”进入高质量发展的新阶段,是上海深化“模塑申城”工程在金融领域落地的关键一环 [6] - 随着评测体系的广泛应用,金融行业将迎来更高质量、更可信赖的智能化转型新阶段 [6] 评测体系内容与升级 - 正式启动“2025金融大模型评测体系暨金融评测基准” [3] - 评测体系在标准引领、数据驱动、安全可信与生态共建四大维度实现全面升级 [3] - 首次构建覆盖金融全场景的评测基线,为行业提供统一、权威、可操作的技术评估框架 [3] - 评测体系汇聚了4个公开数据集与22个自建数据集,约3.6万条评测数据 [5] - 评测过程坚持科学与鲁棒,采用循环选项打乱机制和多样化提示词,并研发金融裁判大模型,实现评测全流程自动化、标准化 [5] 发布成果与报告 - 现场发布《金融大模型应用评测报告(2025)》与《金融大模型评测数据集(2025)》 [5] - 报告基于真实金融业务场景构建评测任务,探索金融垂直领域大模型应用的新理念、新机制与新手段 [5] - 报告将有效支撑金融机构科学选型、降本增效,加速大模型在投研、风控、客服等核心环节的规模化落地 [5] 评测体系的应用价值 - 为上海金融领域银行、券商、基金、投资等企业或机构提供权威、精准的大模型能力评估 [5] - 助力金融机构进行模型选型、优化及风险把控 [5] - 该体系是去年发布的全国首个“以金融业务为中心”的金融大模型评测体系的全面升级,为行业提供了科学选型与能力对标的重要“标尺” [1] 行业讨论与生态构建 - 在圆桌论坛上,嘉宾深入探讨了金融语料治理、模型安全、评测标准国际化等前沿议题 [5] - 强调需通过产学研协同,构建开放、安全、可持续的金融AI生态 [5]