2025金融大模型评测体系在沪发布
新华财经·2025-12-27 21:17

文章核心观点 - 上海人工智能实验室与库帕思科技联合发布了全面升级的“2025金融大模型评测体系暨金融评测基准” 该体系旨在为金融行业提供统一、权威、可操作的技术评估框架 推动金融行业更高质量、更可信赖的智能化转型 [1] - 该评测体系是上海深化“模塑申城”工程在金融领域落地的关键一环 将助力上海建设具有全球影响力的金融科技中心 [1] - 评测体系在标准引领、数据驱动、安全可信与生态共建四大维度实现全面升级 并首次构建覆盖金融全场景的评测基线 [1] 评测体系技术细节与数据 - 评测体系汇聚了4个公开数据集与22个自建数据集 包含约3.6万条评测数据 [2] - 评测过程坚持科学与鲁棒 采用循环选项打乱机制和多样化提示词 [2] - 研发了金融裁判大模型 实现了评测全流程的自动化与标准化 [2] 评测体系的应用与价值 - 该体系为金融领域银行、券商、基金、投资等企业或机构提供权威、精准的大模型能力评估 助力机构选型、优化及风险把控 [2] - 评测体系基于真实金融业务场景构建评测任务 探索金融垂直领域大模型应用的新理念、新机制与新手段 [2] - 评测体系将有效支撑金融机构科学选型、降本增效 加速大模型在投研、风控、客服等核心环节的规模化落地 [2] 相关发布与行业背景 - 上海市委金融办、徐汇区商务委等多部门联合上海人工智能实验室、库帕思及上海财经大学 共同发布了《金融大模型应用评测报告(2025)》与《金融大模型评测数据集(2025)》 [2] - 人工智能正在深刻重塑金融行业发展格局 大模型技术在应用场景深化、关键要素强化和应用生态协同推进三方面加速赋能 [1] - 2024年发布的全国首个“以金融业务为中心”的金融大模型评测体系 为行业提供了科学选型与能力对标的重要“标尺” [1]