行业标准再升级！2025金融大模型评测体系在沪正式发布

金融大模型评测体系发布 - 上海人工智能实验室与上海库帕思科技有限公司联合发布“2025金融大模型评测体系暨金融评测基准” [1] - 该评测体系在标准引领、数据驱动、安全可信与生态共建四大维度实现全面升级 [3] - 首次构建覆盖金融全场景的评测基线，为行业提供统一、权威、可操作的技术评估框架 [3] 评测体系的技术与数据构成 - 评测体系汇聚了4个公开数据集与22个自建数据集，总计约3.6万条评测数据 [1] - 采用循环选项打乱机制和多样化提示词，并研发金融裁判大模型，实现评测全流程自动化、标准化 [1] - 旨在为上海金融领域的银行、券商、基金、投资等机构提供权威、精准的大模型能力评估 [1] 当前金融大模型的局限性 - 金融大模型仍存在实时性与动态适应性不足、偏见和公平性、数据安全与隐私、领域知识深度不足及透明度和可解释性薄弱等相对局限性 [1] 行业影响与官方表态 - 该评测体系的全面升级标志着“人工智能+金融”进入高质量发展的新阶段 [3] - 上海市委金融办副主任葛平指出，人工智能正在深刻重塑金融行业发展格局，大模型在应用场景深化、关键要素强化和应用生态协同三方面加速赋能 [3] - 该体系将助力上海建设具有全球影响力的金融科技中心 [3] - 业内人士认为，这是上海深化“模塑申城”工程在金融领域落地的关键一环，将推动金融行业迎来更高质量、更可信赖的智能化转型 [3]