Workflow
Finova大模型金融应用评测基准
icon
搜索文档
告别“黑箱竞技”,首个面向信贷场景的多模态评测基准发布
国际金融报· 2026-01-16 16:52
行业核心痛点与挑战 - 信贷AI大模型在深度应用时遭遇痛点 突出表现为对专业场景失焦 更注重通用能力 无法从数百页银行流水中识别隐性负债或可疑关联方交易 缺乏信贷场景适配性[1] - 数据合规问题棘手 风控模型训练数据涉及用户隐私和企业商业机密 无法被共享[1] - 真实生产环境存在突发和个性化问题 例如客户上传的营业执照边缘褶皱或褪色 远程面审时网络延迟和视频压缩导致语音断续和面部模糊 这些实验室被过滤的噪音是线上场景常态 专门针对此类场景的鲁棒性测评缺失[1] - 信贷行业呈现投入大、选型盲和验证难的困境 大量资源被消耗在解决相同的基础问题上[1] 奇富科技解决方案:FCMBench-V1.0评测基准 - 奇富科技联合复旦大学与华南理工大学研究人员发布首个面向信贷场景的多模态评测基准FCMBench-V1.0 旨在解决行业普遍性问题[1] - 该基准基于真实信贷业务场景抽象科学问题 设计多模态评估任务与挑战 以期构建来源于业务、服务于业务的实用性评测体系[1] - FCMBench-V1.0构建了与真实银行审核流程高度一致的评测框架 涵盖18类核心信贷证件 包含4043张合规图像和8446个测试样本 问题覆盖信贷审核全链条[8] - 评测采用创新的"感知—推理—鲁棒性"三维体系 感知维度包含文档类型识别、关键信息提取、图像质量评估三大任务 推理维度涵盖一致性校验、有效性校验、数值计算、合理性审核四类任务 鲁棒性维度设置十类真实采集干扰如倾斜拍摄和光照不均[8] - 数据层面在保证多样性基础上满足合规性要求 数据采集支持单图像和多图像格式 涵盖各类数据类型 以真实材料为基础手动生成信贷相关证件 所有敏感信息均为虚构[8][9] 其他科技公司布局与行动 - 蚂蚁数科联合专业机构推出Finova大模型金融应用评测基准 深度考察智能体能力、复杂推理及安全合规能力 构建了覆盖银行、证券、保险等金融全场景的金融任务分类体系 包括六大类、六十六小类场景[9] - 蚂蚁消金基于通义千问基座训练"消费信贷垂类风控大模型" 将任务拆解为授信、审批、专项优化反欺诈和信用评估等指标[9] - 京东科技依托供应链生态 强化票据、合同、仓单等多模态单据的结构化识别与交叉验证 并针对金融语义进行专项重构[9] 信贷场景价值与未来展望 - 信贷审核涉及几十类证件 每类证件有多种模板 审核流程涉及多个环节和任务 以及多证件交叉推理验证 用户拍摄场景和上传文件多种多样 这些挑战对多模态大模型能力是非常好的试金石[9] - 未来将持续完善评测基准 旨在打磨一把公平、公正、面向实战需求的尺子[9]
鑫闻界丨“迫在眉睫”的AI金融大进程中,谁在重构“超越图谱”?
齐鲁晚报· 2025-07-29 20:50
AI在金融行业的战略重要性 - 人工智能在金融体系的应用正带来金融机构形态、行业业态和体系生态的巨大变化 [1][5] - AI正成为金融与治理的核心杠杆 呈现重构全球经济结构的趋势 [1] - 金融行业是AI大模型落地应用的最优场景之一 市场规模呈现快速增长 [1] 行业实践与战略布局 - 蚂蚁数科宣布all in产业AI 认为构建专业金融大模型是推进金融与AI深度融合的必然路径 [2] - 奇富科技聚焦AI技术在金融业落地应用 推动服务模式从提供技术解决方案升级为输出AI生产力 [4] - 阿里巴巴未来三年将投入3800亿元建设云和AI硬件基础设施 投入总额超过去十年总和 [6] 技术产品与解决方案 - 蚂蚁数科发布金融推理大模型Agentar-Fin-R1 在FinEval1.0等权威评测基准上超越同尺寸开源通用大模型 [2] - 蚂蚁数科构建业内最全面金融任务分类体系 覆盖6大类66小类场景 基于千亿级金融专业数据语料 [3] - 奇富科技打造行业首个赋能信贷核心业务的智能体 包含端到端授信决策智能体等多个模块 [4] 行业合作与标准建设 - 蚂蚁数科联合工商银行等机构推出Finova大模型金融应用评测基准 目前已全面开源 [2] - 建设银行和工商银行分别接入阿里巴巴AI技术 标志着近五年来国家级金融机构首次大规模与阿里深度合作 [5] - 阿里云中标建设银行智能编码项目 代码智能生成采纳率突破30% [5] 应用场景与落地成效 - 工商银行基于通义千问多模态大模型推出"商户智能审核助手" 在多模态技术替代传统OCR方面取得成果 [5] - 编程能力被视为大模型连接物理世界的运动神经 商户准入审核是金融风控领域的核心环节 [6] - 金融AI核心竞争力在于数据资产、真实场景与金融科技基因三者的深度融合及协同效应 [4]
午评:沪指冲高回落跌0.17% 煤炭、钢铁等资源股集体调整
中国金融信息网· 2025-07-28 12:14
市场表现 - A股三大指数7月28日早盘冲高回落,沪指报3587.69点跌幅0.17%,深证成指报11150.41点跌幅0.16%,创业板指报2342.39点涨幅0.10 [1] - 成交金额方面,沪市成交4938亿元,深市成交6293亿元,创业板成交2869亿元 [1] 行业板块表现 - 涨幅居前板块包括元件、保险、军工装备、PEEK材料、PCB、碳纤维等 [2] - PCB等算力硬件股表现强势,兴森科技、骏亚科技涨停,胜宏科技涨超10% [1] - 大金融股冲高,新华保险创历史新高 [1] - 影视股活跃,幸福蓝海、中国电影涨停 [1] - 医药股拉升,辰欣药业、丰原药业、海思科等涨停 [1] - 跌幅居前板块包括煤炭开采加工、贵金属、港口航运等,山西焦煤、柳钢股份等跌超5% [1][2] 机构观点 - 兴业证券认为市场主线集中在"低估值周期修复"与"科技成长产业趋势",行业轮动向煤炭、建筑等低位行业扩散,AI内部轮动至国产算力和中下游软件应用 [3] - 华西证券指出AR眼镜在AI模型加持下有望加速迭代放量,Micro LED作为核心零部件将深度受益 [3] - 中信证券表示上海积极推进高级别自动驾驶落地,小马智行、百度等获得示范运营牌照,汽车智能化产业链有望受益 [3] 金融科技动态 - 蚂蚁数科发布金融推理大模型Agentar-Fin-R1,基于Qwen3研发,在FinEval1.0等评测中表现优异 [6] - 蚂蚁数科联合工商银行、宁波银行等机构推出Finova大模型金融应用评测基准,聚焦智能体能力、复杂推理及安全合规 [7] 税收政策 - 2021-2024年度年收入前10%群体缴纳个税占比约九成,年收入12万元以下个人基本无需缴税 [4] - 税收受PPI影响显著,PPI增减带来税收收入同幅度变化 [5]