Workflow
金融推理大模型
icon
搜索文档
金融推理大模型价值初探:能否成为行业智能体下一“风向标”?
北京商报· 2025-07-29 21:01
人工智能在金融行业的应用趋势 - 大模型和智能体成为2025世界人工智能大会最热话题,金融行业因其数字化程度高、数据密度大、应用场景丰富,成为AI率先落地的绝佳行业 [1][3] - 金融推理大模型是金融AI智能体发展的关键一步,将推动行业向更智能、高效方向发展,国内首个专注金融推理的商业化大模型Agentar-Fin-R1正式发布 [1][5] - AI智能体产业价值释放的关键在于从"水平通用"向"垂直专用"转变,需深入业务场景解决行业深层痛点而非浅层问题 [3][5] 金融推理大模型的核心价值 - 金融推理大模型作为智能体的核心智能引擎,需具备深度行业理解能力,解决现有通用大模型在金融专业知识、业务逻辑推理、安全合规等方面的局限性 [4][5] - 推理大模型提供推演能力、泛化能力、意图识别和结构化表达,是企业采用新技术取代原有模式的基础,其可解释性满足金融机构对模型思考过程的需求 [5][8] - 蚂蚁数科构建了覆盖6大类66小类金融场景的分类体系,基于千亿级金融语料和专家标注的长思维链机制,显著提升模型处理复杂任务的能力 [6] 金融推理大模型的技术实现路径 - 模型开发遵循三个"E"原则:高质量数据(Excellent data)、持续迭代(Evolving)、工程效率(Efficiency),数据需来自真实问题并经过金融专家校验 [6] - 采用两阶段加训模式:第一阶段大规模训练建立金融基础能力,第二阶段针对具体场景本地微调,并通过高频迭代机制持续优化模型表现 [7] - 通过训练与评测一体化联动,结合金融动态和市场变化完善任务体系,确保模型知识常新并贴合业务实际需求 [7][8] 金融AI的未来发展方向 - 金融推理大模型将推动智能体进入业务深水区,从解决70-80%问题向更高覆盖率演进,但需理性看待技术边界,避免在关键决策场景直接应用 [8][9] - 当前模型迭代以技术驱动为主,需先解决成本效率问题,未来市场因素将更主导,技术越过拐点后场景渗透将加速 [8][9] - 金融AI应用正从通用领域向业务场景深化过渡,推理大模型将成为这一进程的重要推动力 [8]
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
量子位· 2025-07-25 13:38
WAIC大会与蚂蚁数科金融大模型 - 2024年WAIC大会成为展示中国AI技术进展的重要平台,蚂蚁数科在会前发布金融推理大模型Agentar-Fin-R1的技术论文 [1][3] - 新模型定位为金融领域的专用推理大模型,类比DeepSeek在通用领域的地位,具备SOTA性能表现 [4] - 模型包含8B和32B两个参数版本,在金融评测基准和通用推理基准中均达到顶尖水平 [10][6] 模型技术性能 - 在金融评测集FinEval、Fineva、FinanceIQ和Finova上全面超越开源金融大模型及GPT-o1、DeepSeek-R1等通用大模型 [14] - 32B版本在Finova基准达到69.93分,显著超越同尺寸金融模型Dianjin-R1-32B(56.02分)及超大模型DeepSeek-R1(61.28分) [53] - 在通用推理基准MATH和GPQA中保持竞争力,32B版本取得80.99分的平均成绩 [7] 技术创新与优化 - 构建覆盖银行、证券、保险等全场景的金融任务分类体系,包含意图识别、风险评估等精准定义类别 [21] - 采用千亿级金融专业数据语料,通过可信数据合成和CoT数据精标构建训练数据集 [22] - 创新应用难度感知加权训练框架,采用两阶段训练策略提升效率 [33][34] - 开发Finova新评测基准,包含1350道涵盖智能体能力、复杂推理和安全合规的金融难题 [41][43] 行业应用与优势 - 针对金融行业三大核心挑战:问题复杂性、可信度要求、评测集缺失进行专项优化 [16] - 背靠蚂蚁集团金融数据积累,已服务全部国有股份制银行和超60%城商行 [58] - Agentar品牌已推出超百个金融智能体解决方案,覆盖四大金融领域,提升工作效率80% [60] - 模型设计强调实际业务场景适配能力,支持快速响应金融市场变化 [35]