Workflow
金融推理大模型
icon
搜索文档
金融推理大模型价值初探:能否成为行业智能体下一“风向标”
北京商报· 2025-07-29 21:17
2025世界人工智能大会上,大模型、智能体毫无疑问是最热话题。当大模型和智能体走向规模化应用, 如何将它们的巨大潜能,真正转化为驱动产业升级的、可信的生产力?答案或在于,更垂直、更专业的 方向转变。 7月28日,在"智能体驱动产业变革"论坛上,蚂蚁数科正式发布金融推理大模型Agentar-Fin-R1,为金融 AI应用打造"可靠、可控、可优化"的智能中枢。这是国内首个专注金融推理的商业化大模型。在蚂蚁数 科看来,金融推理大模型是金融AI智能体发展的关键一步,它将推动金融行业向更智能、高效的方向 发展。 更先进的金融推理大模型呼之欲出。"一个好的垂直大模型,特别是推理能力很强的大模型,才能成为 一个智能体可控、可靠、可优化的智能中枢,没有这个东西就像机械设备没有关键的齿轮。"蚂蚁数科 CTO王维强调,推理大模型产生的推演能力、泛化能力、意图识别能力、结构化表达能力,是企业愿意 用新技术取代原有业务模式、创造增量价值的基础。 蚂蚁数科AI技术负责人章鹏也表示,推理大模型能解决通用大模型在金融领域的局限性。在与客户 (采购大模型产品的金融机构/企业)的接触实践中发现,客户需要知道模型的思考过程,需要可解释 的结果, ...
金融推理大模型价值初探:能否成为行业智能体下一“风向标”?
北京商报· 2025-07-29 21:01
人工智能在金融行业的应用趋势 - 大模型和智能体成为2025世界人工智能大会最热话题,金融行业因其数字化程度高、数据密度大、应用场景丰富,成为AI率先落地的绝佳行业 [1][3] - 金融推理大模型是金融AI智能体发展的关键一步,将推动行业向更智能、高效方向发展,国内首个专注金融推理的商业化大模型Agentar-Fin-R1正式发布 [1][5] - AI智能体产业价值释放的关键在于从"水平通用"向"垂直专用"转变,需深入业务场景解决行业深层痛点而非浅层问题 [3][5] 金融推理大模型的核心价值 - 金融推理大模型作为智能体的核心智能引擎,需具备深度行业理解能力,解决现有通用大模型在金融专业知识、业务逻辑推理、安全合规等方面的局限性 [4][5] - 推理大模型提供推演能力、泛化能力、意图识别和结构化表达,是企业采用新技术取代原有模式的基础,其可解释性满足金融机构对模型思考过程的需求 [5][8] - 蚂蚁数科构建了覆盖6大类66小类金融场景的分类体系,基于千亿级金融语料和专家标注的长思维链机制,显著提升模型处理复杂任务的能力 [6] 金融推理大模型的技术实现路径 - 模型开发遵循三个"E"原则:高质量数据(Excellent data)、持续迭代(Evolving)、工程效率(Efficiency),数据需来自真实问题并经过金融专家校验 [6] - 采用两阶段加训模式:第一阶段大规模训练建立金融基础能力,第二阶段针对具体场景本地微调,并通过高频迭代机制持续优化模型表现 [7] - 通过训练与评测一体化联动,结合金融动态和市场变化完善任务体系,确保模型知识常新并贴合业务实际需求 [7][8] 金融AI的未来发展方向 - 金融推理大模型将推动智能体进入业务深水区,从解决70-80%问题向更高覆盖率演进,但需理性看待技术边界,避免在关键决策场景直接应用 [8][9] - 当前模型迭代以技术驱动为主,需先解决成本效率问题,未来市场因素将更主导,技术越过拐点后场景渗透将加速 [8][9] - 金融AI应用正从通用领域向业务场景深化过渡,推理大模型将成为这一进程的重要推动力 [8]
前瞻全球产业早报:国家育儿补贴方案公布
前瞻网· 2025-07-29 20:29
国家育儿补贴方案公布,3周岁以下婴幼儿每孩每年3600元 从中汽协方面获悉,近日,中汽协组织召开了"推动构建汽车统一大市场"研讨会。商务部消费促进司、公安 部交通管理局等政府主管部门、科研机构领导,以及16家车企代表参会。汽车消费全流程数字化是本次研讨 会的重点议题。构建汽车消费数字化统一大平台,将让消费者可以享受"全流程一次办"的透明服务,解决汽 车消费环节存在的 "多头跑、流程繁、耗时长"等问题。 全球首款多模态梦境脑机接口设备正式发布 7月27日,由广东省智能科学与技术研究院与燧人医疗联合研发的首款多模态梦境脑机接口设备"梦邻"正式 发布。据介绍,该设备具备脑电信号监测、睡眠状态调控、干预策略生成及AI数据分析四大功能,可辅助 改善睡眠质量、缓解焦虑情绪,并支持基础认知功能评估。 国家育儿补贴制度实施方案7月28日公布。从2025年1月1日起,对符合法律法规规定生育的3周岁以下婴幼儿 发放补贴,至其年满3周岁。育儿补贴按年发放,现阶段国家基础标准为每孩每年3600元。其中,对2025年1 月1日之前出生、不满3周岁的婴幼儿,按应补贴月数折算计发补贴。 宇树科技副总经理:人形机器人面临"伪智能"困局 在2 ...
WAIC抢先爆料:金融“黑马”大模型超DeepSeek刷新SOTA,论文已上线
量子位· 2025-07-25 13:38
WAIC大会与蚂蚁数科金融大模型 - 2024年WAIC大会成为展示中国AI技术进展的重要平台,蚂蚁数科在会前发布金融推理大模型Agentar-Fin-R1的技术论文 [1][3] - 新模型定位为金融领域的专用推理大模型,类比DeepSeek在通用领域的地位,具备SOTA性能表现 [4] - 模型包含8B和32B两个参数版本,在金融评测基准和通用推理基准中均达到顶尖水平 [10][6] 模型技术性能 - 在金融评测集FinEval、Fineva、FinanceIQ和Finova上全面超越开源金融大模型及GPT-o1、DeepSeek-R1等通用大模型 [14] - 32B版本在Finova基准达到69.93分,显著超越同尺寸金融模型Dianjin-R1-32B(56.02分)及超大模型DeepSeek-R1(61.28分) [53] - 在通用推理基准MATH和GPQA中保持竞争力,32B版本取得80.99分的平均成绩 [7] 技术创新与优化 - 构建覆盖银行、证券、保险等全场景的金融任务分类体系,包含意图识别、风险评估等精准定义类别 [21] - 采用千亿级金融专业数据语料,通过可信数据合成和CoT数据精标构建训练数据集 [22] - 创新应用难度感知加权训练框架,采用两阶段训练策略提升效率 [33][34] - 开发Finova新评测基准,包含1350道涵盖智能体能力、复杂推理和安全合规的金融难题 [41][43] 行业应用与优势 - 针对金融行业三大核心挑战:问题复杂性、可信度要求、评测集缺失进行专项优化 [16] - 背靠蚂蚁集团金融数据积累,已服务全部国有股份制银行和超60%城商行 [58] - Agentar品牌已推出超百个金融智能体解决方案,覆盖四大金融领域,提升工作效率80% [60] - 模型设计强调实际业务场景适配能力,支持快速响应金融市场变化 [35]