Workflow
EnergyTS能源电力时序大模型
icon
搜索文档
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
量子位· 2025-12-14 15:12
核心观点 - 蚂蚁数科在AI数据分析领域取得重大突破,其Agentar-SQL系列在权威BIRD-Bench榜单上以执行准确率81.67%和执行效率77%的成绩获得双料第一,超越了谷歌、亚马逊等国际巨头,并宣布将关键技术开源 [1][2][4][5] - 公司选择了一条“非共识”但价值巨大的AI发展路径:从数据门槛最高、合规最严的金融“深水区”切入,通过解决极端复杂场景的问题,锤炼出可迁移的产业AI能力,并已成功外溢至交通、能源等其他民生领域 [8][11][13][27][38] - 公司不仅在技术上领先,还创新性地采用“按效果付费”的商业模式,并构建强大的合作伙伴生态,共同推动产业AI的规模化落地,其方案已获得国内外市场的广泛认可 [39][42][44][48][49] 技术成就与开源 - **登顶权威榜单**:2025年9月,蚂蚁数科的Agentar-Scale-SQL模型在全球最具权威性的NL2SQL评测基准BIRD-Bench上,以**执行准确率81.67%** 和**执行效率77%** 的成绩获得双料第一 [5] - **技术开源**:公司正式宣布开源其数据智能体关键技术——Agentar-SQL系列,包含实时文本转SQL框架的全套论文、代码、模型和使用指南,后续还将开源数据库理解与挖掘等全链路数据能力 [4] - **解决核心挑战**:技术旨在解决自然语言转SQL在实际落地中的四大严峻挑战:理解模糊口语、注入行业知识、解析复杂数据库结构、生成准确复杂SQL [6] - **实际应用效果**:在某头部城商行试运营期间,其Agentar SQL多个工具的平均查询准确率**超过92%**,较传统查询方案提升**超过3倍** [7] 战略路径:从金融深水区切入 - **战略选择**:在2024年初“百模大战”时,公司未追逐通用榜单或聊天机器人,而是选择切入**金融领域**这一AI落地的“深水区”,直面高风险、高投入、长回报周期的挑战 [12][13][14] - **金融场景的复杂性**:金融场景对AI的挑战体现在三个维度:数据高度敏感且孤岛化、业务逻辑极其严谨、合规要求近乎苛刻(要求可解释、可审计、可回溯) [15][19] - **战略成果**:该战略取得成功,公司服务已覆盖**100%的国有股份制银行**以及**超过60%的地方性商业银行** [18] - **行业认可**:公司已跻身IDC《中国智能体开发平台2025年厂商评估》的**领导者象限**,处于市场份额和技术实力的第一梯队 [20] 金融场景应用案例 - **宁波银行智能化决策系统**:通过“规划-检索-推理”智能机制,打破知识孤岛,将复杂问题回答准确率从**68%跃升至91%**,响应速度进入百毫秒级,并实现AI决策过程的可解释 [22][23][24] - **上海银行AI手机银行**:以“对话即服务”为核心,用户通过自然语言交互即可办理转账、理财咨询等业务,实现了从“人找服务”到“服务找人”的体验重构,并具备千人千面推荐与适老化设计 [25][26] 能力外溢与产业级应用 - **方法论迁移**:在金融领域验证的成功实践,积累了可迁移的产业AI方法论,并延伸至更多民生领域 [27] - **公共交通案例(南京公交)**:与南京公交联合打造“小蓝鲸”智能体,将金融领域验证的“规划-检索-推理”逻辑应用于城市交通系统,实现从经验决策到智能规划的升级 [28][30][35] - 在AI建议下开通的210路公交车,单日最高客流达**2168人次**,老年卡使用占比近**50%** [32] - 类似由AI建议开通的公交线路在南京已有**30多个**,并新增了**84个招呼站** [33] - **能源领域应用**:其EnergyTS能源电力时序大模型能精准预测发电量和市场供需,将投前决策的人工测算时间从**2-3天缩短为十余分钟**,决策效率提升**超过60倍**,已助力协鑫能科、霍普等企业 [36][37] 商业模式与生态建设 - **创新付费模式**:采用“**按效果付费**”的模式,降低客户(尤其是中小机构)应用AI的门槛和风险,倒逼技术提供商深入业务一线,将技术转化为可量化的商业价值 [39][42][43] - **生态合作规模**:截至今年,已与**300家合作伙伴**建立深度合作,共同服务超**13000家终端客户** [45] - **生态赋能计划**:升级“星澜计划”,从技术赋能、运营支持、商机共享、资金扶持四个维度提升伙伴能力 [45] - **合作伙伴收益**:有合作伙伴分享,其**30%的营收**来自与蚂蚁数科的合作业务 [47] - **全球化进展**:技术方案已服务南洋商业银行、渣打银行等超**百家海外金融机构**,并于2025年10月入选香港金融管理局生成式AI沙盒项目 [48][49]
首届蚂蚁数科生态伙伴大会举办
苏州日报· 2025-12-12 08:44
蚂蚁数科生态合作体系升级 - 公司于12月11日在苏州高新区举办首届蚂蚁数科生态伙伴大会,并推出升级版生态合作体系“星澜计划”[1] - “星澜计划”将从技术赋能、运营支持、商机共享、资金扶持四个维度发力,旨在推动生态全域升级[1] 公司业务定位与核心进展 - 蚂蚁数科是蚂蚁集团科技商业化的独立板块,核心任务是推动AI从实验室走进真实业务场景[1] - 公司业务聚焦于金融、能源、交通、制造等关键领域[1] - 公司已携手近20家头部伙伴,上架了100余个智能体联合解决方案[1] - 2024年,公司已与300家合作伙伴建立深度合作,共同服务超过1.3万家终端客户[1] 金融领域合作成果 - 公司已与金融机构合作,服务覆盖了100%的国有股份制银行[1] - 合作服务覆盖了超过60%的地方性商业银行[1] - 合作服务覆盖了数百家金融机构[1] 交通与能源领域应用案例 - 公司与南京公交联合打造了公交智能体[1] - 公司发布了EnergyTS能源电力时序大模型,以支撑能源服务智能体的规模化应用[1] 区域生态建设 - 在大会当天,苏州数字消费产业创新中心成立[2] - 一批生态服务企业签约入驻该创新中心[2]
蚂蚁数科升级“星澜计划”,携手300家合作伙伴加速AI产业落地
金融界· 2025-12-11 15:21
核心观点 - 蚂蚁数科作为AI to B服务商,其核心价值在于深入产业一线解决实际问题,并已进入中国智能体开发平台的领导者象限 [1] - 公司以“技术落地”为核心,推动AI从实验室走进真实业务场景,聚焦金融、能源、交通、制造等领域,携手近20家头部伙伴上架100余个智能体联合解决方案 [4] 市场地位与行业认可 - 在IDC发布的《IDC MarketScape:中国智能体开发平台2025年厂商评估》中,蚂蚁数科凭借“全栈技术能力”与“金融领域深度积累”,成功入选最高级别“领导者”象限 [10] - 公司数据分析智能体Agentar-Scale-SQL在全球权威评测基准BIRD-Bench上,斩获准确率与执行效率双料第一,超越谷歌等国际团队,创下国内企业在该领域的历史最好成绩 [9] - 自2025年9月25日登榜BIRD-Bench以来,Agentar-Scale-SQL截至新闻发布日依旧位居榜首,领跑全球超两月 [9] 金融行业深耕与成果 - 公司选择从数据门槛最高、合规要求最严的金融领域切入,目前服务已覆盖100%的国有股份制银行、超60%的地方性商业银行及数百家金融机构,成为金融行业AI转型的首选伙伴 [5] - 与宁波银行共建的智能化决策系统,基于Agentar知识工程平台,使复杂问题回答准确率从68%跃升至91%,响应速度提升至数百毫秒级,推荐内容的准确率和召回率分别提高35%和40% [5] - 与上海银行合作推出AI手机银行,以“对话即服务”为核心,用户通过自然语言交互即可办理转账、理财咨询、养老金查询等高频业务 [6] - 公司已服务南洋商业银行、渣打银行等超百家海外金融机构,并于2025年10月入选香港金融管理局生成式AI沙盒项目 [10] 技术能力与产品矩阵 - 公司构建了“大模型-平台-应用”全栈产品矩阵,聚焦业务增长、体验革新和风险防控三大核心问题 [9] - 技术底座包括金融专属评测基准Finova Bench、太仓标注中心提供数据支撑以及天玑实验室的前沿技术探索 [9] - 公司垂类模型已开源,支持在BIRD-Bench评测中夺冠的Agentar-Scale-SQL智能体 [9] - 在能源领域,公司发布的EnergyTS能源电力时序大模型,支撑“能源服务智能体”规模化应用,覆盖投资决策、电力交易、运行优化、设备运维等全场景 [8] 跨行业应用与民生服务 - 公司将金融领域积累的AI经验向更多民生与公共服务领域延伸 [7] - 与南京公交联合打造的“小蓝鲸”公交智能体,实现从“经验决策”到“智能规划”的升级,已开通30余条微循环线路,新增84个招呼站 [8] - 对接地铁7号线的接驳公交210路,单日最高客流达2168人次,老年卡使用占比近50% [8] - 在新能源领域,EnergyTS大模型助力企业实现数智化升级,其投资决策效率较人工提升超60倍,运营与交易效果提升10%以上,资产评估效率提升超10倍 [8] 生态合作与商业化 - 2025年,蚂蚁数科已与300家合作伙伴建立深度合作,共同服务超13000家终端客户 [11] - 公司升级合作伙伴计划,推出“星澜计划”,从技术赋能、运营支持、商机共享、资金扶持四个维度提升伙伴能力 [11] - 有生态伙伴表示,其30%的营收来自与蚂蚁数科合作的业务,并表达了深化合作的强烈意愿 [14] - 公司定位为生态的“基础设施提供商”,旨在与伙伴共同将技术转化为产业成果 [14]
智能体竞争下半场:蚂蚁数科如何穿越金融“高压区”,跑出规模化路径?
21世纪经济报道· 2025-12-03 16:06
行业趋势与市场信号 - 智能体正成为企业AI转型与流程重构的核心,未来竞争将集中于复杂智能体与应用的一体化开发[1] - 智能体竞争的焦点已从早期的技术发布与概念演示,演进为实实在在的“生产力创造”之争,胜负关键在于能否将智能体深度融入企业核心价值链[9] 金融行业的特殊性与挑战 - 金融行业对AI极度渴望,其各个环节都建立在对信息密度、处理效率和人力规模的极致依赖之上,天然适合智能体承担[1] - 金融行业对AI“不够友好”,数据高度敏感与封闭,存在隐私属性和机构壁垒,导致通用大模型难以进入金融核心系统[2] - 金融智能体需被接入核心业务系统、承担真实责任,因此必须从底层设计上围绕安全、稳定、可控而构建[2] 蚂蚁数科Agentar平台的核心优势 - 蚂蚁数科旗下的Agentar全栈企业级智能体平台在IDC评估中被评为“领导者”[1] - 其优势在于技术能力、产品成熟度、生态构建等多个维度形成了较为全面的体系化优势,而非单纯的模型参数规模[4] - 能力源于长期在金融产业一线打磨,在风控、合规、支付等高复杂度场景中形成了规模化落地的实践积累,使其智能体不仅“能用”而且有高可用性[4] - 平台目标锚定金融等高风险、高复杂度系统,倒逼技术从第一天起就围绕真实生产环境设计[4] 蚂蚁数科的技术与产品体系 - 底层支撑是自研的金融推理大模型Agentar-Fin-R1,该模型在多项金融基准测试中超过主流开源模型,能进行稳定、低幻觉、可解释的推理与决策[4] - 依托蚂蚁集团的AI工程能力,搭建起一套完整、可金融级验证的智能体技术服务体系,涵盖算力调度、数据治理、模型训练与推理到应用部署[5] - 结合大规模高质量的金融行业知识库与低代码、可视化的智能体编排能力,帮助金融机构快速构建专业化智能体应用[5] 规模化落地与应用成果 - 在金融行业,蚂蚁数科已联合伙伴推出超百个金融智能体解决方案,覆盖银行、证券、保险、通用金融等四大领域[7] - 解决方案可“即插即用”,提升一线员工工作效率超80%[7] - 仅2025年上半年,公司大模型产品解决方案就与近30家金融机构达成合作,包括宁波银行、天津银行、新华人寿等[6] - 合作案例:上海银行推出AI手机银行,以“对话即服务”为核心,用户通过自然语言交互即可办理转账、理财咨询等高频业务[7] - 合作案例:宁波银行基于Agentar知识工程平台构建决策中枢,将复杂问答准确率从68%显著提升至91%,且答案推理路径可追溯[7] 能力向其他高复杂度行业拓展 - 在能源行业,蚂蚁数科发布EnergyTS能源电力时序大模型,并推出“能源服务智能体”[5] - 该智能体可自动生成覆盖投资、运营、交易、融资等多个环节的分析报告与决策策略,其投资决策效率较人工提升超60倍,运营与交易效果提升10%以上,资产评估效率提升超10倍[5] 商业模式与行业影响 - 公司选择搭建“金融机构的AI中枢”的路径,目标是贯通多业务线、承载多角色协同、嵌入核心系统的“金融级AI大脑”,而非单点工具[6] - 应用已进入智能客服调度、风控审批、营销策略生成、合规文档审查等核心业务链路,成为“可被系统级调用的生产力单元”[7] - 通过“技术输出 + 平台生态”的方式,降低智能体在普惠金融中的使用门槛,为大量技术储备不足的中小银行提供可行性[9] - 国家“人工智能+”行动与金融数字化转型政策,为智能体技术在金融行业的深度应用创造有利环境[9]
智能体竞争下半场:蚂蚁数科如何穿越金融“高压区”,跑出规模化路径?
21世纪经济报道· 2025-12-03 16:01
文章核心观点 - 智能体正从概念演示转向企业AI转型与流程重构的核心,竞争焦点在于能否深度融入企业核心价值链并创造实际生产力[1][13] - 金融行业因其对信息处理效率的极致依赖与对安全可控的严苛要求,成为智能体规模化应用的“终极考场”和最具价值的落地领域[1][3] - 蚂蚁数科旗下的Agentar全栈企业级智能体平台凭借在金融等高复杂度行业的长期实践积累和全栈技术能力,被IDC评为领导者,并验证了“中枢级”智能体平台规模化应用的可行路径[1][5][13] 从“能用”到“敢用”,金融为什么是智能体的终极考场? - 金融行业对AI需求强烈,其业务环节如客服、风控、投研等高度依赖海量文本、实时数据和快速决策,天然适合智能体承担[3] - 金融行业对AI“不够友好”,数据高度敏感封闭且存在机构壁垒,导致通用大模型难以获取足够真实数据并迁移经验,难以进入核心系统[3] - 金融智能体需作为承担真实责任的生产系统组件,必须从底层设计上围绕安全、稳定、可控构建,这对其可用性提出极高要求[3] 蚂蚁数科在金融智能体领域的实践与能力 - 蚂蚁数科的系统化智能体能力源于长期在金融产业一线打磨,在风控、合规、支付等高复杂度场景中形成了规模化落地实践[5] - 公司自研的金融推理大模型Agentar-Fin-R1在多项金融基准测试中超过主流开源模型,能在复杂金融规则下进行稳定、低幻觉、可解释的推理[5] - 依托蚂蚁集团的AI工程能力,公司搭建了从算力调度、数据治理到应用部署的完整、可金融级验证的智能体技术服务体系,并具备大规模金融知识库与低代码编排能力[6] - 公司已验证从金融向其他高复杂度行业扩展的能力,如在能源行业推出的“能源服务智能体”使投资决策效率较人工提升超60倍,运营与交易效果提升10%以上,资产评估效率提升超10倍[6] 智能体如何真正成为金融行业的生产力系统? - 蚂蚁数科的路径是构建“金融机构的AI中枢”,旨在搭建贯通多业务线、承载多角色协同、嵌入核心系统的“金融级AI大脑”,而非单点工具[8] - 2025年上半年,公司的大模型产品解决方案已与近30家金融机构达成合作,包括宁波银行、天津银行、新华人寿等,在核心业务场景中打造“AI大脑”[8] - 具体应用已深入核心业务链路,如上海银行的AI手机银行实现“对话即服务”,宁波银行基于Agentar知识工程平台将复杂问答准确率从68%显著提升至91%,并实现推理路径可追溯[10] - 公司已联合行业伙伴推出超百个金融智能体解决方案,覆盖银行、证券、保险、通用金融四大领域,可帮助金融机构一线员工工作效率提升超80%[12] - 公司通过“技术输出+平台生态”模式,降低智能体使用门槛,为面临技术、数据与人才困境的中小银行提供了可行的AI解决方案[12]
时序大模型EnergyTS走向产业应用,蚂蚁数科发布能源服务智能体
中国能源网· 2025-06-12 17:31
行业政策与市场动态 - 2025年6月1日起投产的新能源增量项目上网电量将参与市场交易 电价由市场供需决定 不再执行固定标杆或指导价 [1] - 新政策对新能源企业提出更高要求 包括发电量预测精度 供需预测准确性 投资决策科学性等方面 [1] 蚂蚁数科能源服务智能体技术 - 基于时序大模型EnergyTS发布"能源服务智能体" 可精准预测发电量和市场供需变化 [1] - 通过文本指令生成投资 运营 交易 融资等环节的分析报告与策略 [1] - 投资决策效率提升超60倍 运营交易效果提升10%以上 资产评估效率提升超10倍 [1] - 覆盖投前决策 智慧运营 资产金融三大场景 支持智能调度Agent的理解 执行 反馈能力 [1] - EnergyTS大模型融入新能源行业专业知识 结合知识工程与RAG技术 降低推理幻觉 [2] - 在光伏场景测评中发电量预测准确率超越谷歌TimesFM-V2 0和亚马逊Chronos-Large等通用时序模型 [2] 能源服务智能体应用场景 - 投前决策环节:自动完成项目方案生成 经济性测算 敏感性分析 方案量化寻优 将2-3天测算周期缩短至十余分钟 [2] - 智慧运营场景:自动生成运营策略 风险管理策略 交易策略 提高管理效率 对冲电价波动风险 [2] - 资产金融场景:提供资产画像分析 评估 为能源企业提供资产收益增信措施和融资建议 [2] - 已应用于工商业光伏 户用光伏 储能 综合能源等领域 与晶澳智慧能源达成合作 [2]