自然语言转SQL(NL2SQL)
搜索文档
低调霸榜全球最难SQL榜单超两月,国产AI这次选择高调开源!
量子位· 2025-12-14 15:12
核心观点 - 蚂蚁数科在AI数据分析领域取得重大突破,其Agentar-SQL系列在权威BIRD-Bench榜单上以执行准确率81.67%和执行效率77%的成绩获得双料第一,超越了谷歌、亚马逊等国际巨头,并宣布将关键技术开源 [1][2][4][5] - 公司选择了一条“非共识”但价值巨大的AI发展路径:从数据门槛最高、合规最严的金融“深水区”切入,通过解决极端复杂场景的问题,锤炼出可迁移的产业AI能力,并已成功外溢至交通、能源等其他民生领域 [8][11][13][27][38] - 公司不仅在技术上领先,还创新性地采用“按效果付费”的商业模式,并构建强大的合作伙伴生态,共同推动产业AI的规模化落地,其方案已获得国内外市场的广泛认可 [39][42][44][48][49] 技术成就与开源 - **登顶权威榜单**:2025年9月,蚂蚁数科的Agentar-Scale-SQL模型在全球最具权威性的NL2SQL评测基准BIRD-Bench上,以**执行准确率81.67%** 和**执行效率77%** 的成绩获得双料第一 [5] - **技术开源**:公司正式宣布开源其数据智能体关键技术——Agentar-SQL系列,包含实时文本转SQL框架的全套论文、代码、模型和使用指南,后续还将开源数据库理解与挖掘等全链路数据能力 [4] - **解决核心挑战**:技术旨在解决自然语言转SQL在实际落地中的四大严峻挑战:理解模糊口语、注入行业知识、解析复杂数据库结构、生成准确复杂SQL [6] - **实际应用效果**:在某头部城商行试运营期间,其Agentar SQL多个工具的平均查询准确率**超过92%**,较传统查询方案提升**超过3倍** [7] 战略路径:从金融深水区切入 - **战略选择**:在2024年初“百模大战”时,公司未追逐通用榜单或聊天机器人,而是选择切入**金融领域**这一AI落地的“深水区”,直面高风险、高投入、长回报周期的挑战 [12][13][14] - **金融场景的复杂性**:金融场景对AI的挑战体现在三个维度:数据高度敏感且孤岛化、业务逻辑极其严谨、合规要求近乎苛刻(要求可解释、可审计、可回溯) [15][19] - **战略成果**:该战略取得成功,公司服务已覆盖**100%的国有股份制银行**以及**超过60%的地方性商业银行** [18] - **行业认可**:公司已跻身IDC《中国智能体开发平台2025年厂商评估》的**领导者象限**,处于市场份额和技术实力的第一梯队 [20] 金融场景应用案例 - **宁波银行智能化决策系统**:通过“规划-检索-推理”智能机制,打破知识孤岛,将复杂问题回答准确率从**68%跃升至91%**,响应速度进入百毫秒级,并实现AI决策过程的可解释 [22][23][24] - **上海银行AI手机银行**:以“对话即服务”为核心,用户通过自然语言交互即可办理转账、理财咨询等业务,实现了从“人找服务”到“服务找人”的体验重构,并具备千人千面推荐与适老化设计 [25][26] 能力外溢与产业级应用 - **方法论迁移**:在金融领域验证的成功实践,积累了可迁移的产业AI方法论,并延伸至更多民生领域 [27] - **公共交通案例(南京公交)**:与南京公交联合打造“小蓝鲸”智能体,将金融领域验证的“规划-检索-推理”逻辑应用于城市交通系统,实现从经验决策到智能规划的升级 [28][30][35] - 在AI建议下开通的210路公交车,单日最高客流达**2168人次**,老年卡使用占比近**50%** [32] - 类似由AI建议开通的公交线路在南京已有**30多个**,并新增了**84个招呼站** [33] - **能源领域应用**:其EnergyTS能源电力时序大模型能精准预测发电量和市场供需,将投前决策的人工测算时间从**2-3天缩短为十余分钟**,决策效率提升**超过60倍**,已助力协鑫能科、霍普等企业 [36][37] 商业模式与生态建设 - **创新付费模式**:采用“**按效果付费**”的模式,降低客户(尤其是中小机构)应用AI的门槛和风险,倒逼技术提供商深入业务一线,将技术转化为可量化的商业价值 [39][42][43] - **生态合作规模**:截至今年,已与**300家合作伙伴**建立深度合作,共同服务超**13000家终端客户** [45] - **生态赋能计划**:升级“星澜计划”,从技术赋能、运营支持、商机共享、资金扶持四个维度提升伙伴能力 [45] - **合作伙伴收益**:有合作伙伴分享,其**30%的营收**来自与蚂蚁数科的合作业务 [47] - **全球化进展**:技术方案已服务南洋商业银行、渣打银行等超**百家海外金融机构**,并于2025年10月入选香港金融管理局生成式AI沙盒项目 [48][49]