文章核心观点 蚂蚁集团推出两款性能领先的大语言模型,其技术论文提出创新方法,可在国产GPU低性能设备上高效训练大模型降低成本;同时持续加码AI应用与人形机器人领域布局,探索新增长点并推动业务升级 [1][4][5] 自研大模型情况 - 蚂蚁集团Ling团队发表技术成果论文,推出百灵轻量版(Ling - Lite)与百灵增强版(Ling - Plus)两款MoE大语言模型,前者参数规模168亿(激活参数27.5亿),后者基座模型参数规模高达2900亿(激活参数288亿),性能达行业领先水平 [1] - Ling团队目标是“不使用高级GPU”扩展模型,通过创新训练策略突破资源与预算限制,推动AI技术普惠化 [2] 创新策略及效果 - 创新策略包括架构与训练策略革新、训练异常处理机制升级、模型评估流程优化、工具调用能力突破 [3] - Ling团队在五种硬件配置上对9万亿个token进行Ling - Plus预训练,用高性能硬件训练1万亿token成本约635万元,用优化方法后低规格硬件训练成本降至508万元左右,节省近20%,实现与阿里通义Qwen2.5 - 72B - Instruct和DeepSeek - V2.5 - 1210 - Chat相当性能 [3] - 若蚂蚁集团技术成果得到验证及推广,国产大模型可寻找成本更低、效率更高的国产芯片或替代方案,降低对英伟达芯片依赖 [3] AI应用布局 - 百灵大模型重点布局生活服务、金融服务、医疗健康等场景应用,蚂蚁集团CTO透露基于该模型的生活管家、就医助理及金融助手是当下重点破局方向 [4] - 3月21日蚂蚁宣布AI医疗领域进展,发布面向医疗机构、医生、用户三端的AI产品体系升级,包括“蚂蚁医疗大模型一体机”全栈式解决方案、AI医生助手系列工具、“AI健康管家”新功能 [4] 人形机器人布局 - 今年2月蚂蚁集团开放招聘具身智能人形机器人系统和应用等岗位,年薪高达百万元 [4] - 去年12月蚂蚁集团注册成立上海蚂蚁灵波科技有限公司,聚焦具身智能技术和产品研发,3月11日举行揭牌仪式 [4][5] - 蚂蚁灵波科技是拓展具身智能和机器人业务主要载体,致力在家庭、养老、医疗健康等领域打造领先机器人产品,与浦东携手打造具身智能创新高地和创新产业生态 [5] - 具身智能人形机器人领域前景广阔,蚂蚁集团布局该领域可探索新增长点,与现有金融科技业务产生协同效应,加速研发和应用 [5]
蚂蚁集团,AI重大突破!