蚂蚁百灵大模型

搜索文档
AICon上海2025圆满收官:从技术热潮到价值沉淀,AI落地路径加速成型
搜狐财经· 2025-05-29 11:07
大会概况 - AICon全球人工智能开发与应用大会·上海站(2025)吸引超800位AI开发者、技术专家与从业者参与[1] - 汇聚60多位来自快手、华为、阿里云、腾讯云、蚂蚁集团、字节跳动等60余家企业的专家[2] - 议题涵盖大模型架构创新、多模态应用、AI Agent构建、推理性能优化等9大专题方向[2][18][32] AI产业趋势 - AI产品核心从工具输出转向结果导向 企业关注6-18个月内的实际回报[3] - B端用户对ROI敏感度提升 数据架构成为AI普及关键[5] - 金融、汽车、零售领域呈现典型AI落地趋势 需构建从工具提效到产业标准的全周期能力[5] 企业技术实践 昆仑万维 - 音乐大模型Mureka实现人声与复杂编曲还原 通过MusiCoT思维链机制将生成效率提升300%[7][9] - 采用推理Scaling Law技术 算力成本削减50% 突破"高质量=高成本"困局[9] 蚂蚁集团 - 百灵大模型采用MoE架构与混合线性注意力机制 开源Ling-lite/Ming-lite模型推动AGI生态[11][12] - AI for Data专题展示分析智能体技术 实现金融领域"语义理解-指标计算-决策推理"闭环[19][23] 美的集团 - 构建中立云架构与多云统一数字化底座 自研AI算力平台实现GPU虚拟化与资源精细调度[16] - 通过OpSpace自动化运维平台与DataMax大数据平台 算力效率提升40%[16] 技术专题亮点 多模态与AI Agent - 快手展示长视频理解技术 vivo与腾讯混元分享AIGC在游戏内容生成的应用[18] - 蚂蚁数科构建可信Agent机制 澜舟科技实现智能体在知识库与客服场景实战部署[30] 大模型优化 - 微软亚洲研究院优化KV缓存机制 华为实现多层次算子优化 推理速度提升2倍[29] - 阿里云采用跨层技术联动 腾讯混元框架部署效率提升35%[29] 端侧智能 - RockAI推出Yan架构 国科微电子研发原生AI SoC芯片 端侧模型推理延迟降低60%[32] - vivo蓝心大模型实现轻量化部署 模型体积压缩至原版30%[32] 行业应用 - 金融领域:同花顺AI Agent应用于投资决策 平安人寿大模型驱动保险风控范式重构[22] - 智能硬件:科大讯飞多模态降噪技术 网易有道词典笔实现学习产品形态革新[24] - 企业服务:华为云客服智能化方案 明略科技营销生成体系业务提效50%[28] 生态建设 - 极客邦科技累计服务970家上海企业 平台年活跃开发者达297万[5] - 数势科技、ProtonBase等企业展示Data Agent与Lakehouse架构创新[31][33]
蚂蚁集团副总裁、前基础大模型负责人徐鹏离职
证券时报· 2025-04-14 19:01
高管变动与AI部门调整 - 蚂蚁集团副总裁、前基础大模型负责人徐鹏已离职 徐鹏曾担任AI创新研发与应用部门NextEvo负责人 负责蚂蚁百灵大模型研发工作 [1][2] - NextEvo为蚂蚁内部AI精英部门 2023年在国际期刊和会议发表超30篇论文 开源了DLRover和GLake项目 [2] - 徐鹏拥有11年谷歌工作经历 曾负责谷歌翻译核心技术研发 并参与广告系统算法开发 [2] 组织架构与战略调整 - 蚂蚁集团成立数字支付事业群和支付宝事业群 实行轮值总裁制 首任任期至2025年6月30日 [3] - 新架构旨在加速双飞轮和AI战略推进 数字支付事业群聚焦创新支付产品 支付宝事业群专注用户增长与商业化 [3] - 2025年3月1日起 韩歆毅将接任CEO 井贤栋将更专注于董事长职责 [3] AI技术研发进展 - 蚂蚁集团正在研发百灵多模态大模型 已进入内测阶段 该模型可同时处理文字、图像、声音等信息 [2] - NextEvo部门承担蚂蚁AI所有核心技术研发 包括百灵大模型系列产品 [2]