模型即服务(MaaS)
搜索文档
2025年大模型推理优化与部署实践产业洞察研究报告-云计算开源产业联盟
搜狐财经· 2025-12-25 10:34
报告核心观点 - 大模型产业已从“模型创新”迈入“规模落地”关键期,推理优化与高效部署成为核心竞争力 [1] - 市场呈现高速增长态势,多元部署形态与全栈优化技术协同推动行业发展 [1] - 产业同时面临成本、标准等多重挑战 [1] 一、大模型推理趋势洞察 (一) 趋势洞察 - 人工智能大模型产业重心从“百模大战”驱动的预训练规模竞赛,转向模型对齐、推理能力增强与服务效能优化阶段 [24] - 算力投入重点由训练侧向推理侧延伸,推理服务的高效化、轻量化与智能化成为算力资源配置的核心方向 [24] - 自2025年2月DeepSeek系列开源大模型获得广泛关注以来,模型使用与推理成本呈现显著结构性下降趋势,形成“成本下行、算力上行”的发展态势 [29] - 技术发展从“追求模型规模”转向“提升推理效率”,服务模式从“通用型解决方案”转向“定制化场景适配” [31] (二) 市场分析 1 全球市场 - 全球AI推理算力市场在2021至2024年间增长近十倍,从14.04亿美元迅速扩张至139.58亿美元 [36] - 2024年市场增长率回升至31.5%,标志着全球AI算力市场正式从训练驱动阶段迈入推理驱动的新发展周期 [36] - 2025年全球AI推理算力市场规模预计增至183.55亿美元 [1] - 2025年全球范围内通过API调用大模型推理服务的企业比例已超过75%,基于Token的计费模式成为市场主流 [39] - 亚马逊、谷歌、微软三大云厂商构建的“模型市场”生态已占据全球市场份额的65%以上 [39] 2 中国市场 - 中国AI推理算力市场规模从2021年的56.5亿元迅猛扩张至2025年的438.3亿元,年均复合增长率达到66.3% [1][43] - 2024年市场增长率大幅攀升至150.10%,标志着中国市场已率先进入高速增长新阶段 [43] - 中国AI服务器推理工作负载占比预计将从2023年的41.3%持续攀升,2026年将达到70.5% [1][47] - 2025年上半年中国推理算力市场份额分布为:天翼云21.4%、阿里云20.1%、华为云11.2%,其他厂商占47.3% [52] 二、大模型推理部署主流方式 - 形成四大主流部署方式:模型即服务(MaaS)、大模型推理一体机、私有化部署平台、云-边-端协同推理 [2] - 2023年至2027年间,大模型推理平台的部署结构将发生显著变化:公有云部署预计从49%增至58%,私有云部署从16%上升至26%,本地一体机部署将从19%降至8%,边缘服务器从12%降至5% [58] - 混合架构正成为主流选择,企业更倾向于根据业务特性在云边端之间灵活配置资源 [58] (一) 模型即服务(MaaS) - MaaS凭借弹性计费与低门槛优势,成为中小企业首选 [2] - 全球企业在基础模型API上的支出呈现爆发式增长,从2023年的50万美元迅速攀升至2025年的1330万美元,年均复合增长率超过400% [62] - 企业级Token API市场份额从2023年OpenAI占据主导,发展到2025年Anthropic、Google、Meta等厂商市场份额显著提升的均衡态势 [66] (二) 大模型推理一体机 - 大模型推理一体机以软硬一体化、开箱即用特性,受央国企及政务单位青睐 [2] - 2025年预计出货量超10万台 [2] (三) 私有化大模型推理部署平台 - 私有化部署平台满足金融、医疗等行业数据安全与定制化需求 [2] - 81%的企业选择云原生形式进行部署 [2] (四) 云-边-端协同推理 - 云-边-端协同推理通过分布式架构,适配工业质检、智能交通等实时性需求场景 [2] 三、大模型推理优化技术原理 - 全栈优化技术成为核心支撑,多维度突破性能瓶颈 [2] (一) 硬件适配 - 硬件适配层面,GPU、NPU、ASIC三类芯片并行发展,通过深度优化充分释放算力 [2] - 国产算力生态快速成熟,华为昇腾、寒武纪等国产芯片在推理场景中的性能表现持续提升 [49] (二) 推理引擎 - 推理引擎依托PagedAttention、动态批处理等技术,将GPU利用率提升至60%-80% [2] (三) 模型层 - 模型层通过量化、知识蒸馏、混合专家(MoE)架构等轻量化技术,在保障精度前提下降低60%-70%显存占用 [2] (四) 并行计算 - 并行计算技术通过张量、流水线、数据并行等策略,支撑千亿参数模型分布式部署 [2] - P/D分离架构可使吞吐量提升30%-50% [2] 五、大模型推理优化与部署实践行业案例 (一) 金融领域 - 中信证券通过推理加速引擎实现财富管理智能化,累计处理服务请求超2亿次 [3] (二) 科研领域 - 哈佛大学借助高性能算力集群与优化框架,将模型部署周期从数周缩短至数天 [3] (三) 国产算力领域 - 开普云通过全栈协同优化,使长上下文推理吞吐量提升1.5倍 [3] (四) 制造业领域 - 某机器人企业依托分布式容器云平台,实现私有化部署效率提升80%,响应延迟降低35% [3] 六、发展趋势与建议 (二) 产业挑战 - 当前行业存在成本高企、标准缺失、人才短缺、生态碎片化、安全合规复杂等问题 [3] (三) 发展建议 - 报告建议加快建立技术标准体系,构建产学研用协同创新机制,培育复合型人才队伍,优化产业政策环境,推动商业模式创新 [3] - 未来技术将向全栈协同优化、云边端协同、自适应调度等方向演进 [3]
数融小贷副总经理变更获批复 为百融云创全资子公司
中国经济网· 2025-12-16 17:09
公司人事变动 - 广州市地方金融管理局批准房刚担任广州数融互联网小额贷款有限公司副总经理 [1] - 广州数融互联网小额贷款有限公司是百融云创科技股份有限公司的全资子公司 [1] 公司业务与行业 - 百融云创是一家领先的人工智能技术服务公司 [1] - 公司应用大语言模型、自然语言处理、深度机器学习、隐私计算和云计算等技术 [1] - 公司通过模型即服务及业务即服务的模式提供服务 [1] - 公司的产品与服务主要应用于银行、消费金融、保险、电商、汽车、物流、票务、能源和建筑等多个行业 [1] 公司财务表现 - 2024年公司实现总营收29.29亿元人民币,同比增长9% [2] - 模型即服务部分营收9.32亿元人民币,同比增长5% [2] - 业务即服务部分营收19.97亿元人民币,同比增长12% [2] - 2024年年内净利润为2.66亿元人民币,同比下滑21% [2] - 净利润率从13%降至9% [2]
小度AI眼镜将开启预售;高通推出人工智能芯片
每日经济新闻· 2025-10-29 07:21
小度AI眼镜产品发布 - 百度旗下小度AI眼镜Pro将于11月1日开启预售,11月10日现货发售 [1] - 产品功能包括AI翻译、AI识物、AI备忘、AI录音等 [1] - 11月率先发售波士顿墨镜款,其他款式将陆续上线 [1] 高通AI芯片战略 - 高通推出人工智能芯片AI200和AI250,预计分别于2026年和2027年投入商用 [2] - 此举标志着公司从移动端向数据中心端的战略转型,通过专用推理芯片切入市场 [2] - 新芯片将加剧数据中心AI芯片市场竞争,推动推理专业化趋势,挑战英伟达在AI推理市场约70%的份额 [2] 中国MaaS市场增长 - 2025年上半年中国MaaS市场规模达12.9亿元人民币,同比增长421.2% [3] - 同期AI大模型解决方案市场规模达30.7亿元人民币,同比增长122.1% [3] - MaaS服务模式降低了企业使用人工智能技术的门槛和成本,推动了技术的广泛应用 [3]
旗下榕树贷款被报道年化利率最高36% 百融云创未回应
中国经济网· 2025-09-23 14:21
产品信息披露问题 - 榕树贷款产品在微信小程序最显眼处仅显示最高借款20万元 年化费率未在醒目处标注 实际年化利率区间7.2%至36%仅以较小灰色字体显示在产品介绍界面最下方[1] - 榕树贷款官网借款明显位置仅显示最高可借20万元和千元借一天利息最低0.13元(年利率4.7%起) 未展示借款利率上限区间 用户贷款利率上限展示存在缺陷[3] 公司股权结构 - 榕树贷款运营公司上海迦数科技有限公司系百融云创全资子公司 产品资金来源方广州数融互联网小额贷款有限公司同为百融云创全资子公司[1][2] - 百融云创为港股上市公司 股票代码06608 HK 旗下智能金融综合服务平台榕树贷款于2017年上市[2] 公司业务概况 - 百融云创系人工智能技术服务公司 应用大语言模型 自然语言处理 深度机器学习 隐私计算和云计算等技术 通过模型即服务(MaaS)和业务即服务(BaaS)模式提供服务[2] - 公司产品与服务主要应用于银行 消金 保险 电商 汽车 物流 票务 能源和建筑等多个行业[2] 财务表现 - 2024年实现营收29.29亿元 同比增长9% 其中MaaS部分营收9.32亿元同比增长5% BaaS部分营收19.97亿元同比增长12%[2] - 2024年年内净利润2.66亿元 同比下滑21% 净利润率从13%降至9%[2]
百融云创净利降小贷公司变阵 利率上限模糊存合规质疑
中国经济网· 2025-06-23 08:03
公司高管变动 - 广州数融互联网小额贷款有限公司风控总监由戚红霞变更为熊庄 [1] - 该公司为百融云创科技股份有限公司(06608 HK)全资子公司 [1] 公司业务概况 - 百融云创定位为人工智能技术服务公司 应用大语言模型 NLP 深度机器学习 隐私计算和云计算等技术 [1] - 采用模型即服务(MaaS)和业务即服务(BaaS)模式 服务覆盖银行 消金 保险 电商 汽车 物流 票务 能源和建筑等行业 [1] 2024年财务表现 - 总营收29 29亿元(同比增长9%) 其中MaaS营收9 32亿元( 5%) BaaS营收19 97亿元( 12%) [1] - 金融行业云收入14 11亿元( 19%) 保险行业云收入5 86亿元( -3%) [2] - 年内净利润2 66亿元(同比下滑21%) 净利润率从13%降至9% [1][2] - 非国际财务报告准则溢利3 76亿元(与上年持平) EBITDA 4 86亿元( 5%) [2] 业务发展问题 - MaaS核心客户数量从213家减至211家 单客户平均贡献收入从349 5万元降至337 1万元 [3] - 保险行业云陷入"量增利降"困境 成交保费 63%至54 42亿元但收入下降3% [3] - 研发开支暴涨34%至5 09亿元 但收入增速仅9% 显示研发转化滞后 [3] - 销售及营销开支达11 19亿元 占营收38% 存在较强营销依赖症 [3] 助贷产品争议 - 旗下"钱小乐""榕树贷款"等产品被曝年化利率高达36% 存在利率展示不透明问题 [4][5] - 部分官网仅展示最低利率4 7%或7 2% 未明确上限 实际用户投诉利率达35 9%并收取担保费 [5] - 运营公司上海迦数科技为百融云创全资子公司 [5] - 面临2025年10月1日实施的"助贷新规"合规压力 [5]
2024年中国MaaS市场规模同比增长215.7%
快讯· 2025-05-07 21:26
中国MaaS及AI大模型解决方案市场增长 - 2024年中国MaaS市场规模达7 1亿元 同比增长215 7% [1] - AI大模型解决方案市场规模达34 9亿元 同比增长126 4% [1] - 企业对AI模型应用需求增长推动市场扩张 [1] 市场竞争格局 - 百度智能云以26%市场份额位居2024年下半年中国MaaS市场第一 [1]