MaaS模式
搜索文档
押注智能化的确定性,火山引擎做对了什么?
远川研究所· 2025-12-19 19:03
文章核心观点 - 人工智能产业正从以算力为中心的“卖生产资料”模式,转向以模型应用为中心的“卖生产力”模式,即以模型即服务(MaaS)和Tokens调用量为关键指标的新范式 [2][5][13] - 产业智能化已从选择题变为关乎生存的必答题,但企业面临资本开支巨大与回报不确定性的矛盾,而Tokens调用量成为衡量AI实际落地与商业价值更精确的“晴雨表” [6][7][9][14] - 火山引擎作为行业代表,通过其豆包大模型和MaaS模式,在汽车、消费电子、餐饮等多个行业推动AI规模化落地,其Tokens调用量市场份额领先,验证了该模式的有效性 [2][16][18][21] AI产业范式转变:从算力到Tokens - 传统的以算力为中心的IT架构已无法满足Agent时代需求,以模型为中心的AI云原生架构正在形成 [2] - 云服务商的商业模式正从“卖算力”过渡到“卖Tokens”,本质是从“卖生产资料”转向“卖生产力” [13] - Tokens调用量是衡量产业应用AI服务最精确的指标,相当于人工智能时代的“用电量” [5] - 与IaaS模式相比,MaaS模式让客户直接调用模型能力,节省底层开发维护成本,且按实际使用量收费,更具灵活性 [14] Tokens经济的价值与优势 - Tokens调用量直接反映了模型推理过程中的计算量,与AI应用的实际落地情况紧密相关,是产业景气的“晴雨表” [14] - 算力销售像一次性买卖,而Tokens调用具备可持续性,能基于反馈不断优化模型,构建生态护城河 [15] - MaaS模式大幅提升了模型规模化落地的效率,增长潜力远超传统IaaS模式,并被认为是通用人工智能生态构建的核心 [15] - 一家消费电子行业客户引入视觉理解模型后,Token消耗量在5个月内增长了12倍 [15] - 已有超过100家企业客户在火山引擎的Token使用量超过一万亿 [15] 产业界的共识与困境 - 产业界对智能化转型已形成共识,智能化不是选择题,而是关乎生存与未来的必答题 [9] - 美国科技公司集体刷新资本开支指引,如谷歌上调80亿美元,Meta上调40亿美元,行业整体支出超过2000亿美元,但投入与潜在收益间存在巨大鸿沟 [7] - 对企业而言,智能化投资难以形成清晰量化的预期回报,存在决心与心理包袱的矛盾 [9] - 当算力需求重心从训练转向推理,Token调用量快速增加意味着AI进入“实战”环节,用户体验成为核心竞争力 [9] 火山引擎的实践与行业落地 - 火山引擎通过从模型能力到基础设施的全方位革新,推动AI应用从单一模型调用转向Agent智能体生态 [10] - 截至2024年12月,豆包大模型日均Tokens调用量高达50万亿次,仅次于OpenAI和Google [2] - 2024年上半年,中国大模型公有云服务Tokens调用总量达536.7万亿次,火山引擎份额超过49%,位列第一 [2] 汽车行业 - 火山引擎已覆盖90%的主流车企,豆包大模型成为中国市场智能座舱搭载量第一的AI模型 [18] - 从特斯拉、国内新势力到一汽、长安及奔驰、宝马等海外品牌,豆包大模型已成为AI汽车标配 [18] - 接入豆包大模型后,车机可理解模糊指令,实现复杂车控,如奔驰纯电CLA交互效率提升50%,唤醒速度快至0.2秒 [19] 消费电子与手机行业 - OPPO、vivo、荣耀、三星等基于豆包大模型升级AI原生体验,实现多模态识物、智能创作等功能 [21] - 豆包大模型让智能助手具备持续学习能力,可结合反馈不断优化 [21] 餐饮、零售与消费行业 - 海底捞基于火山引擎HiAgent打造AI用餐管家“小捞捞”,为消费者缩减30%预定操作时间 [21] - 瑞幸咖啡的AI点单助手实现“动动嘴就能点咖啡” [21] - 中免日上的智能导购可根据用户肤质、个性化需求智能推荐产品 [21] - 火山引擎助力喜茶、库迪等连锁品牌实现统一、自动化的智能巡检,保障服务品质 [22] 企业运营与数据分析 - 赛力斯联合火山引擎创建用户之声管理平台,依托豆包大模型准确推测用户情绪,提炼反馈以提高决策效率 [21] - 极氪引入火山引擎Data Agent数据产品,内部数据需求从提出到完成分析可分钟级实现,打破效率瓶颈 [22] MaaS模式的核心竞争力 - MaaS模式将晦涩技术语言转化为可度量的效率和速度,是AI落地阶段的核心竞争力 [24] - 基于Tokens的计费方式让企业的投入产出比可以更加直观和量化,在竞争环境中是一种兼具敏捷性与确定性的战略选择 [16][23] - 火山引擎AI Agent的优势在于对各行各业在获客、销售、服务等相似环节的适配,达到跨行业的通用性 [22]
狂飙的算力基建,如何实现「价值闭环」?丨GAIR 2025
雷峰网· 2025-12-18 18:10
文章核心观点 - 实现算力基建的商业价值闭环,关键在于提供“方便、易用、便宜”的算力,并推动AI应用在具体场景中落地,帮助客户盈利或节省成本[1][12] - AI推理市场正处于爆发前夜,其全面爆发依赖于多模态应用效果的稳定和成本的显著下降,预计将带来Token消耗量的百倍级增长[5][25][30] - 2025年算力行业的关键里程碑包括DeepSeek的崛起推动AI全民化、国产超节点方案突破以及AI眼镜等硬件催生数据爆发,为2026年国产化与液冷技术普及奠定基础[31][34][36] 算力基建如何实现商业闭环 - **行业现状与痛点**:当前智算中心算力平均利用率不足40%,算力消纳是行业通病,大模型训练需求退潮后,增量需求转向分散零碎的推理场景[4] - **发展阶段转变**:算力建设从过去“重建设、轻消纳”转向“建即用、用更好”的实用导向,需从应用场景与客户需求倒推建设方案[9] - **价值闭环的核心标志**:算力价值体现在“方便、易用、便宜”三大核心点,其闭环核心是AI方案能在业务场景落地并帮助客户盈利或解决核心痛点[12][13] - **实现路径与案例**: - **节流模式**:通过算力卡回收等业务,帮助客户极致节省采购与硬件成本,有被投企业在该业务上实现数亿元营收[5][13][14] - **开源模式**:例如为房地产销售公司提供基于大模型的客户意向分析工具,直接帮助提升成交量,使开发商愿意付费[12] - **技术优化**:通过浸没式液冷方案将GPU满载温度从80-90℃降至50-60℃,有望将万卡集群平均MFU从30%提升至50%以上,降低故障率和维保成本[6][7] - **关键举措与全链路优化**:AI模型落地需极致的全链路优化,例如通过联合优化,曾将某图片生成产品的单张图片生成耗时从30秒大幅提升5-6倍性能[20][21] - **避免价值陷阱**:算力选型核心是“由应用场景及模型倒推”,而非盲目采购服务器或仅关注算力参数,需结合具体模型需求(如显存)和业务场景进行精细配置[15][16][17] 推理需求爆发与产业增长节奏 - **市场阶段判断**:2025年AI推理市场已步入爆发前夜,上半年中国MaaS市场规模已实现4-5倍增长,部分大厂预判明年增速有望达10倍[5][25] - **爆发前提条件**:全面爆发依赖大模型能力的进一步突破,尤其是多模态(视觉、图片、视频)应用效果的稳定化和成本的大幅下降[25][26] - **成本壁垒**:当前多模态应用成本过高形成显著壁垒,例如图片、视频生成因效果不确定需“抽卡”,单次任务成本负担重[26] - **技术迭代速度**:图片领域技术迭代速度显著快于文本领域,几乎每几个月就有新模型引发热议,未来潜力值得关注[5][27] - **增长预测与规模**:孙正义预测到2035年AI将渗透全球5%的GDP,形成每年9万亿美元市场,倒推未来数年推理算力需求可能保持每年十倍以上高速增长[27] - **中小企业突破口**:中小企业应聚焦垂类场景与边缘侧算力服务,例如为医院、工厂提供本地化部署的软硬件一体化方案,或融入垂类应用生态[28] - **对行业的影响与成本趋势**:AI普及需成本实现一个数量级下降,每百万Token价格需再降低10倍以上,预计未来半年至一年具备较高可行性,行业价格每6-12个月可能腰斩[29] 算力、算法、数据协同与未来展望 - **2025年关键里程碑事件**: - **模型领域**:DeepSeek的爆火重塑了大众与行业对AI的认知,推动AI从行业层面向全民应用普及,其开源也凸显了AI Infra软件的核心价值[31][32] - **算力领域**:国内华为、阿里、百度、曙光等企业推出国产化超节点方案,逐步追平国际水平,结合浸没式液冷等技术有望实现反超[34] - **数据领域**:小米、阿里等大厂入局AI眼镜,这类低功耗可全天佩戴的设备能实时抓取物理世界数据,将极大加速世界模型的训练进程[34] - **Token消耗增长预测**:若AI眼镜等产品在未来两三年内实现数亿副普及,每人日均Token消耗量有望从当前约1万提升至十万甚至几十万量级,整体Token消耗规模或将实现百倍乃至更高倍数增长[5][35] - **2025年总结**:国内AI从训练走向推理趋势明显,MaaS市场进展迅速,可总结为“推理”之年[35][36] - **2026年展望**:关键词为“国产”与“液冷”,预计更多大厂及央国企将加速转向国产芯片,同时为满足新建智算中心PUE低于1.3的要求,液冷技术将迎来爆发[36][37]
2025年中国人工智能代理行业商业模式分析 从“SaaS铁三角”到园区竞速的万亿赛道博弈【组图】
前瞻网· 2025-09-16 12:13
行业商业模式结构 - SaaS模式占据市场主导地位 市场份额达30% 主要应用于智能客服和办公自动化场景 代表企业包括百度智能云和Salesforce [1][3] - MaaS模式市场份额为15% 增速最快 核心应用于模型训练和推理服务 代表企业有商汤科技和科大讯飞 [1][3] - RaaS模式市场份额达12% 在制造业和金融领域渗透率显著提升 主要应用于流程自动化和工业机器人 代表企业包括金智维和来也科技 [1][3] - 其他模式(含AaaS/定制化)合计占比43% 主要覆盖数据分析和垂直行业解决方案领域 代表企业包括中数容智和智谱AI [3] 商业模式盈利特征 - SaaS模式采用订阅制盈利 分为基础订阅费与增值服务两大模块 主要驱动企业效率提升 [3] - MaaS模式依赖算力与模型协同创新获客 商汤科技大模型推理成本较行业低60% 支持1600+Token/秒处理速度 京东基于该平台使库存周转率提升25% [3] - RaaS模式面向人机协同自动化需求 医药企业通过RPA+AI代理处理医保数据 有效降低对账错误率并节省工作量 [3] 区域发展态势 - 上海徐汇人工智能集聚区聚集超1000家企业 2024年产值突破1100亿元 提供最高1000万元算力补贴 商汤科技2024年生成式AI收入24亿元 占总营收63.7% 算力集群达23000 PetaFlops 为中国移动构建的智能客服对话准确率达95% [4] - 合肥中国声谷聚集超2400家企业 智能语音全球市场占有率第一 形成全产业链闭环 科大讯飞教育AI覆盖5万余所中小学 学生成绩提升15% 医疗AI助力基层医院诊断准确率提升35% 系统接入3000余家医院 [4] 行业驱动因素 - 技术融合加速:2025年多模态交互技术成熟 语言模型普遍具备多模态能力 人工智能代理自主决策推动软件开发效率指数级提升 [7] - 政策支持:工信部推动"AI+制造"行动 制定智能体技术规范 [7] - 生态协同:杭州和深圳通过算力券发放及项目补贴强化生态建设 [7] 技术落地趋势 - 多模态交互和边缘计算将率先落地消费电子和工业场景 [8] - 自主决策优化技术在金融和医疗等高价值领域商业化进程较慢 但长期增长潜力显著 [8] 商业模式财务指标 - SaaS模式毛利率达60%-80% 客户留存率75%-90% 单客户年均消费5-50万元 [11][12] - MaaS模式毛利率为40%-60% 客户留存率60%-75% 单客户年均消费10-200万元 [11][12] - RaaS模式毛利率30%-50% 客户留存率50%-65% 单客户年均消费20-100万元 [11][12]