AI大模型私有化部署
搜索文档
智谱,会重蹈「AI四小龙」覆辙吗?
雷峰网· 2026-01-12 18:08
智谱的业务模式与AI四小龙的相似性 - 公司面向To G的AI大模型私有化部署业务占总营收的84.8%,业务结构与当年的AI四小龙(商汤、旷视、云从、依图)高度相似 [2][5] - 2022年其私有化部署业务营收占比高达95.5%,2025上半年仍维持在85%左右 [6] - 与AI四小龙类似,公司业务本质是“啃项目、做集成、搞私有化部署”的重型交付,核心技术从视觉识别换成了AI大模型 [5][6] To G政企项目的固有难题 - 政企项目存在交付重、定制化程度高、毛利低、审批周期长、回款慢等普遍问题,严重挤压企业利润 [8] - 公司亏损持续加速扩大:2022年亏损0.97亿元,2024年亏损24.66亿元,2025上半年亏损17.52亿元,累计亏损超62亿元,而同期总营收仅6.85亿元 [8] - 行业壁垒不高,公司需被动跟随客户需求,例如2025年初DeepSeek的出现打乱了公司一批已签约订单,被迫在服务中加入竞争对手模块 [9] - 该模式难以形成规模效应和盈利,此前AI四小龙和云大厂均因此陷入长期亏损 [9] To G项目作为冲营收与上市的工具 - To G项目单笔金额大(百万、千万甚至上亿级别),能快速做高公司营收,美化财务报表,是早期投入大、盈利难的科技公司实现上市的务实捷径 [12][13] - 2025年春节前后,公司给各业务线分派了数亿元项目制KPI,旨在冲刺上市业绩,但执行层面面临人力与成本压力 [13] - 公司挖来前旷视高级副总裁陈雪松负责政企业务,其曾将旷视To G营收推上快车道,此举明确了公司“啃To G,做营收,冲上市”的战略意图 [14] 资本市场对To G模式的态度转变 - 2018-2019年AI投资热潮中,拥有政企订单的AI公司是资本宠儿,形成“拿到订单就能融到钱”的共识 [17] - 热潮退去后,资本市场认识到该模式本质是难以规模化复制的“项目制+定制化”传统IT施工,增长依赖新订单,缺乏产品壁垒和用户粘性 [17] - 2021年起,AI政企服务领域融资额大幅下滑,AI四小龙上市后市场反响冷淡,例如云从科技上市后股价较高点回落超30%且持续亏损 [18] 智谱与AI四小龙的差异化变量 - 公司引入了更为广泛多元的地方资本,包括杭州国资、珠海华发、上海国资、北京人工智能产业基金等,融资额超20亿元人民币 [20] - 地方投资通常附带落地要求,形成“地方资本绑定+区域实体落地”的深度产政融合模式,有助于公司获得持续订单和政策红利 [21] - 公司以人民币基金为主,相比早期采用VIE架构瞄准美股的AI公司,在开展To G业务时更为自洽 [21] - 大模型技术相比上一波视觉识别技术,与互联网关联度更高,更具To C属性,拥有更大的市场化想象空间和技术壁垒 [22] 可借鉴的AI To G成功样本 - 科大讯飞和优必选是真正跑通To G重资产模式的样本,其通过与地方合作建厂或承担项目,在贡献税收和就业的同时,获得项目资源并为自身硬件产品拓展销路 [24] - 公司正在向该模式靠拢,凭借地方投资获得“信用背书”和“资源门票”,并借助大模型技术寻求新业务破局机会 [24] - 这类深度绑定地方产业的模式被资本市场视为集政策红利、营收确定性与技术变量于一体的“黄金玩法”,愿意给予高估值 [26] 智谱未来的潜在出路与挑战 - 若延续当前To G老路,公司市值可能像云从、云天励飞等公司一样,经历“概念热捧-商业化不及预期-深度回调”的过程,困于几百亿甚至不足百亿区间,且难以盈利 [27] - 破局路径一:向科大讯飞看齐,在To G业务外,发展标准化、偏To C的大模型消费级软硬件产品,通过规模效应摊薄成本并提升市值想象空间 [29] - 破局路径二:上市融资后,转向二级市场青睐的壁垒高、通用化业务(如芯片),用新叙事重构估值逻辑,类似云天励飞的转型之路 [29] - 破局路径三:遵循创始人方向,全面回归基础模型研发,坚守技术初心,尝试走“中国版OpenAI”的突围之路 [29] - 上市是公司成长的起点,若想在大模型产业中打开更广阔成长版图,一场深刻的二次蜕变不可避免 [28][29]
中金 | AI 进化论(3):DeepSeek本地部署需求盛行,一体机硬件乘风而上
中金点睛· 2025-03-06 07:11
文章核心观点 - DeepSeek开源大模型推动私有化部署新趋势,其R1模型在性能、开源策略、硬件成本和适配优化方面具备优势,有望推动包括DeepSeek一体机在内的本地私有化部署需求快速提升,利好算力硬件需求 [1][7][12] DeepSeek开源大模型特点及影响 - DeepSeek V3版本模型以仅1/10训练成本获得与海外领先模型对标能力,R1模型在少量标注数据下提升推理能力,性能比肩OpenAI o1正式版,且于2025年2月24日启动“开源周”丰富开源生态 [7] - 高质量开源模型推动AI大模型能力边界探索和应用落地,利好算力硬件需求;DS在C端APP下载量呈指数级增长,在B端加速垂直领域渗透,45%央企已完成DS模型部署 [8] - 大模型云端部署带动云端算力需求提升,R1模型有望推动云资源消耗量提升,阿里云收入增速和资本开支增长积极 [10] - DeepSeek部署不止于云端,本地化私有部署保障数据安全,C端“云端协同”优化体验与隐私保护,B端部分行业刚性需求驱动本地化部署 [11] C端:DeepSeek - R1+蒸馏技术,轻量化模型推动AI端侧部署 DeepSeek - R1蒸馏 - 知识蒸馏将671B参数量的“教师模型”决策逻辑和特征表征能力迁移至轻量“学生模型”,生成6个不同版本蒸馏模型 [15] - 蒸馏版模型推理性能超越同规模传统模型,在多个推理基准测试中表现优异,兼具经济性与有效性 [16] 蒸馏模型本地部署 - 蒸馏模型减少对显存、内存和存储需求,适合搭载于资源受限终端设备,不同版本参数蒸馏模型需选择合适终端硬件配置 [19][20] - PC是承载本地模型重要终端,DeepSeek - R1轻量化模型推动AI PC升级,换机动力有提升空间,端侧模型进化与硬件迭代形成飞轮效应 [21] B端:AI私有化部署新趋势,DeepSeek一体机的全栈式解决方案 DeepSeek一体机重构本地私有化AI部署模式 - DeepSeek R1全参数模型对系统显存等提出更高要求,一体机是“开箱即用”智能算力解决方案,重构本地私有化AI部署模式 [24][25][26] - 一体机具备深度优化的高性能硬件、内置多种基座大模型、全栈工具链等优势,可缩短部署周期、降低落地门槛 [26][27] DeepSeek一体机软硬件协同难点 - 主流国产AI训练芯片缺少对FP8精度支持,采用16位精度单元计算会大幅降低效率,显存需求增加 [28] - 为在单台8卡服务器上实现全参数DeepSeek R1模型,厂商需进行定点量化,在优化算力效率与保障模型效果间寻求平衡 [30][32] DeepSeek一体机迎合本地化部署需求,市场空间广阔 - 一体机私有化部署满足企业数据安全及合规需求,降低AI大模型部署门槛,减弱B端用户对云的依赖 [33][34][36] - 预计乐观情景下2025年政府、金融等行业约5%的服务器需求转向DeepSeek一体机,需求达7万台,市场规模有望达540亿元 [38][40] 国产算力产业链全方位适配DeepSeek,服务器及云厂商拥抱一体机趋势 - 国产主流GPU厂商宣布适配DeepSeek,超过160家国产算力产业链企业完成适配,昇腾等国产GPU成为重要底层算力支撑 [40] - 算力硬件厂商、云厂商等推出DeepSeek一体机,看好整机环节头部的一体机供应商 [42]