报告行业投资评级 * 报告未明确给出行业投资评级 [1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27][28][29][30][31][32][33][34][35][36][37][38][39][40][41][42][43][44][45][46][47][48][49][50][51][52][53][54][55][56][57][58][59][60][61][62][63][64][65][66][67][68][69][70][71][72][73][74][75][76][77][78][79][80][81][82][83][84][85][86][87][88][89][90][91][92][93][94][95][96][97][98][99][100][101][102][103][104][105][106][107][108] 报告核心观点 * 端侧大模型是运行在智能手机、IoT、PC、机器人等本地设备上的大规模人工智能模型,参数量通常小于云端大模型,可在设备端直接进行推理,具有低延迟、高隐私保护等优势 [3][13][15] * 生成式AI市场的兴起和下游应用(如手机、自动驾驶)的强劲需求正驱动端侧大模型市场高速增长,2023年中国市场规模达8亿元,预计2024年将增长至21亿元,2023-2028年复合年增长率(CAGR)为58% [4][28][29][31] * 端侧大模型在成本、能耗、可靠性、隐私和个性化方面相比云端推理具有显著优势,是实现AI处理从中心云向边缘及端侧转移的关键 [3][25][27] * 行业面临技术复杂性、硬件限制、数据隐私、开发成本和市场标准等多重壁垒,需要产业链深入合作以推动广泛应用 [3][74][76][77][78][79] * 依托技术实力和生态建设,商汤科技、阿里云、面壁智能等头部厂商已率先在端侧大模型领域取得突破,未来竞争将围绕技术融合与生态系统构建展开 [4][81][83][84][85] 行业概述 * 定义与分类:端侧大模型定义为运行在设备端的大规模人工智能模型,通常部署在智能手机、IoT、PC、机器人等本地设备上 [3][13][15] 与云端大模型相比,其参数量更小(多为十亿级别),且推理过程在端侧完成,无需依赖云端算力 [15][16][17] * 发展历程:端侧大模型的发展得益于大模型兴起(如2018年BERT、2020年GPT-3发布)、模型压缩与优化技术(如知识蒸馏)、硬件加速(如TPU、边缘计算芯片)以及软件框架改进(如TensorFlow Lite、ONNX)的共同推动 [18][19][20][21][22][23] * 驱动力: * 成本优势:AI推理规模远高于训练,云端推理成本极高,向端侧转移可支持规模化扩展 [27] * 能耗优势:边缘终端能够以很低的能耗运行生成式AI模型 [27] * 可靠性与低延迟:端侧处理可避免网络拥堵带来的高时延和服务拒绝,提供媲美甚至优于云端的性能 [27] * 隐私与安全:查询和个人信息完全保留在终端,有助于保护用户隐私和公司机密 [27] * 个性化:可在不牺牲隐私的情况下,根据用户行为、喜好等进行定制化服务 [27] * 市场规模:2023年中国端侧大模型市场规模达8亿元,持乐观估计,预计2024年将达21亿元,2028年预计达79亿元,2023-2028年CAGR为58% [4][28][29][31] 市场增长由生成式AI兴起、AI芯片等算力市场带动,以及手机、自动驾驶等下游需求强力拉动 [4][29] 产业链分析 * 产业链图谱:上游主要包括AI芯片供应商、云计算服务商及数据服务商;中游为端侧大模型科技厂商和端侧科技企业;下游通过设备企业应用于汽车、教育、金融、医疗、泛娱乐等行业 [34][35] * 模型压缩技术:知识蒸馏是关键技术之一,通过将大模型(教师模型)的知识转移到小模型(学生模型),在保持较高性能的同时大幅减少参数量和计算复杂度,例如TinyBERT参数量可减少至BERT的1/7左右 [37][39][40] * 成本构成:端侧大模型成本主要由硬件成本(60%,如AI芯片)、研发成本(30%,如人员与设备)和其他成本(10%)构成 [42][43] AI芯片是加速应用的关键,研发需兼顾人员成本(如美国深度学习工程师平均年薪约14万美元)和显卡成本(如NVIDIA GeForce RTX 3090价格约1500美元) [44][45] * 厂商类型: * 端侧大模型厂商:通过许可费、订阅和定制化开发等模式,为企业客户、互联网公司和开发者提供智能化解决方案 [47][48] * 终端设备厂商:通过硬件销售和增值服务模式,将端侧大模型集成到AI手机、AI PC等产品中,面向消费者和企业客户 [47][49] * 行业场景:行业应用潜力取决于数据安全与隐私需求、智能设备普及度及AI技术成熟度 [3][51] 金融、医疗、政务等对数据安全要求高的行业,以及教育、汽车等智能设备普及度高的行业具有较大发展潜力 [53][54][55] * 业务场景: * 核心强需求场景:基于对数据隐私、计算实时性及个性化的强需求,AI手机、自动驾驶和机器人成为三大核心应用场景 [58][63] AI手机保障数据隐私和计算实时性 [59] 自动驾驶依赖端侧实现实时决策和安全性 [60] 机器人通过端侧计算提供个性化服务和效率提升 [61] * 技术场景成熟度:文本生成和图片生成场景相对成熟;音频生成逐步发展;视频生成和多模态生成尚处于起步阶段 [64][65][66][67][69] 行业分析 * 政策分析:中国政府将人工智能视为国家战略核心,在AI基础设施及生成式AI方面设立规范,整体政策环境有利于AI产业及端侧大模型的健康发展 [72][73] 例如2023年网信部发布的《生成式人工智能服务管理暂行办法》在提供支持的同时也明确了合规要求 [73] * 行业壁垒:主要包括技术复杂性与硬件限制(模型优化难、算力存储有限、能耗管理严) [74][76] 数据隐私与安全挑战 [74][77] 高额的开发与维护成本 [74][78] 以及缺乏统一行业标准、市场需求待培育和用户接受度等市场应用壁垒 [74][79] * 竞争格局:头部大模型厂商依托云端技术优势和生态建设,正加速布局端侧市场 [4][81][83] 商汤科技、阿里云、面壁智能处于领导者地位 [81][82] 未来竞争将围绕技术融合创新(如跨领域技术集成)和生态系统构建(如与芯片商、硬件商深度合作)展开,例如端侧大模型推动2023年全球边缘AI芯片出货预计达22.86亿颗 [84][85] * 发展趋势: * 端侧大模型与云端大模型将在竞争与协作中共存,前者在延迟、隐私方面的优势将愈发凸显,后者在复杂计算上仍不可替代 [87][89] * 手机、自动驾驶和机器人等领域的需求将成为重要推动力,驱动端侧大模型在个性化、实时响应、隐私保护等方面持续优化 [87][89] * 未来将在模型压缩、硬件加速等技术持续突破,联邦学习等隐私保护技术应用深化,以及产业合作与标准化推进的生态系统建设方面呈现多重趋势 [90] 典型厂商分析 * 阿里云: * 优势体现在高效能、低门槛和自适应性 [94][95] * 与MediaTek深度合作,在天玑移动平台完成通义千问端侧部署,实现离线多轮对话 [95] * 正进行全栈技术升级,致力于打造AI时代最开放的云 [95] * 商汤科技: * 优势在于技术领先与性能卓越、广泛的应用场景与解决方案 [97][103] * 日日新5.0端侧大模型推理速度领先,在中端性能手机上达18.3字/秒,高端旗舰手机达78.3字/秒 [100][103] * 多模态扩散模型在手机端推理速度小于1.5秒,比云端快10倍 [100] * 模型能力在知识、数学、推理等方面大幅提升,综合能力对标GPT-4 Turbo [99][102][103] * 面壁智能: * 优势包括高效推理能力、创新性多模态整合、“以小博大”的性能、高效低成本及广泛设备兼容性 [104][107] * MiniCPM系列模型参数规模小(如1.2B、2B)但性能出色,其中英文平均成绩超越Mistral-7B [105][107] * 通过技术优化实现10倍推理加速,成本降低90% [106][107] * 多模态模型MiniCPM-V 2.0在幻觉能力方面与GPT-4V持平,并具备惊艳的OCR表现 [105]
中国端侧大模型行业研究:算力优化与效率革命如何重塑行业生态