端侧大模型

搜索文档
端侧大模型20250801
2025-08-05 11:18
行业与公司 **行业**:端侧AI大模型发展(手机、PC、边缘设备等硬件载体)[1][2][3] **涉及公司**: - **海外**:Meta(LAMA系列)、微软(Phi-3系列)、谷歌(Gemini/Gamma)、苹果(A18芯片)、高通(骁龙8G3/8G4芯片)[1][3][15][16][17] - **国内**:腾讯(混元模型)、阿里(通义千问)、字节(豆包)、DeepSeek(征流技术)[22][23][25][26][27] --- 核心观点与论据 **1 端侧AI的驱动因素** - **硬件升级**:芯片NPU算力提升(如苹果A18、高通骁龙8G4支持7B至100亿参数模型运行,算力达35-50 TPS)[1][3][13] - **架构优化**:MOE(混合专家)和分组查询注意力技术降低内存占用(如微软Phi-3.5仅调用1-2个专家而非全部16个)[5][6][7][20] - **知识密度提升**:模型量化(高精度浮点数转低精度整数)、动态剪枝(适配数据集剪枝冗余参数)[8][9][11][12] **2 国内外技术路径对比** - **海外领先**:Meta LAMA系列为端侧模型底座,微软Phi-3.5擅长多语言任务,谷歌Gamma基于Gemini优化部署安卓设备[15][16][20][21] - **国内跟随与细分突破**: - 腾讯混元13B支持快慢思考模式(算力自适应),阿里通义千问205在演讲稿生成媲美人类[25][26] - DeepSeek通过征流技术压缩模型(小模型性能接近大模型)[10][22] **3 应用场景与商业化** - **硬件载体**:AI手机(Pixel集成Gamma)、AI PC(微软Windows平台)、AI眼镜(Meta)[17] - **国内落地**:字节豆包支持浏览器自动化(订酒店、票据识别),腾讯小程序为入口场景[27] --- 其他重要内容 - **隐私与协同**:端云协同弥补端侧算力限制,同时保障数据隐私[13] - **性能对比**:谷歌Gamma 7B模型评测优于LAMA2同参数模型[21] - **开源影响**:Meta LAMA免费开源推动行业标准建立[15][18] (注:原文未提及具体财务数据或百分比变化,故未引用)
取代LPDDR,华为和苹果都看上的HBM有何魔力
36氪· 2025-07-06 10:03
行业技术趋势 - 高通骁龙8至尊版主控搭配LPDDR5X Ultra内存和UFS4 1闪存构成性能铁三角,成为2025年秋季以来Android旗舰机的宣传重点[1] - 华为可能抢先苹果在智能手机中应用HBM内存,而苹果此前传闻将在20周年纪念版iPhone上采用HBM技术[2] - HBM内存基于3D堆栈技术,通过TSV和微凸块工艺实现多层DRAM芯片垂直堆叠,与传统DDR的并行总线架构有本质区别[2][4] HBM技术优势 - HBM3E传输速率达9 6GB/s,带宽1 2TB/s,是LPDDR5X带宽(1066 6MB/s)的1180倍[6] - HBM采用1024位数据总线宽度(对比LPDDR5X的64位),通过硅中介层实现3D堆栈,大幅提升数据吞吐量[6] - 3D堆栈设计可缩短数据传输路径,节省芯片面积,为手机内部空间设计提供更多灵活性[4][10] 成本与商业化挑战 - HBM因硅中介层(如台积电CoWoS、英特尔EMIB)导致成本极高,约为GDDR内存的3倍[8] - 目前仅苹果、华为等溢价能力强的厂商具备在智能手机中率先商用HBM的条件[10] - AI大模型训练需求催化HBM市场,2013年SK海力士已量产但近年才因AI爆发获得强劲需求[10] 手机行业应用前景 - AI手机发展趋势推动HBM应用,端侧大模型需要高带宽(加速数据访问)和大容量(存储参数)[11] - 端侧模型在隐私保护方面的优势将促使HBM逐步取代LPDDR成为未来智能手机标配[11] - 3D堆叠技术节省的空间可优化机身内部设计,强化厂商在AI手机赛道的竞争力[11]
【美格智能(002881.SZ)】双轮驱动,成长空间广阔——跟踪报告之六(刘凯/林仕霄)
光大证券研究· 2025-07-03 21:42
公司产品策略 - 公司采用无线通信模组+物联网解决方案双轮驱动的产品策略,打造差异化和创新力的核心竞争优势 [2] - 公司在智能模组、高算力模组及智能座舱、FWA、IoT等垂直行业提供定制化解决方案 [2] - 公司产品可提供0.2T到48T的异构算力,支持大模型在端侧部署和运行,并灵活匹配5G/WIFI/千兆以太网等通信方式 [2] 研发投入与技术发展 - 2024年公司研发投入金额为2.56亿元,占营收比例为8.69% [3] - 公司重点在高算力模组行业应用、4G/5G智能座舱模组、车规级5G+V2X模组、端侧大模型部署等领域加大投入 [3] 资本市场动态 - 公司H股上市备案申请材料获中国证监会接收,计划在香港联交所主板挂牌上市 [4] - 公司向95名激励对象授予50万股限制性股票,授予价格为22.84元/股,并向4名激励对象授予50万份股票期权,行权价格为45.67元/份 [5]
美格智能(002881):双轮驱动,成长空间广阔
光大证券· 2025-07-03 13:12
报告公司投资评级 - 维持“增持”评级 [3][5] 报告的核心观点 - AI应用有望带动公司产品需求快速增长,智能模组/高算力模组产品持续迭代,有望带动公司业绩高速增长,看好公司长期成长空间 [3] 根据相关目录分别进行总结 公司业务与战略 - 坚持无线通信模组 + 物联网解决方案双轮驱动产品策略,以智能模组、高算力模组和智能座舱、FWA、IoT等垂直行业定制化解决方案打造核心竞争优势 [1] - 在智能模组及解决方案领域经验丰富,在高算力模组及生成式AI应用领域持续投入,向具身智能机器人、消费类物联网、智能无人机等行业拓展 [1] - 针对专用场景开发的模组产品可提供0.2T到48T异构算力,支持大模型在端侧部署和运行,可灵活匹配各类通信方式 [1] 公司研发与上市 - 2024年研发投入2.56亿元,占营收比例8.69%,重点在高算力模组行业应用等领域加大投入 [2] - 发行境外上市股份(H股)备案申请材料获中国证监会接收,已向香港联交所递交申请并刊登资料 [2] 公司激励计划 - 2025年6月10日确定向95名激励对象授予限制性股票50万股,授予价格22.84元/股,向4名激励对象首次授予股票期权50万份,行权价格45.67元/份 [3] 盈利预测与估值 - 上调25 - 26年归母净利润预测为1.82/2.67亿元,较前次上调幅度19%/41%,新增2027年归母净利润预测为3.57亿元,当前股价对应PE 66/45/34X [3] 财务数据 利润表 - 2023 - 2027E营业收入分别为21.47亿、29.41亿、38.73亿、47.17亿、55.56亿元,增长率分别为 - 6.88%、36.98%、31.67%、21.79%、17.79% [4][7] - 2023 - 2027E归母净利润分别为6500万、1.36亿、1.82亿、2.67亿、3.57亿元,增长率分别为 - 49.54%、110.16%、34.25%、46.43%、33.97% [4][7] 现金流量表 - 2023 - 2027E经营活动现金流分别为 - 3100万、 - 1.3亿、3.08亿、2.38亿、3.84亿元 [7] - 2023 - 2027E投资活动产生现金流分别为 - 9800万、1700万、 - 1.36亿、 - 1.5亿、 - 1.59亿元 [7] - 2023 - 2027E融资活动现金流分别为1.91亿、3.06亿、 - 1.35亿、 - 300万、 - 1.41亿元 [7] 资产负债表 - 2023 - 2027E总资产分别为21.45亿、27.6亿、30.32亿、33.81亿、36.96亿元 [8] - 2023 - 2027E总负债分别为6.65亿、11.92亿、13.18亿、14.36亿、14.43亿元 [8] - 2023 - 2027E股东权益分别为14.8亿、15.67亿、17.14亿、19.44亿、22.53亿元 [8] 主要指标 - 2023 - 2027E毛利率分别为19.2%、17.0%、17.5%、18.2%、18.8% [9] - 2023 - 2027E ROE(摊薄)分别为4.4%、8.7%、10.6%、13.7%、15.8% [4][9] - 2023 - 2027E资产负债率分别为31%、43%、43%、42%、39% [9] 费用率与每股指标 - 2023 - 2027E销售费用率分别为2.97%、2.01%、2.00%、2.00%、2.00% [10] - 2023 - 2027E每股红利分别为0.10元、0.13元、0.14元、0.18元、0.20元 [10] 估值指标 - 2023 - 2027E PE分别为187、89、66、45、34 [4][10] - 2023 - 2027E PB分别为8.2、7.7、7.0、6.2、5.4 [4][10]
功能推陈出新、高端占比增长—— 以旧换新拉动手机消费升级
经济日报· 2025-06-26 05:53
消费品以旧换新政策效果 - 截至5月31日消费品以旧换新五大品类带动销售额1.1万亿元 发放补贴约1.75亿份 [1] - 5352.9万名消费者购买手机等数码产品5662.9万件 [1] - 前4个月国内市场手机出货量9470.8万部同比增长3.5% 其中5G手机8093.2万部同比增长5.6%占比85.5% [1] 智能手机市场特征 - 行业呈现明显头部特征 前五大品牌市场集中度进一步提升 [1] - 中高端市场占比增长 低端产品市场占比下降 出现消费升级 [1] - 智能手机用户平均换机周期从18个月延长至约40个月 设备更新需求进入释放窗口期 [2] 智能手机销量增长驱动因素 - 手机首次纳入国家补贴政策范围 对6000元以下手机按售价15%给予最高500元补贴 [2] - 厂商发布搭载端侧大模型的AI手机 AI功能和跨终端交互成为重要卖点 [2] - 折叠屏、超薄屏手机凭借便携性和趣味玩法提供新选择 [2] - 经济环境改善注入消费动能 厂商优化库存水平和营销创新推动终端销售增长 [2] 行业技术发展趋势 - AI技术加速渗透 主流厂商构建AI大模型体系 实现全链路优化 [3] - AI技术重构用户体验 涵盖影像、语音交互、个性化服务等场景 [3] - 高端市场格局可能变化 国产手机或缩小与苹果的差距 [3] - 产品创新围绕电池技术突破、AI融合、影像功能升级、折叠屏发展等核心痛点 [4] 市场前景展望 - 中国智能手机市场处于技术迭代与结构升级关键阶段 [4] - 政策红利、消费周期与技术创新多重叠加 推动行业向更具价值深度方向演进 [4]
小米小爱同学:资源受限下,实现端侧大模型的高性能推理
AI前线· 2025-06-25 12:15
端侧大模型工程化挑战与解决方案 - 端侧部署面临模型体积、推理时延、功耗和更新机制等极高要求,需融合系统优化、模型压缩和软硬件协同[1] - 小米团队通过自研推理框架实现180 tokens/s实时推理性能,采用LoRA插件化+共享基座模型支持多业务复用[1] - 未来突破将依赖面向大模型优化的硬件能力提升和模型架构演进如Linear Attention[1] 商业化部署核心技术门槛 - 端侧设备资源限制导致可部署模型参数量难以超过4B,低比特量化造成效果损失[3] - 大模型快速迭代与端侧更新机制滞后形成矛盾,云端更新更灵活[3] - 当前处于技术积累阶段,需等待计算能力提升或模型稳定后进入部署阶段[3] 自研推理框架优化策略 - 动态输入支持通过自动切分输入尺寸提升资源利用率,避免传统padding方式浪费[6] - 投机推理在端侧实现7-10倍decoding加速,推理速度从20+tokens/s提升至200 tokens/s[6] - 量化与指令级优化通过Neon指令集加速CPU操作[7] 业务需求对架构设计的约束 - 语音助手业务链路由感知、理解和满足三阶段串行执行,并发需求较弱[7] - 端侧NPU硬件设计以串行执行为主,multi-batch收益有限[8] - 通过调度和切换机制保障各业务链路在预期时间内完成推理[8] 共享基座架构设计 - 12GB内存手机部署4B模型需近3GB内存,采用共享基座+LoRA插件化实现多业务复用[9] - 运行时动态切换不同业务LoRA模块,实现参数共享+差异定制[10] - 该架构在内存利用率和扩展能力上具有优势[10] 跨芯片平台部署策略 - 框架设计采用模块化、后端解耦思路,抽象通用接口适应不同硬件平台[11] - 大模型优化技术更多针对模型结构特性,与底层硬件绑定程度较浅[11] 性能优化组合策略 - 低比特量化、并行解码、带宽控制等技术可同时组合使用[12] - 优先选择技术价值大、适用面广、无冲突的优化方式[12] - 模块化分层设计使上层调用无需关心底层适配逻辑[12] 未来技术突破方向 - 硬件进步是关键突破点,新一代面向大模型的端侧芯片将大幅增强能力[14][15] - Linear Attention架构可解决Transformer内存随context增长的问题[16] - 多模态任务输入长度增长使传统Transformer面临资源瓶颈[16][17]
速递|逆势狂奔!面壁智能再获数亿元融资,端侧大模型成资本新宠
搜狐财经· 2025-05-21 19:27
融资情况 - 公司已完成新一轮数亿元融资,投资方包括洪泰基金、国中资本、清控金信和茅台基金 [2] - 在13个月内连续完成3轮数亿元融资,成为国内大模型领域融资节奏最快的企业之一 [2] - 2024年4月融资由春华创投领投,北京市人工智能产业投资基金、知乎跟投,用于加速端侧大模型研发和智能座舱场景落地 [3] - 2024年12月融资由龙芯创投、鼎晖百孚、中关村科学城基金、赛富投资基金领投,北京市人工智能产业投资基金、清科创投跟投,用于深化与芯片厂商合作 [3] - 2025年5月最新一轮融资用于构建"端侧大脑"技术壁垒,推进千行百业规模化应用 [4] 技术优势 - 公司以"知识密度"替代参数堆砌,聚焦端侧模型研发 [4] - 专注于打造同等参数下性能更高、成本更低、功耗更低、速度更快的高效大模型 [4] - 通过MiniCPM系列实现端侧GPT-4o级能力,总下载量破千万次 [4] - 模型压缩技术降低75%推理成本 [4] - 2025年1月发布首个端侧全模态模型面壁小钢炮MiniCPM-o 2.6,多项关键能力为业界首创 [5] 商业化进展 - 端侧模型优势与智能座舱场景契合,与长安汽车、上汽大众、长城汽车等车企合作 [5] - 首款搭载端侧模型MAZDA EZ-60已于2025年4月上市,实现纯本地化语音/视觉/车控交互 [5] - 与高通、英特尔、联发科技等企业深度合作,推动端侧原生智能座舱落地 [6] - AI能力已应用到法律、教育等领域 [6] 发展战略 - 新一轮融资将用于加深技术壁垒,持续推动大模型商业化进程 [3] - 致力于为AGI时代的到来贡献力量 [3] - 目标是为大模型行业赋能提供充足供给 [2]
端侧大模型加速破圈!面壁智能获新一轮数亿元融资
机器人圈· 2025-05-21 17:40
面壁智能融资动态 - 公司近期完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 资金将用于构筑高效大模型技术壁垒和加速行业生态拓展 [1] - 2024年累计完成三笔数亿元级融资 4月由春华创投领投 12月由龙芯创投、鼎晖百孚等联合领投 北京市人工智能产业投资基金持续跟投 [1] 端侧大模型技术突破 - 公司定位高效低耗大模型研发 2025年1月发布全球首个端侧全模态模型MiniCPM-o 2.6 具备实时多模态交互能力 技术指标达国际领先水平 [2] - MiniCPM系列实现端侧ChatGPT/GPT-4V/GPT-4o功能 获2024年Hugging Face最多下载中国大模型称号 全平台累计下载量突破1000万次 [2] 机器人行业动态 - 2024年机器人上市公司年报显示行业分化加剧 部分企业业绩承压 但AI技术融合带来新机遇 [5] - 人形机器人领域呈现爆发态势 量产推进引发价格战 越疆科技港股上市后市值增长三倍 [5] - 学术研究取得多项进展 包括微纳感知赋能具身智能、仿生机器人地形适应技术等 [5][6] 人工智能前沿研究 - 院士专家提出行为智能与产品智能双驱动模型 强调机构智能技术对变形机器人落地的关键作用 [6] - 机器人创新设计聚焦六大关键技术 智能制造协同成为产业新动能 [6]
面壁智能完成新一轮数亿元融资 重点布局端侧大模型
中国经营报· 2025-05-21 16:16
融资动态 - 面壁智能完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 [1] - 公司自2024年以来已完成三轮融资 上一轮融资于2024年12月完成 规模同样为数亿元 [1] - CEO表示本轮融资将加深技术壁垒并推动大模型商业化进程 [1] 公司背景 - 公司创立于2022年8月 由清华大学NLP实验室孵化 联合创始人包括清华大学计算机系副教授刘知远 [1] - 采用"以小博大"策略 通过低成本、小参数实现高效率 区别于行业主流做大参数的路径 [2] - 较早明确"端侧大模型"战略方向 专注终端设备本地运行的AI模型 [2] 行业趋势 - 端侧大模型成为AI行业新增长引擎 预计2025年加速渗透消费电子和工业领域 [3] - 中国端侧AI市场规模预计从2023年千亿级增长至2028年1.9万亿元 [4] - 行业出现路径分化 部分企业转向垂直领域如医疗AI或B端服务 [2] 技术特点 - 端侧大模型通过轻量化技术压缩参数 实现设备端独立计算 解决云端部署的延迟和隐私问题 [2][4] - 推出80亿参数的全模态模型MiniCPM-o 2.6 具备图像理解、语音和多模态交互能力 [5] - 投资方认为端侧最能体现高知识密度 未来人机交互将向多模态融合发展 [3] 商业化进展 - MiniCPM系列平台累计下载量突破1000万 [5] - 在汽车领域与长安马自达等车企合作 首款量产车型MAZDA EZ-60已上市 [5][6] - 司法领域落地全国首个审判垂直领域大模型 辅助立案29.1万件 生成文书1.16万份 [6] - 教育领域与清华合作推出AI学生成长助手"清小搭" [6]
面壁智能完成新一轮融资 加快“端侧大脑”应用千行百业
证券日报· 2025-05-21 15:42
融资情况 - 公司完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 [1] - 2024年以来已顺利完成3轮融资 本轮融资将用于构筑高效大模型技术、产品壁垒及加速行业赋能 [1] 技术发展 - 公司以"高效"为第一性原理 专注于打造同等参数下性能更高、成本更低、功耗更低、速度更快的高效大模型 [1] - 已形成全模态、多模态与基座模型组成的完整矩阵 持续刷新端侧大模型能力边界 [1] - 2025年1月发布首个端侧全模态模型"小钢炮"MiniCPM-o 2.6 以8B规模实现全模态实时交互 首创"持续看、实时听、自然说"功能 [2] - MiniCPM系列全平台下载量累计破1000万 被评为2024年Hugging Face最多下载、最受欢迎中国大模型 [2] 商业化进展 - 发布"小钢炮超级助手cpmGO" 是全球首个落地车端的纯端侧智能助手 在车规级SoC上本地完成语音、视觉、车控推理 [3] - 2025年4月首款搭载端侧模型的量产车型长安马自达MAZDA EZ-60全球首秀 标志端侧大模型在汽车座舱领域商业化落地 [3] - 与多家顶级车企完成多款车型定点 并与高通、英特尔等标杆企业深度合作 推动端侧原生智能座舱广泛落地 [3] 行业趋势 - 2025年全球人工智能竞赛进入白热化 以"高效、低耗"为代表的创新路径开始引领全球AI变革 [1] - 大模型已进入行业赋能的加速时刻 需要技术、市场具备前沿性判断 并为行业赋能提供充足供给 [3]