Workflow
端侧大模型
icon
搜索文档
取代LPDDR,华为和苹果都看上的HBM有何魔力
36氪· 2025-07-06 10:03
行业技术趋势 - 高通骁龙8至尊版主控搭配LPDDR5X Ultra内存和UFS4 1闪存构成性能铁三角,成为2025年秋季以来Android旗舰机的宣传重点[1] - 华为可能抢先苹果在智能手机中应用HBM内存,而苹果此前传闻将在20周年纪念版iPhone上采用HBM技术[2] - HBM内存基于3D堆栈技术,通过TSV和微凸块工艺实现多层DRAM芯片垂直堆叠,与传统DDR的并行总线架构有本质区别[2][4] HBM技术优势 - HBM3E传输速率达9 6GB/s,带宽1 2TB/s,是LPDDR5X带宽(1066 6MB/s)的1180倍[6] - HBM采用1024位数据总线宽度(对比LPDDR5X的64位),通过硅中介层实现3D堆栈,大幅提升数据吞吐量[6] - 3D堆栈设计可缩短数据传输路径,节省芯片面积,为手机内部空间设计提供更多灵活性[4][10] 成本与商业化挑战 - HBM因硅中介层(如台积电CoWoS、英特尔EMIB)导致成本极高,约为GDDR内存的3倍[8] - 目前仅苹果、华为等溢价能力强的厂商具备在智能手机中率先商用HBM的条件[10] - AI大模型训练需求催化HBM市场,2013年SK海力士已量产但近年才因AI爆发获得强劲需求[10] 手机行业应用前景 - AI手机发展趋势推动HBM应用,端侧大模型需要高带宽(加速数据访问)和大容量(存储参数)[11] - 端侧模型在隐私保护方面的优势将促使HBM逐步取代LPDDR成为未来智能手机标配[11] - 3D堆叠技术节省的空间可优化机身内部设计,强化厂商在AI手机赛道的竞争力[11]
【美格智能(002881.SZ)】双轮驱动,成长空间广阔——跟踪报告之六(刘凯/林仕霄)
光大证券研究· 2025-07-03 21:42
点击注册小程序 报告摘要 美格智能坚持无线通信模组+物联网解决方案双轮驱动的产品策略 公司以智能模组、高算力模组和智能座舱、FWA、IoT等为代表的垂直行业定制化解决方案打造差异化和具备 创新力的核心竞争优势。公司在智能模组及解决方案领域具备丰富的产品开发和行业应用\工程化经验,在高 算力模组及生成式AI应用领域持续投入,并持续向具身智能机器人、消费类物联网、智能无人机等行业深度 拓展,打开公司广阔成长空间。公司针对各类对PU\GPU\NPU算力有强需求的专用场景开发的模组产品,可提 供0.2T到48T的异构算力,可以支持大模型在端侧部署和运行,并可根据场景需求,灵活匹配 5G\WIFI\千兆以 太网等各类通信方式。 查看完整报告 特别申明: 本订阅号中所涉及的证券研究信息由光大证券研究所编写,仅面向光大证券专业投资者客户,用作新媒体形势下研究 信息和研究观点的沟通交流。非光大证券专业投资者客户,请勿订阅、接收或使用本订阅号中的任何信息。本订阅号 难以设置访问权限,若给您造成不便,敬请谅解。光大证券研究所不会因关注、收到或阅读本订阅号推送内容而视相 关人员为光大证券的客户。 公司坚持研发驱动,锚定市场和客户需 ...
美格智能(002881):双轮驱动,成长空间广阔
光大证券· 2025-07-03 13:12
报告公司投资评级 - 维持“增持”评级 [3][5] 报告的核心观点 - AI应用有望带动公司产品需求快速增长,智能模组/高算力模组产品持续迭代,有望带动公司业绩高速增长,看好公司长期成长空间 [3] 根据相关目录分别进行总结 公司业务与战略 - 坚持无线通信模组 + 物联网解决方案双轮驱动产品策略,以智能模组、高算力模组和智能座舱、FWA、IoT等垂直行业定制化解决方案打造核心竞争优势 [1] - 在智能模组及解决方案领域经验丰富,在高算力模组及生成式AI应用领域持续投入,向具身智能机器人、消费类物联网、智能无人机等行业拓展 [1] - 针对专用场景开发的模组产品可提供0.2T到48T异构算力,支持大模型在端侧部署和运行,可灵活匹配各类通信方式 [1] 公司研发与上市 - 2024年研发投入2.56亿元,占营收比例8.69%,重点在高算力模组行业应用等领域加大投入 [2] - 发行境外上市股份(H股)备案申请材料获中国证监会接收,已向香港联交所递交申请并刊登资料 [2] 公司激励计划 - 2025年6月10日确定向95名激励对象授予限制性股票50万股,授予价格22.84元/股,向4名激励对象首次授予股票期权50万份,行权价格45.67元/份 [3] 盈利预测与估值 - 上调25 - 26年归母净利润预测为1.82/2.67亿元,较前次上调幅度19%/41%,新增2027年归母净利润预测为3.57亿元,当前股价对应PE 66/45/34X [3] 财务数据 利润表 - 2023 - 2027E营业收入分别为21.47亿、29.41亿、38.73亿、47.17亿、55.56亿元,增长率分别为 - 6.88%、36.98%、31.67%、21.79%、17.79% [4][7] - 2023 - 2027E归母净利润分别为6500万、1.36亿、1.82亿、2.67亿、3.57亿元,增长率分别为 - 49.54%、110.16%、34.25%、46.43%、33.97% [4][7] 现金流量表 - 2023 - 2027E经营活动现金流分别为 - 3100万、 - 1.3亿、3.08亿、2.38亿、3.84亿元 [7] - 2023 - 2027E投资活动产生现金流分别为 - 9800万、1700万、 - 1.36亿、 - 1.5亿、 - 1.59亿元 [7] - 2023 - 2027E融资活动现金流分别为1.91亿、3.06亿、 - 1.35亿、 - 300万、 - 1.41亿元 [7] 资产负债表 - 2023 - 2027E总资产分别为21.45亿、27.6亿、30.32亿、33.81亿、36.96亿元 [8] - 2023 - 2027E总负债分别为6.65亿、11.92亿、13.18亿、14.36亿、14.43亿元 [8] - 2023 - 2027E股东权益分别为14.8亿、15.67亿、17.14亿、19.44亿、22.53亿元 [8] 主要指标 - 2023 - 2027E毛利率分别为19.2%、17.0%、17.5%、18.2%、18.8% [9] - 2023 - 2027E ROE(摊薄)分别为4.4%、8.7%、10.6%、13.7%、15.8% [4][9] - 2023 - 2027E资产负债率分别为31%、43%、43%、42%、39% [9] 费用率与每股指标 - 2023 - 2027E销售费用率分别为2.97%、2.01%、2.00%、2.00%、2.00% [10] - 2023 - 2027E每股红利分别为0.10元、0.13元、0.14元、0.18元、0.20元 [10] 估值指标 - 2023 - 2027E PE分别为187、89、66、45、34 [4][10] - 2023 - 2027E PB分别为8.2、7.7、7.0、6.2、5.4 [4][10]
功能推陈出新、高端占比增长—— 以旧换新拉动手机消费升级
经济日报· 2025-06-26 05:53
今年以来,消费品以旧换新政策持续带动消费回升向好。商务部数据显示,截至5月31日,今年消费品 以旧换新五大品类合计带动销售额1.1万亿元,发放直达消费者的补贴约1.75亿份。其中,5352.9万名消 费者购买手机等数码产品5662.9万件。 中国信通院数据显示,今年前4个月,国内市场手机出货量9470.8万部,同比增长3.5%,其中,5G手机 8093.2万部,同比增长5.6%,占同期手机出货量的85.5%。艾媒咨询集团CEO兼首席分析师张毅表示, 尽管增幅相对有限,但在当前市场环境下已实属不易。依托补贴政策持续发力以及换机周期带来的自然 更新动力,国内智能手机市场温和复苏。同时,行业格局呈现出明显的头部特征,前五大品牌的市场集 中度进一步提升。 对于智能手机市场走向,王琼洁认为,一方面,智能体验将持续升级。随着端侧大模型加速落地,AI 技术将重构用户体验,涵盖影像、语音交互、个性化服务等场景,手机能精准"理解"消费者意图、规划 多步骤任务、跨应用执行任务,并在手机、平板、电脑等不同设备间实现无缝连接和交互融合。另一方 面,高端市场格局也将发生变化。苹果虽仍在国内高端市场占据主导地位,但由于苹果智能功能较弱以 ...
小米小爱同学:资源受限下,实现端侧大模型的高性能推理
AI前线· 2025-06-25 12:15
端侧大模型工程化挑战与解决方案 - 端侧部署面临模型体积、推理时延、功耗和更新机制等极高要求,需融合系统优化、模型压缩和软硬件协同[1] - 小米团队通过自研推理框架实现180 tokens/s实时推理性能,采用LoRA插件化+共享基座模型支持多业务复用[1] - 未来突破将依赖面向大模型优化的硬件能力提升和模型架构演进如Linear Attention[1] 商业化部署核心技术门槛 - 端侧设备资源限制导致可部署模型参数量难以超过4B,低比特量化造成效果损失[3] - 大模型快速迭代与端侧更新机制滞后形成矛盾,云端更新更灵活[3] - 当前处于技术积累阶段,需等待计算能力提升或模型稳定后进入部署阶段[3] 自研推理框架优化策略 - 动态输入支持通过自动切分输入尺寸提升资源利用率,避免传统padding方式浪费[6] - 投机推理在端侧实现7-10倍decoding加速,推理速度从20+tokens/s提升至200 tokens/s[6] - 量化与指令级优化通过Neon指令集加速CPU操作[7] 业务需求对架构设计的约束 - 语音助手业务链路由感知、理解和满足三阶段串行执行,并发需求较弱[7] - 端侧NPU硬件设计以串行执行为主,multi-batch收益有限[8] - 通过调度和切换机制保障各业务链路在预期时间内完成推理[8] 共享基座架构设计 - 12GB内存手机部署4B模型需近3GB内存,采用共享基座+LoRA插件化实现多业务复用[9] - 运行时动态切换不同业务LoRA模块,实现参数共享+差异定制[10] - 该架构在内存利用率和扩展能力上具有优势[10] 跨芯片平台部署策略 - 框架设计采用模块化、后端解耦思路,抽象通用接口适应不同硬件平台[11] - 大模型优化技术更多针对模型结构特性,与底层硬件绑定程度较浅[11] 性能优化组合策略 - 低比特量化、并行解码、带宽控制等技术可同时组合使用[12] - 优先选择技术价值大、适用面广、无冲突的优化方式[12] - 模块化分层设计使上层调用无需关心底层适配逻辑[12] 未来技术突破方向 - 硬件进步是关键突破点,新一代面向大模型的端侧芯片将大幅增强能力[14][15] - Linear Attention架构可解决Transformer内存随context增长的问题[16] - 多模态任务输入长度增长使传统Transformer面临资源瓶颈[16][17]
又一家SOC厂商下场“抢生意”,下游AI消费硬件市场卖爆
21世纪经济报道· 2025-06-24 18:12
生成式AI与消费硬件结合趋势 - 生成式AI与消费硬件结合成为最热产业趋势 正拉动端侧AI芯片强劲需求 [1] - 京东618期间 AI手机成交额同比增100% AI智能眼镜成交量同比增超7倍 AI音频产品成交用户同比增超3倍 具身智能机器人品类成交额同比增17倍 [1] - 未来每人身边至少有5个端侧大模型 包括手机 电脑 汽车 人形机器人 外骨骼等领域 [1] - 从云端集中计算转向边缘与端侧智能 数据隐私与实时性需求推动算力下沉 [1] AI硬件产品发展现状 - AI已进入多种终端 包括AI手机 AIPC AI可穿戴产品 AI车载系统 AI工业终端 AI玩具 机器人等 [2] - 2025年全球AI手机渗透率预计达34% 苹果 三星 华为 小米 OPPO vivo等厂商积极布局 [2] - AIPC核心在于本地运行大模型 解决个性化问题 苹果 英特尔 联想 华为 小米均在布局 [2][3] - AI可穿戴产品层出不穷 Meta 谷歌 字节跳动等企业推出搭载AI功能的设备 [3] - AI陪伴类产品成热点 如Robopoet珞博智能推出的"芙崽Fuzozo"AI养成系产品 [3] 端侧芯片市场发展 - 恒玄科技2024年推出BES2800芯片 采用6nm工艺 单芯片集成多核CPU/GPU NPU等 支持健康算法全天候运行 [5] - 恒玄科技2024年营收32%来自手表/手环芯片 收入同比增116% 出货量超4000万颗 2024Q1占比超40% [5] - 晶晨股份2025Q1自研智能端侧算力芯片出货近400万颗 达2024全年50% 预计2025年推新一代SoC芯片 [6] - 星宸科技2024年发布SSC309QL智能眼镜方案 预计2025年下半年出货 正开发下一代运动及智能穿戴芯片 [6] 行业前景与挑战 - AI基建持续投入与训练成本降低为产品放量提供催化 [3] - 当前瓶颈在于产品定义而非技术能力 AI功能带来渐进式提升而非销量爆发 [6] - AI端侧产品以玩具为第一轮代表将快速落地 硬件研发测试需以年立项推进 [7]
速递|逆势狂奔!面壁智能再获数亿元融资,端侧大模型成资本新宠
搜狐财经· 2025-05-21 19:27
2024 年 4 月: 领投方:春华创投;跟投方:北京市人工智能产业投资基金、知乎(战略股东持续跟投) 用途:加速端侧大模型研发,探索智能座舱等场景落地。 图片来源:面壁智能 根据公开信息报道,面壁智能已完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。在 13 个月内连续完成 3 轮数 亿元融资,面壁智能成为国内大模型领域融资节奏最快的企业之一。 对于新一轮融资,面壁智能联合创始人、CEO 李大海表示,"如今,大模型已经进入行业赋能的加速时刻,需要我们对技术、市场具备更加前沿性的判 断,并为大模型行业赋能提供充足的供给。一直以来,面壁以打造高效大模型为目标,在模型关键指标上,屡屡做到越级领先。 本次融资后,我们将能够进一步加深面壁的壁垒,并持续推动大模型商业化进程,为 AGI 时代的到来贡献力量。" 三轮融资概览 投资方:洪泰基金、国中资本、清控金信、茅台基金 用途:构建"端侧大脑" 技术壁垒,推进千行百业规模化应用,尤其是智能座舱量产和垂直领域 AI 工具开发 相比于模型参数越做越大的诸多大模型公司,面壁智能以"知识密度"替代参数堆砌,聚焦端侧模型研发;专注于打造同等参数下性 ...
端侧大模型加速破圈!面壁智能获新一轮数亿元融资
机器人圈· 2025-05-21 17:40
近日, 专注于端侧大模型研发的中国 AI 初创企业 面壁智能完成 新一轮数亿元融资, 本轮融资由洪泰基金、国 中资本、清控金信和茅台基金联合投资 。本轮融资的完成, 将进一步为面 壁智能构筑高效大模型技术、产品壁 垒、加速行业赋能与生态拓展奠定坚实基础,协同产业上下游推动「端侧大脑」在千行百业规模化应用。 诚邀您参与本次需求调研,扫码即可填写! 如需咨询 商务合作、 宣传推广、 转载开白等事宜,请联系:18355423366 (微信同号)对接。 END 75家机器人上市公司2024年报亮点 机器人行业上市公司2024年报出炉!谁领风骚看榜单 55家机器人上市公司2023年报看点:喜忧参半,洗牌加剧 孙立宁院士: 微纳感知赋能具身智能机器人创新发展 浙江大学熊蓉教授: 人形机器人具身智能发展挑战与进展 董凯处长:机器人具身智能发展趋势研判 仿生机器人技术新突破:向松鼠学习跨越复杂地形的智慧 从"破格上市"到市值翻三倍,越疆科技领跑港股机器人赛道 人形机器人量产爆发:价格战火爆来袭,科技革命下的产业重构与社会想象 看点:机器人概念上市公司2024上半年业绩普遍承压,机器人与AI打通迎机遇 谁是最靓的仔?53家机器 ...
面壁智能完成新一轮数亿元融资 重点布局端侧大模型
中国经营报· 2025-05-21 16:16
记者了解到,所谓端侧大模型,是指直接应用在如智能手机、PC、汽车、物联网设备等终端设备上、 本地运行的AI模型。与依赖云端服务器的传统大模型不同,通过轻量化技术压缩参数规模,端侧大模 型能够在设备端独立完成数据计算和推理任务,而不依赖网络传输或云端算力支持。 本报记者 曲忠芳 北京报道 5月21日,《中国经营报》记者从面壁智能方面获悉,该公司已完成新一轮数亿元融资,由洪泰基金、 国中资本、清控金信和茅台基金联合投资。 面壁智能联合创始人、CEO李大海表示,当前大模型已经进入行业赋能的加速时刻,需要我们对技术、 市场具备更加前沿性的判断,并为大模型行业赋能提供充足的供给。本轮融资能够进一步加深面壁智能 的壁垒,并持续推动大模型商业化进程。 面壁智能创立于2022年8月,由清华大学NLP实验室所孵化,清华大学计算机系副教授、博士生导师刘 知远是面壁智能联合创始人、首席科学家。自2024年以来,面壁智能已完成三轮融资,上一次融资事件 发生于2024年12月,据官方信息,融资规模同样为数亿元。 端侧大模型赛道升温 在大模型火热的两三年里,不同于"大模型六小虎"前期聚焦于将大模型不断做"大"的路径,面壁智能采 用的策略 ...
面壁智能完成新一轮融资 加快“端侧大脑”应用千行百业
证券日报· 2025-05-21 15:42
近日,北京面壁智能科技有限责任公司(以下简称"面壁智能")宣布完成新一轮数亿元融资,本轮融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资。 2025年1月,面壁智能发布了首个端侧全模态模型"小钢炮"MiniCPM-o 2.6,以8B规模实现全模态实时交 互,首创"持续看、实时听、自然说"功能,具备真人质感TTS能力。此前,面壁小钢炮MiniCPM凭借以 小博大、高效低成本的特性享誉全球,接连实现了端侧 ChatGPT、GPT-4V、GPT-4o时刻,被评为2024 年Hugging Face最多下载、最受欢迎中国大模型。截至目前,面壁小钢炮MiniCPM系列全平台下载量累 计破1000万。 面壁智能围绕高效大模型和端侧AI的商业化布局和业务亦进展迅速。此前,面壁智能发布的"小钢炮超 级助手cpmGO",是全球首个落地车端的纯端侧智能助手,也是面壁智能"模型即Agent"愿景的一次技术 实践。基于MiniCPM,在车规级SoC上本地完成语音、视觉、车控推理,带来与云端全面对齐的"原生 端侧体验"。2025年4月,首款搭载端侧模型的量产车型——长安马自达MAZDA EZ-60全球首秀,标志 着端侧大模型在汽 ...