存算一体技术

搜索文档
对话后摩智能CEO吴强:未来90%的数据处理可能会在端边
观察者网· 2025-07-30 14:41
公司动态 - 后摩智能在WAIC 2025首次展示M50系列芯片,包括M50芯片、力谋®BX50计算盒子、力擎LQ50 Duo M2卡等核心产品 [1] - M50芯片专为大模型推理设计,面向AI PC和智能终端场景,实现160TOPS INT8、100TFLOPS bFP16物理算力,搭配48GB内存和1536GB/s带宽,典型功耗仅10W [4] - 公司已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽,能效提升三倍,推动百亿参数大模型在终端设备普及 [9] 产品技术 - M50芯片支持1.5B到70B参数的本地大模型运行,具有"高算力、低功耗、即插即用"特点 [4] - 力擎LQ50 Duo M2卡采用标准M2规格,为AI PC和陪伴机器人提供即插即用的端侧AI能力 [4] - 公司通过存算一体技术实现AI大模型"离线可用、数据留痕不外露"的特性 [4] - 2024年初公司推出优化版M30芯片,针对大模型进行调整 [7] 市场战略 - 公司定位端边AI计算市场,CEO认为未来90%数据处理将在端和边完成 [1] - 意向客户包括联想的AI PC、讯飞听见的智能语音设备、中国移动的5G+AI边缘计算设备 [8] - 重点布局消费终端、智能办公、智能工业三大领域,包括平板电脑、智能语音系统、运营商边缘计算等场景 [8] - 将机器人视为新兴垂直赛道,类比十年前的智能驾驶市场 [8] 行业趋势 - 大模型发展呈现从训练向推理迁移、从云端向边端迁移两大趋势 [1] - 端边AI具有实时响应、低成本、数据隐私和用户体验优势,预计将成为未来趋势 [7] - 5G+AI边缘计算被视为重要发展方向 [8] - 公司CEO提出"让大模型算力像电力一样随处可得"的愿景 [5]
死磕存算一体,后摩智能发布重磅新品
半导体芯闻· 2025-07-29 18:29
冯诺依曼架构瓶颈与存算一体技术 - 冯诺依曼架构芯片面临高算力、高带宽和低功耗难以同时实现的矛盾[1] - 存算一体技术通过集成计算和存储单元,从根本上解决数据传输慢、功耗高的问题[1] - 存算一体技术特别适合AI和大模型应用,因其需要算力密集和带宽密集的特点[6] 存算一体技术商业化挑战 - 学术界研究停留在理论层面,量产和软件适配是主要商业化障碍[5][6] - 后摩智能选择存算一体路线基于两个原因:解决功耗/存储墙问题,以及避开与英伟达直接竞争[6] - 公司深耕该技术四年多,2023年起重点研究与大模型的结合[6][7] 后摩漫界M50芯片技术特点 - 采用第二代SRAM-CIM双端口存算架构,支持权重加载与矩阵计算并行[8] - 集成第二代IPU架构"天璇",最高可提供160%加速效果[8] - 物理算力达160TOPS@INT8、100TFLOPS@bFP16,典型功耗仅10W[10] - 支持最大48GB内存和153.6GB/s带宽,能效比传统架构提升5-10倍[10] - 配备新一代编译器"后摩大道",支持自动算子优化和原生浮点运算[11][12] 产品矩阵与应用场景 - 力擎LQ50 M.2卡支持7B/8B模型推理超25tokens/s[14] - 力擎LQ50 Duo M.2卡集成双M50芯片,算力达320TOPS[14] - 力谋加速卡最高集成4颗M50芯片,算力达640TOPS[14] - BX50计算盒子支持32路视频分析与本地大模型运行[14] - 应用场景包括消费终端、智能办公、智能工业等离线本地处理需求[16] 公司战略与技术路线图 - 目标成为端边大模型AI芯片领跑者[18] - 已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽[18] - 新技术预计能使能效较现有水平再提升三倍[18] - 愿景是让大模型走出云端,进入终端设备赋能各行各业[18]
全球及中国存算一体技术行业规划研究及投资前景调研2025~2031年
搜狐财经· 2025-07-29 11:17
存算一体技术市场概述 - 产品定义及统计范围涵盖近存计算、存内计算、存内处理三大技术类型 [3] - 不同产品类型增长趋势显示2020-2031年复合增长率显著 其中存内计算技术占比提升最快 [3][13] - 应用场景分为小算力(如IoT设备)和大算力(如AI服务器) 两类应用市场规模2024-2031年预计分别增长18倍和22倍 [3][13] 行业规模与区域分布 - 全球市场规模2020年为12亿美元 预计2031年达380亿美元 年复合增长率37% [4][13] - 中国市场占比从2020年18%提升至2031年32% 规模达122亿美元 增速超全球平均水平 [4][13] - 区域格局显示亚太(含中国)为最大市场 2025年份额达46% 北美和欧洲分别占31%和19% [4][14] 竞争格局与厂商分析 - 全球TOP5厂商市占率42% 第一梯队包括Syntiant(14%)、知存科技(11%)、Graphcore(9%) [4][6][8] - 中国本土厂商快速崛起 知存科技、九天睿芯等10家企业进入全球TOP20 合计收入占比达28% [6][7][8] - 头部企业产品差异化明显 Syntiant专注近存计算 知存科技主攻存内处理方案 [6][8][10] 技术路线与供应链 - 三大技术路线中存内计算占比最高(2025年58%) 近存计算在边缘侧应用广泛(2031年占比29%) [5][13] - 主要原材料供应商包括三星(存储芯片)、SK海力士(DRAM)等 产业链本土化率达65% [7][11] - 下游客户中AI服务器厂商采购占比超40% 智能驾驶领域需求增速最快(年增62%) [7][13] 发展驱动因素 - 大模型训练催生算力需求 存算一体芯片能效比传统GPU提升8-10倍 [5][13] - 中国"十五五"规划将存算一体列为关键技术 政策扶持资金超50亿元 [3][7] - 小算力场景渗透率从2020年12%提升至2031年68% 主要来自智能穿戴设备需求 [5][13]
南京经开区元素闪耀世界人工智能大会
江南时报· 2025-07-28 21:55
2025世界人工智能大会概况 - 大会主题为"智能时代 全球共济",设置会议论坛、展览展示、赛事评奖、应用体验、创新孵化五大板块 [1] - 展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品及100余款"全球首发""中国首秀"产品 [1] - 南京经开区企业出门问问、后摩智能携核心产品参展,展现区域人工智能技术实力 [1] 出门问问的AI产品与技术 - 推出Agentic AI智能硬件TicNoteAIGC产品矩阵,并赋能《听见胡同》AI艺术展,展示AI与人文融合的创新应用 [2] - TicNote AI录音笔可智能转录声音为文字,提炼灵感生成艺术展内容,实现"声→字→故事"的多维展陈 [2][3] - TicNote内置Shadow AI,提供"有记忆的AI记录+主动洞察+分析+陪伴创作"功能,适用于会议、医疗、教育等场景 [3] - 同步展示"魔音工坊""奇妙元""元创岛""小问移动数字人"等产品,体现全栈软硬结合能力 [3] - 未来将以Shadow AI为基石,拓展Agentic AI产品边界,推动人机共生 [4] 后摩智能的端边大模型芯片 - 发布自主研发的端边大模型AI芯片"后摩漫界 M50",支持本地大模型推理,无需云端依赖 [5] - M50芯片实现160TOPS@INT8、100TFLOPS@bFP16物理算力,典型功耗仅10W,能效比传统架构提升5-10倍 [6] - 采用存算一体技术,解决传统芯片数据传输慢、功耗高问题,适配1 5B至70B参数的本地大模型运行 [6] - 配套推出力擎TM系列M 2卡、力谋系列加速卡及计算盒子,形成覆盖移动终端与边缘场景的产品矩阵 [7] - 应用场景包括消费终端、智能办公、工业质检等,支持全流程本地处理,保障数据安全 [7] 行业趋势与南京经开区布局 - 大模型行业面临推理成本占比超80%的挑战,端边侧部署成为产业格局关键拐点 [6] - 南京经开区聚焦大模型集聚区建设,推动核心技术突破与实体经济融合,增强新质生产力 [7]
后摩智能发布全新端边大模型AI芯片,CEO吴强:要让AI算力像电一样方便好用
IPO早知道· 2025-07-26 20:58
产品发布 - 公司正式发布端边大模型AI芯片后摩漫界®M50,同步推出力擎™系列M2卡、力谋®系列加速卡及计算盒子等硬件组合,形成覆盖移动终端与边缘场景的完整产品矩阵 [2] - M50芯片实现160TOPS@INT8、100TFLOPS@bFP16物理算力,搭配最大48GB内存与1536GB/s带宽,典型功耗仅10W,支持15B到70B参数本地大模型运行 [2] - 产品矩阵包括:力擎™LQ50 M2卡支持7B/8B模型推理超25tokens/s,力擎™LQ50 Duo M2卡集成双M50芯片达320TOPS算力,力谋®LM5050/LM5070加速卡分别集成2颗/4颗M50芯片最高达640TOPS,BX50计算盒子支持32路视频分析与本地大模型运行 [4] 技术突破 - M50采用第二代SRAM-CIM双端口存算架构,支持权重加载和矩阵计算同时进行,实现多精度混合运算 [3] - 自主研发第二代IPU架构天璇通过压缩自适应计算周期实现弹性计算,最高提供160%加速效果 [3] - 内建高速多芯互联技术实现算力与带宽扩展,适配后摩大道®编译器自动选择最优算子,支持浮点运算无需量化调优 [4] - 相比传统架构能效提升5~10倍,完美适配端边设备"算得快又吃得少"需求 [4] 应用场景 - 产品可广泛应用于消费终端、智能办公、智能工业等领域,支持全流程本地离线处理 [5] - 消费终端赋能笔记本、平板等设备本地大模型推理,实现智能交互与内容生成 [5] - 智能办公场景支持断网环境下多语种翻译、纪要生成 [5] - 智能工业领域实现产线质检与车路云协同实时分析决策,生产数据设备端闭环处理 [5] 战略布局 - 公司已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽,能效较现有水平再提升三倍 [5] - 技术路线旨在推动百亿参数大模型在终端设备普及,使AI算力融入PC、平板等日常设备 [5] - 近两年获得中国移动产业链发展基金、北京市人工智能基金等多家机构投资支持 [6] 行业影响 - 公司通过存算一体技术与大模型深度融合,构建"低功耗、高安全、好体验"的端边智能新生态 [5] - 技术路径实现"离线可用、数据留痕不外露",解决云端传输隐患 [5] - 目标让大模型算力像电力一样随处可得,走进产线、设备和用户指尖 [8]
“算得快又吃得少” 端边AI芯片助力大模型装进PC、手机
新华财经· 2025-07-26 10:30
公司动态 - 后摩智能发布端边大模型AI芯片M50及配套硬件组合 包括力擎系列M2卡 力谋系列加速卡及计算盒子 形成覆盖移动终端与边缘场景的完整产品矩阵 [1] - M50芯片典型功耗仅10W 支持1.5B到70B参数的本地大模型运行 具备高算力 低功耗 即插即用特性 [1] - 公司依托存算一体技术优势 将计算和存储单元集成 解决传统芯片数据传输慢 功耗高问题 满足端边设备算力需求 [2] - 产品矩阵可应用于PAD PC 智能语音设备 机器人等移动终端 以及一体机 计算盒子 工作站等边缘设备 [2] - 解决方案支持消费终端 智能办公 智能工业等领域的离线全流程本地处理 保障数据隐私安全 [3] - 公司成立于2020年 已获得中国移动产业链发展基金 北京市人工智能基金等多家机构投资 [3] 行业趋势 - 大模型加速落地各类人机交互终端 包括PC 手机 机器人 眼镜 耳机 手表等 端侧大模型具备隐私保护强 响应速度快优势 [1] - 全球端侧AI市场规模预计从2025年3219亿元增长至2029年1.2万亿元 复合年增长率达39.6% [1] - 市场对适配端侧大模型的算力需求持续提升 需满足高算力 高带宽 低功耗三大指标 [2]