Workflow
后摩漫界M50
icon
搜索文档
对话「后摩智能」吴强:从科学家到创业者的惊险一跃
36氪· 2025-08-06 08:02
行业趋势 - AI算力呈现云端和端边侧两极发展趋势 云端算力持续扩展 端边侧应用火热 [1] - 未来生成式AI推理计算90%在端侧和边侧进行 仅10%复杂任务需云端处理 [1] - 端边侧市场正孕育"下一个英伟达"机会 可能比云端市场更大且容纳更多玩家 [2] 技术架构创新 - 存算一体技术突破冯诺依曼架构的"内存墙"和"功耗墙"问题 直接在存储单元进行矩阵乘加操作消除数据搬运流程 [2] - 存算一体对先进制程依赖更弱 因数据搬运次数减少 [18] - 行业处于存算一体百花齐放阶段 介质包括Nor-flash/SRAM/DRAM/RRAM 后摩聚焦SRAM和DRAM的高精度大算力存算 [13] 产品性能表现 - 后摩漫界M50芯片实现160 TOPS@INT8和100 TFLOPS@bFP16物理算力 搭配48GB内存与153.6GB/s带宽 典型功耗仅10W [6] - 支持7B到70B参数本地大模型运行 适配X86/ARM等主流处理器架构 [6][7] - 采用自研"天璇架构"IPU和"后摩大道"编译器工具链 支持主流深度学习框架 [6] 商业化进展 - 已获得联想AI PC 讯飞听见智能语音设备 中国移动5G+AI等标杆意向客户 [7][10] - 重点布局消费终端/智能办公/智能工业/机器人领域 端侧市场具有成本敏感和功耗敏感特性 [10][11] - 端边侧芯片需满足小型化 高散热要求 且不能是大尺寸卡型设计 [11] 公司战略转型 - 从智能驾驶芯片转向通用端边大模型AI芯片 因智驾赛道竞争激烈且算力需求与市场不匹配 [8] - 2024年初推出M30芯片试水大模型计算 2025年发布M50芯片完成转型 [9][3] - 存算一体技术与大模型计算天然契合 既需要大算力又需要大带宽 [9] 技术落地挑战 - 存算一体产品化需解决电路设计 量产工程问题 AI处理器架构三大卡点 [14] - 需开发专用EDA工具解决可测性和良率问题 并克服高计算密度带来的电压降等工程难题 [14] - 软件编译器需对客户无感 支持PyTorch/TensorFlow等主流框架 [17] 市场竞争格局 - NPU与SOC/CPU厂商存在能力壁垒 独立NPU在AI计算需求无限场景下将持续发展 [19][20] - 存算一体获国家政策支持 参与发改委/工信部闭门座谈 投资机构关注度显著提升 [12]
对话「后摩智能」吴强:从科学家到创业者的惊险一跃
36氪· 2025-08-05 21:49
AI算力发展趋势 - AI算力呈现两极发展趋势:云端算力持续扩展与端边侧应用火热[4] - 未来生成式AI推理计算90%在端边侧进行,仅10%复杂任务需云端处理[4] - 端边侧市场潜力巨大,可能孕育"下一个英伟达",市场规模或超云端[4] 后摩智能战略与技术 - 公司以存算一体技术切入端边大模型芯片市场,定位"最后一公里"解决方案[5] - 发布存算一体端侧芯片"后摩漫界M50",实现160 TOPS@INT8算力,典型功耗仅10W[8] - 采用自研"天璇架构"IPU和"后摩大道"编译器工具链,支持主流深度学习框架[8] 存算一体技术优势 - 存算一体技术有效解决冯诺依曼架构的"内存墙"和"功耗墙"问题[6] - 技术路线百花齐放,行业处于跑马圈地阶段,公司聚焦SRAM和DRAM存算[18] - 存算一体对先进制程依赖更弱,数据搬运效率更高[23] 商业化进展 - 已获得联想AI PC、讯飞听见智能语音设备、中国移动5G+AI等意向客户[10] - 重点布局消费终端、智能办公、智能工业及机器人领域[14][15] - 端边侧市场特点为成本敏感、功耗敏感、体积小、散热要求高[16] 行业转型与机遇 - 公司从智能驾驶芯片转型通用端边大模型芯片,抓住大模型风口[11][13] - 存算一体技术从冷门到主流,国家和投资机构关注度显著提升[17] - 端边侧AI芯片市场分散且极致,需要适配多元化需求[10] 产品性能与创新 - M50芯片支持7B到70B参数本地大模型运行,内存带宽达153.6GB/s[8] - 采用原方案+AI模式,适配X86、ARM等主流处理器架构[10] - 电路设计、量产工程、AI处理器架构是存算一体产品化三大挑战[19][20]
AI算力集群迈进“万卡”时代,超节点为什么火了?
第一财经· 2025-07-30 15:59
超节点技术布局与趋势 - 华为、中兴通讯、新华三、超聚变等国内厂商在WAIC上集中展示超节点方案 超节点技术成为行业热点 [1][3] - 超节点通过整合算力芯片资源构建低延迟高带宽算力实体 提升集群算力利用效率 支撑千亿至万亿参数模型训练和推理 [3] - 英伟达较早布局超节点技术 其GB300 NVLink72方案可整合72个GPU和36个CPU到单一平台 [4] 超节点技术原理与价值 - 解决万卡集群时代芯片协同问题 通过scale up纵向拓展实现单节点内多GPU协同 避免传统横向拓展导致的算力性能损失 [5] - 在单颗芯片制程受限背景下 超节点成为提升集群性能的重要路径 国内厂商可通过大规模集群部署弥补单点性能不足 [9] - 光互连技术成为主流方向 光互连光交换方案实现纳秒级切换 保证高带宽低延迟通信 曦智科技、壁仞科技等厂商已推出相关方案 [6] 国产芯片市场竞争策略 - 国产AI芯片在服务器中占比提升 外购芯片份额从去年63%预计降至今年49% 英伟达仍计划推出针对中国市场的全新GPU [10] - 部分厂商采取差异化竞争策略:墨芯人工智能聚焦推理场景优化 云天励飞专注边缘计算和云端推理 后摩智能定位端边场景存算一体技术 [10][11][12] - 避开与海外巨头直接竞争 通过垂直行业定制化方案(如稀疏计算、边缘设备)实现特定场景下的性能优势 [11][13] 技术发展驱动因素 - 大模型参数量迈向万亿级 需1万张以上GPU构建具备容错能力的训练集群 推动超节点技术需求 [4] - 摩尔定律面临失效风险 芯片制程提升难度增大 促使行业通过集群互连技术突破算力瓶颈 [9] - 国内光通信技术全球领先 与海外先进水平无代差 为光互连方案提供技术基础 [9]
南京经开区元素闪耀世界人工智能大会
江南时报· 2025-07-28 21:55
2025世界人工智能大会概况 - 大会主题为"智能时代 全球共济",设置会议论坛、展览展示、赛事评奖、应用体验、创新孵化五大板块 [1] - 展览面积首次突破7万平方米,吸引800余家企业参展,展示3000余项前沿展品及100余款"全球首发""中国首秀"产品 [1] - 南京经开区企业出门问问、后摩智能携核心产品参展,展现区域人工智能技术实力 [1] 出门问问的AI产品与技术 - 推出Agentic AI智能硬件TicNoteAIGC产品矩阵,并赋能《听见胡同》AI艺术展,展示AI与人文融合的创新应用 [2] - TicNote AI录音笔可智能转录声音为文字,提炼灵感生成艺术展内容,实现"声→字→故事"的多维展陈 [2][3] - TicNote内置Shadow AI,提供"有记忆的AI记录+主动洞察+分析+陪伴创作"功能,适用于会议、医疗、教育等场景 [3] - 同步展示"魔音工坊""奇妙元""元创岛""小问移动数字人"等产品,体现全栈软硬结合能力 [3] - 未来将以Shadow AI为基石,拓展Agentic AI产品边界,推动人机共生 [4] 后摩智能的端边大模型芯片 - 发布自主研发的端边大模型AI芯片"后摩漫界 M50",支持本地大模型推理,无需云端依赖 [5] - M50芯片实现160TOPS@INT8、100TFLOPS@bFP16物理算力,典型功耗仅10W,能效比传统架构提升5-10倍 [6] - 采用存算一体技术,解决传统芯片数据传输慢、功耗高问题,适配1 5B至70B参数的本地大模型运行 [6] - 配套推出力擎TM系列M 2卡、力谋系列加速卡及计算盒子,形成覆盖移动终端与边缘场景的产品矩阵 [7] - 应用场景包括消费终端、智能办公、工业质检等,支持全流程本地处理,保障数据安全 [7] 行业趋势与南京经开区布局 - 大模型行业面临推理成本占比超80%的挑战,端边侧部署成为产业格局关键拐点 [6] - 南京经开区聚焦大模型集聚区建设,推动核心技术突破与实体经济融合,增强新质生产力 [7]