存算一体

搜索文档
最高能效比!他又死磕“存算一体”2年,拿出全新端边大模型AI芯片
量子位· 2025-07-28 14:42
核心观点 - 后摩智能发布业界能效比最高的存算一体端边大模型AI芯片后摩漫界®M50,采用第二代存算一体技术,实现160TOPS@INT8算力、100TFLOPS@bFP16浮点算力、153.6GB/s带宽及48GB内存,典型功耗仅10W [3][4][7][9] - 公司通过全栈自研(存算IP、IPU架构、编译器工具链)实现软硬件深度协同优化,解决传统冯·诺依曼架构的"功耗墙"和"存储墙"瓶颈 [11][12][18][24][26] - 存算一体技术成为差异化竞争关键,完美契合大模型时代对算力密集和带宽密集的需求,推动端边智能生态发展 [37][38][40][41] 技术突破 - **第二代SRAM-CIM技术**:彻底改造SRAM阵列结构实现真正存内计算,支持双端口加载与计算并行 [12][14][15] - **天璇IPU架构**:实现比特级弹性加速(最高160%加速效果)及直接浮点运算(FP16模型无需量化) [20][21][22] - **后摩大道®编译器**:支持算子自动拆分优化,降低开发门槛 [24] - **量产方案**:自主开发MBIST/CBIST测试技术解决存算芯片量产难题 [17] 产品矩阵 - **终端侧**:力擎LQ50 M.2卡(单卡7B/8B模型推理>25 tokens/s)及LQ50 Duo(双M50芯片320TOPS)支持被动散热 [29][31][32] - **边缘侧**:力谋®LM5050/LM5070加速卡(最高640TOPS)及BX50计算盒(支持32路视频分析+本地大模型) [33][35][36] 行业战略 - 差异化路径选择存算一体技术,避开与英伟达等巨头的直接竞争 [37][38][39] - 聚焦端边大模型AI计算,预计未来90%数据处理在端边完成 [41] - 已获中国移动、北京人工智能基金等产业资本支持 [41] - 下一代DRAM-PIM技术研发中,目标1TB/s带宽与3倍能效提升 [46][47]
Jinqiu Spotlight | 锦秋基金被投光本位研发全球首颗存算一体光芯片
锦秋集· 2025-07-22 23:04
公司背景与融资情况 - 光本位科技由两位年轻创始人熊胤江和程唐盛于2022年创立,分别具备大模型算法工程化和相变材料光计算研发背景[4] - 2024年12月完成锦秋基金领投的战略轮融资,老股东慕石资本、小苗朗程、中赢创投超额跟投[2] - 2025年6月再获敦鸿资产领投,浦东科技天使母基金、苏州未来天使产业基金等国资跟投,中赢创投继续加注[19] - 2024年累计完成三轮融资,包括3月天使+轮和12月锦秋基金领投轮[20] 技术突破与产品进展 - 实现全球首颗128*128矩阵规模光计算芯片流片,集成16000+完全可调节点,突破商用标准[4][12] - 采用硅光+相变材料(PCM)异质集成技术,单元尺寸缩小至传统方案1/10-1/20,算力密度提升10-20倍[13][14] - 通过相变材料实现存算一体,计算单元功耗接近0,相比电芯片算力提升潜力超1000倍[8][14][15] - 2025年计划完成128*128芯片与电芯片合封测试,推出第一代光电融合计算卡[19] 市场需求与商业化路径 - 瞄准云侧两类客户:互联网大厂(追求能效比/算力密度)和智算中心(注重经济效益)[16] - 光电融合计算卡支持PCIe接口即插即用,适配大模型分拆经济规模(128*128矩阵)[12][16] - 规划端侧场景验证,车规级应用需应对极端环境稳定性要求[17] - 已与一线互联网大厂、GPU厂商、高校等建立合作,同步推进256*256矩阵芯片研发[19] 行业背景与发展机遇 - 全球数据中心2024年耗电415太瓦时(占全球1.5%),2030年预计增至945太瓦时[7] - 电芯片3nm工艺接近物理极限,光计算被视为突破摩尔定律的关键路径[7][8] - 2017年牛津/MIT研究引发关注,但产业链成熟度延迟商业化至2022年[8][9] - 公司抓住AI算力需求爆发窗口,2023年完成64x64矩阵流片,2024年突破128x128规模[10][12]
两位95后创立光计算芯片公司,研发全球首颗存算一体光芯片
36氪· 2025-07-22 10:28
公司概况 - 光本位由两位未满30岁的联合创始人熊胤江和程唐盛于2022年在上海创立,分别关掉美国公司和暂停牛津大学读博回国创业 [1] - 熊胤江为联合创始人&董事长,负责运营与商业化,拥有芝加哥大学硕士学历及大模型算法与AI agent工程化经验 [1] - 程唐盛为联合创始人&CEO,负责研发攻关及工程化落地,曾师从全球"相变材料光计算"领域权威Harish Bhaskaran院士 [1] - 公司成立三年即完成全球首颗商用标准的光计算芯片流片,实现128*128矩阵规模光芯片集成,成为全球唯一存算一体光计算芯片公司 [1] 技术突破 - 采用硅光+相变材料(PCM)异质集成技术路线,独创Crossbar光子矩阵计算结构,解决"尺度微缩"与"算力能耗平衡"两大核心问题 [7][9] - 相变材料将计算单元尺寸缩小至传统方案的1/10-1/20,矩阵规模提升10-20倍,实现接近0功耗的非易失性存储 [9] - 完成存算一体架构创新,实现16000+节点且每个节点完全可调,适配任意模型参数变化,具备可编程性 [7] - 2023年完成64x64矩阵流片,2024年6月突破128x128矩阵规模,计划2026年推出256x256矩阵第二代产品 [5][13] 行业背景 - 光计算芯片相比电芯片具有1000倍以上算力提升潜力,且能耗更低、宽带更大 [3] - 2024年全球数据中心耗电达415太瓦时(占全球1.5%),预计2030年将翻倍至945太瓦时,超过日本总用电量 [2] - 电芯片3纳米工艺已接近0.3纳米物理极限,仅能通过先进封装勉强延续摩尔定律 [2] - 2017年牛津大学和MIT的研究引发全球对光计算的关注,国内外出现多家相关创业公司 [3] 商业化进展 - 产品定位为光电融合计算卡,采用PCIe等通用接口实现即插即用,兼容上层应用生态 [10] - 聚焦两类云侧客户:互联网大厂(追求能效比和算力密度)和政府智算中心(注重经济效益) [10] - 已与一线互联网大厂、GPU厂商、智算中心及高校建立合作,开展应用验证 [13] - 2024年完成三轮融资,投资方包括敦鸿资产、浦东科技天使母基金等机构,老股东中赢创投多次加注 [13] 产业链布局 - 早期即与Fab厂商合作研发先进封装工艺,推动技术迭代 [13] - 计划2024年完成128x128光芯片与电芯片合封测试,形成第一代光电融合计算卡 [13] - 与卫星厂商、通信运营商、光模块厂商展开深度技术交流,拓展应用场景 [13]
存算一体瓶颈,中国团队实现突破
半导体芯闻· 2025-07-02 18:21
冯诺依曼架构与内存墙问题 - 冯诺依曼架构将数据和指令存储在同一内存中,简化硬件设计并实现通用计算,但存在指令顺序执行和CPU等待存储器读写的性能瓶颈[1][3] - 存储器性能发展滞后于CPU导致"内存墙"问题,CPU需大量时间等待数据搬运,降低系统整体性能[3] 存算一体技术发展 - 存算一体(PIM/CIM)通过在内存中执行计算任务,避免数据传输,解决存储墙问题,降低时间和能源成本[5] - 技术演进分为三个阶段:早期基于DRAM/Flash的近存计算、新型存储器(RRAM/PCM/STT-MRAM)推动的模拟计算型PIM、2017年后原型产品落地[6][8] - 主流PIM技术包括数字型(SRAM/DRAM)、模拟型(RRAM/PCM)和混合型,分别面临面积功耗、精度控制和架构设计挑战[7][8] 行业参与与产业化进展 - 三星、SK海力士、美光、英伟达等国际巨头与寒武纪、华为海思、阿里达摩院等国内企业共同投入研发[6][8] - 知存、苹芯、亿铸等国内初创企业聚焦ReRAM/MRAM领域,推动存算一体在边缘计算的应用[8] 排序操作的瓶颈与突破 - 排序是AI系统中耗时最高的基础操作,存在于智能驾驶、推荐系统、大模型训练等场景,传统架构难以高效处理[10][11] - 北京大学团队首次实现存算一体排序架构,通过忆阻器阵列和并行比较机制,速度提升15倍,能效提升6-183倍,功耗仅为CPU/GPU的1/10[13][15][17] - 该技术支持百万级数据并行排序,AI推理响应速度提升70%,突破存算一体通用性限制[15][17] 技术应用与战略意义 - 成果可应用于国产智能芯片、边缘AI设备、智慧城市等领域,实现毫秒级十万级事件优先级评估[16] - 全自主技术栈具备国产化能力,为下一代AI算力体系提供底层支持[16][17]
【私募调研记录】纽富斯投资调研佰维存储
证券之星· 2025-07-01 08:08
公司调研信息 - 知名私募纽富斯投资近期调研了佰维存储 [1] - 调研形式为特定对象调研 [1] 佰维存储业务布局 - 公司在AI时代布局高性能存储产品 涵盖手机、PC、智能穿戴设备等领域 [1] - 产品包括UFS、LPDDR5/5X、DDR5超频内存条、PCIe 5.0 SSD等 [1] - 智能穿戴领域与Google、Meta等知名企业合作 [1] - 2024年面向AI眼镜产品收入达1.06亿元 预计2025年增长超500% [1] 技术研发与产能规划 - 晶圆级先进封测项目预计2025年下半年投产 覆盖多种先进封装形式 [1] - 首款主控芯片SP1800 eMMC 5.1已量产 未来将推进UFS主控芯片等关键领域 [1] - 开发多种存算合封技术方案 积极推进存算一体产业布局 [1] 智能汽车领域进展 - 推出车规级eMMC、LPDDR、NOR Flash等产品 [1] - 产品已在国内头部车企量产 [1] 行业发展趋势 - 存储行业未来将关注云、边、端深度应用 [1] - 强调本地化交付能力 推进存储与先进封装整合 [1] 机构背景 - 深圳纽富斯投资有限公司实缴资本1000万 [2] - 为中国证券投资基金业协会登记备案的私募基金管理人 [2] - 团队具备多年二级市场主动投资和量化投资经验 [2]
新紫光集团董事、联席总裁陈杰:我国有移动互联网时代的成功经验,最有能力做好AI应用创新
每日经济新闻· 2025-06-28 18:33
中国AI产业发展策略 - 针对国际已达成共识且有效的技术卡点,如Transformer架构和COT技术,需集中力量进行正面突破 [1] - 在跟踪国际技术的同时,必须采用创新方式以避免长期落后 [1] 半导体领域创新方向 - 中国半导体工艺目前基本停留在7纳米节点,且将维持较长时间 [4] - 在工艺受限的情况下,应重视系统和芯片架构创新,如3D堆叠和存算一体,以缩小与国外大算力芯片的差距 [4] 端侧AI技术优势 - 端侧AI技术难度相对较低,可发挥中国研发人员众多和对应用场景理解深刻的优势 [4] - 端侧AI传统应用包括翻译、语音识别和目标检测,新兴应用包括智能驾驶、服务机器人和智能场景感知 [4] AI应用创新建议 - 中国在移动互联网时代的产业规模和应用场景创新表现突出,未来可借鉴此经验推动AI应用创新 [4] - 建议更多关注行业垂直领域AI应用,结合行业特性和需求进行定制化研发,以落地实践引领技术发展 [4]
创业板首家,未盈利芯片IPO,来了!
是说芯语· 2025-06-27 16:48
创业板未盈利企业上市政策 - 创业板首家未盈利企业大普微首发上市申请获深交所受理 [1] - 创业板支持优质未盈利企业上市以增强板块包容性和精准支持力度 [1] - 深交所严格落实创业板上市标准为初盈利和未盈利企业提供包容性融资渠道 [1] 大普微公司概况 - 公司成立于2016年是国内领先的企业级SSD主控芯片设计及存储方案提供商 [1] - 创始人CEO杨亚飞为留美博士曾在美国高通工作8年拥有20多项国际发明专利 [1] - 公司团队规模超380人具备从芯片设计到量产交付的全栈能力 [1] 公司技术实力与市场表现 - 累计获近二十亿股权融资产品广泛应用于国内外主流服务器市场 [1] - 基于自研芯片推动"存算一体"产业发展申请超300项国内外专利 [1] - 2022年获国家"专精特新小巨人"称号 [1] 行业影响 - 创业板政策调整引导先进生产要素向科技领域聚集 [1] - 公司作为国家级高新技术企业代表国内芯片设计领域的技术突破 [1]
双轮驱动,共谱数字金融新篇章|2025中国国际金融展·华为媒体沟通会成功举办
财富在线· 2025-06-24 11:10
存算分离架构优势 - 存算分离架构相比存算一体架构具有资源扩展灵活、分层架构提升可用性、节省运维成本三大优势[4] - 存算一体架构在金融行业初期改造中虽快速落地,但随着规模扩大,其资源利用率低、运维复杂、故障频发等问题凸显[4] - 存算分离架构通过共享存储隔离硬件故障,结合虚拟化技术,将物理服务器切换时间从1小时缩短至分钟级,显著提升业务连续性[8] 金融行业需求分化 - 金融客户共性需求包括高可用性、数据安全及全栈协同能力[10] - 大型金融机构关注存量业务迁移的稳定性,中小机构更倾向快速部署的轻量化方案[10] - 公司推出多形态数据库解决方案,包括虚拟化平台与物理机方案,以适配不同规模金融机构需求[10] AI与数据库融合方向 - AI for Database方向通过智能运维实现故障自愈、参数自动优化,可替代高危人工操作提升运维效率[12] - Database for AI方向需支持自然语言交互、知识图谱等新范式,以适配AI时代的数据消费模式[12] - 未来需探索"中国标准",构建兼具高可用与前瞻性的架构,如异地RPO为零的多活方案[12] 技术发展趋势 - 金融数据库技术正从存算一体走向存算分离,提升系统利用率、可用性和易运维性[12] - 未来将探索存算分离架构与AI融合,平衡性能、成本与数据安全性[12] - 金融数字化转型需兼顾技术创新与业务实际,实现"双轮驱动"的可持续发展[12]
易华录: 北京易华录信息技术股份有限公司公开发行公司债券2025年跟踪评级报告
证券之星· 2025-06-20 19:30
公司信用评级 - 主体长期信用等级维持为AA,"22华录01"信用等级维持为AA+,评级展望为稳定[1] - 评级结果基于公司业务转型、股东支持及财务状况等多方面因素[3] - 控股股东华录集团为"22华录01"提供全额无条件不可撤销连带责任保证担保[4] 业务转型与经营状况 - 公司逐步收缩数据湖业务,转型为智慧交通、数据要素及存算一体等领域[3] - 2024年营业总收入同比下降39.24%至4.65亿元,主要因数据湖业务收缩及项目审减[3] - 智慧交通业务收入1.65亿元,同比下降2.78亿元,新签订单减少[3] - 数据要素业务处于初期阶段,2024年收入约0.21亿元,下游市场不成熟[3] 财务状况 - 2024年利润总额亏损28.50亿元,主要因大额资产减值及信用减值损失[3] - 资产总额114.66亿元,同比下降13.86%;所有者权益13.36亿元,同比下降67.47%[3] - 全部债务71.07亿元,同比增长23.25%,短期债务占比68.17%[3] - 资产负债率88.35%,全部债务资本化比率84.17%,财务杠杆水平高[3] 股东支持与外部资源 - 实际控制人电科集团在业务协同、管理及融资授信等方面提供支持[4] - 华录集团2024年提供资金支持超过37亿元(含利息)[5] - 公司在手订单业主主要为政府机关及央国企,回款风险较小但进度受财政影响[3] 行业分析 - 智慧交通行业2024年市场规模同比减少约10.07%,竞争激烈[15] - 数据要素行业处于制度落地及市场培育期,将催生数据资产入表等服务需求[15] - 公司智慧交通业务在2024年中国智能交通千万项目中标企业中排名第十,市场占比1.01%[16] 未来发展 - 公司将聚焦智慧交通、数据要素、存算一体化三大核心业务板块[31] - 计划通过联合电科集团资源深化技术合作,形成产业集群效应[31] - 对数据湖项目实施分类管理策略,推进优质资产控股并表,有序退出低效资产[31]
得一微定义“AI存力芯片”,让每比特数据创造更多智能
半导体行业观察· 2025-05-30 09:55
计算范式变革 - AI技术推动计算范式从运算器为中心转向存储器为中心,重新定义"先进存力"边界[1] - 得一微电子首创"AI存力芯片"概念,旨在通过芯片实现智能化的先进存力,为GPU/NPU提供计算卸载和数据洞察,提升系统效率[1] 公司技术升级与市场突破 - 得一微作为国内少数具备完整存储控制芯片自研能力的企业,产品已导入手机头部厂商,PCIe SSD主控持续突破[3] - 工规和车规存储市场取得重要进展,车规产品连续多年实现翻倍增长[3] - AI时代下存储核心数据转变为大模型参数、神经网络权重等,GPU取代CPU成为存储主导者[3] AI存力芯片的技术路径 - 当前AI系统存在HBM成本性能瓶颈、SSD/UFS以CPU为中心等关键问题[4] - 得一微提出以存算一体为核心的存力芯片将改变神经网络计算方式,解决GPU带宽瓶颈[4] - AI-MemoryX显存扩展卡将单机显存从几十GB提升至10TB级,支持32B至671B大模型微调训练,减少GPU需求[6] 产品战略与行业影响 - AI-MemoryX是完整微调训练机解决方案,包含训练框架、软件栈及X200系列硬件,已应用于DeepSeek等大模型优化[6] - 公司三步走战略:快速落地AI存力解决方案→固化软件创新为芯片能力→推动应用生态建设[7] - 通过AI存力芯片开辟新赛道,推动存力从被动支撑算力转向主动驱动算力,提升数据价值密度[9]