Workflow
存算一体化
icon
搜索文档
解读AI存算加速系统大机遇
2026-03-26 21:20
关键要点总结 一、 涉及的行业与公司 * **行业**:AI 算力基础设施,具体为 AI 存储/存算加速系统领域 [1] * **公司**:风行智远,一家致力于成为国产 AI 算力与加速应用领航者的公司,由国内头部智能存储公司部门分拆而来,成立于2023年底[2] 二、 市场机遇与行业瓶颈 * **市场机遇**:AI 存储已成为算力瓶颈,智算中心存储投资占比从 1% 提升至 10%-15%,中国市场复合年均增长率超过 40% [1][3] * **核心瓶颈**:存储系统成为性能短板。主流 NVMe SSD 单盘速度约 7 GB/s,理论上需要超过 1,000 个硬盘才能满足一张英伟达 B300 GPU (超过 10,000 GB/s) 的满速计算需求 [3] * **瓶颈根源**:传统架构下,CPU 负责管理和调度 SSD 数据,随着需求激增,CPU 调度瓶颈限制了向GPU传输数据的带宽 [3] * **新架构需求**:英伟达最新 Vera Rubin 架构提出“3.5 层存储”概念,旨在将数据直接从硬盘传输给显卡 [7] 三、 风行智远的核心技术与产品定位 * **公司定位**:国产 AI 算力与加速应用的领航者,通过颠覆性技术解决大模型时代的存储瓶颈 [2] * **技术定位**:介于海外 2.0 和 3.0 阶段之间的 2.5 代智能存储,兼具智能存储的计算能力和存储加速的核心能力 [1][5] * **核心产品形态**: 1. 具备 AI 算法加速功能的加速模组(类似硬盘)[12] 2. 由加速模组构成的、针对 GPU 优化的池化存储系统(类似英伟达架构中的 3.5 层)[12] 3. 支持企业级客户部署私有化大模型的一体机 [12][20] * **核心技术能力**: 1. **存算直通技术**:绕过 CPU 和文件系统,实现存储到计算的直通,将数据吞吐量提升 2-4 倍,节省 30%-40% 能耗 [1][4][11] 2. **边存边算技术**:硬盘在存储时对模型数据进行预处理,多块硬盘协同后直接交付给显卡,可节省约 11% 的训练总成本 [11] 3. **以存代算技术**:用智能硬盘(SSD)替代内存存储中间结果(如 KVCache),通过主动数据协处理弥补速度差距,将访存成本降至原方案的 1/50,综合业务成本降低 13% [1][11][14] 4. **存算一体化技术**:通过盘内算力替代主机 CPU 和 GPU 执行数据协处理,进行高效的算力卸载 [11] * **技术积累**:产品采用获得五项奖项的“一芯”DeepSSD 构建数据流架构,经测试算效比达到英伟达 T4 及 A100 平台的约 3.7 倍 [15] 四、 应用场景与价值体现 * **大模型训练**: * **价值**:优化故障恢复流程,支持故障后增量更新,无需频繁写入全量 Checkpoint,可节省约 11% 的训练总成本 [1][13] * **背景**:GPU 故障率较高(英伟达 GPU 故障周期不到两天),数据搬运耗时在优化后的智算中心占训练总时长的 15% 至 25% [7] * **大模型推理**: * **价值**:针对 DeepSeek 等 MoE 模型,可将推理总成本降低约 30% [1] * **具体案例 (DeepSeek 671B)**:将原先对 1TB 内存的需求,降低到每轮仅需获取约 71MB 乘以 8(硬盘数量)的数据量,访存成本降至原先的 1/50,对CPU的要求也从单颗成本超 5 万元降低到数千元级别 [14] * **预处理阶段**:通过智能存储加速系统,将传统流程中数据从原始存储到训练完成的六次搬运减少到三次,提升业务效率 [13] * **与 LPU 的关系**:风行智远的存算融合加速系统与英伟达的 LPU (Language Processing Unit) 在推理流水线中角色不同。LPU 负责解码过程,而该系统负责处理 LPU 无法容纳的中间数据,定位是服务好 LPU 和 GPU,处于英伟达架构中的存储 3.5 层 [16] 五、 市场竞争与生态合作 * **海外对标公司**: * **DDN**:英伟达御用存储系统公司,估值 50 亿美金,2024年收入超 10 亿美金 [6] * **VAST Data**:以色列公司,技术进入 3.0 阶段初期,估值已从 90 亿美金增长至 300 亿美金 [1][18] * **Pliops**:以色列公司,通过专用加速卡将 AI 训练和推理速度提升 8 至 21 倍,估值约 9.7 亿美金 [6] * **国内竞争格局**:公司表示目前没有直接竞争对手,已与国内技术和市场领先的大型人工智能系统公司进行联合联动和技术协同 [18] * **生态合作与客户**: * 已导入中国电信、中国移动和中国铁塔三大运营商 [1][15] * 已与国产GPU头部客户及多家上市GPU公司完成联动测试,并体现性能优势 [1][15][18] * 与浪潮、中国电子等国产云公司合作,推动存量数据中心的高效替换改造 [15] * **市场战略**:结合产业资源(国产GPU厂商、高技术企业、上市公司投资者),共同推动产品向一线互联网厂商导入,覆盖存量数据中心AI化改造和新建数据中心 [15][18] 六、 其他重要信息 * **团队背景**:核心团队来自国内头部智能存储公司,曾承担存算一体化国家专项。董事胡郁为科大讯飞联合创始人。CTO 曾担任 AMD 的 GPU 片上系统集成与系统验证负责人 [2] * **供应链与成本趋势**: * DRAM 和 HBM 持续涨价,若 HBM 价格再翻一倍,部分 AI 芯片公司考虑采用 SRAM 工艺自主设计芯片替代 [17] * 英伟达与合作伙伴开发更快的 AI SSD,目标绕过内存条和 CPU,直接从智能硬盘集群提取数据,预计可降低整体综合功耗 30% 至 40%,节省存储系统投资成本 40% 至 50% 以上 [17] * **产品交付与价值主张**: * 交付的是产品及配套方案。改造现有数据中心时,主要替换国外硬盘并加载软件,不改变物理接口 [20] * 为新建数据中心带来至少 2 至 4 倍的业务加速,并节省对内存和 CPU 的资源需求 [20] * **市场潜力**:若英伟达的“3.5层存储”架构普及,到 2027 至 2028 年,仅英伟达一家的存储采购规模就将占到全球闪存市场的 9.3% [7][17]
信测标准(300938):投资存算加速芯片厂商,探索新兴成长业务
长江证券· 2026-03-23 17:16
投资评级 - 维持“买入”评级 [7] 核心观点 - 信测标准近期新增对外投资,持有上海锋行致远科技有限公司30%股权,探索边缘计算存算加速芯片新兴成长业务 [2][6] - 公司主业保持稳健增长,2025年第三季度营收同比增速显著提升至22.2% [10] - 公司于2025年设立机器人合资公司,旨在打造未来新的增长曲线 [10] 对外投资与新兴业务探索 - 信测标准投资上海锋行致远科技有限公司,持股30% [2][6] - 上海锋行致远专注于边缘计算存算加速模组、整机的研发和行业应用,以超融合芯片STAR2000为核心,实现存/算/传一体化,具备极低功耗优势 [2][10] - 该公司业务覆盖能源、交通、政务、应急、工业、物流、社区等多个领域 [2][10] - 在“东数西算”等国家战略推动下,边缘计算已成为新型基础设施的核心组成部分,存算一体芯片可大幅降低能耗并提升运行效率,为边缘AI提供动力 [10] - 随着AI大模型推理需求激增和6G技术研发推进,边缘计算在智能制造、智慧城市、自动驾驶等领域发展潜力巨大 [10] 机器人业务布局 - 2025年2月,信测标准与广东瓦力、公司董事长吕杰中先生合资设立“深圳信测标准机器人技术有限公司”,三方出资比例分别为60%、20%、20% [10] - 合资公司经营范围包括检测机器人、工业机器人、服务消费机器人、智能机器人的研发、制造和销售及相关技术服务与咨询 [10] - 在检测服务行业中,员工薪酬是营业成本和期间费用中占比最高的一项,智能化检测机器人的应用在中长期可降低人工成本并显著提升检测效率和准确度 [10] 主营业务财务表现 - **整体业绩**:2025年前三季度,公司实现营收5.97亿元,同比增长8.3%;实现归母净利润1.55亿元,同比增长8.3% [10] - **季度营收增速**:2025年第一季度、第二季度、第三季度营收分别为1.66亿元、2.06亿元、2.25亿元,同比增速分别为-8.0%、+10.5%、+22.2%,第三季度增速明显回升 [10] - **分业务表现(2025年上半年)**: - 汽车检测业务营收1.62亿元,同比增长10.52% [10] - 电子电气产品检测业务营收0.90亿元,同比增长2.35% [10] - 试验设备业务营收0.72亿元,同比下降14.85%,但2025年第三季度营收增速或有回暖 [10] - **现金流状况**:2025年上半年经营活动现金流净额为0.62亿元,同比下降28.2%;2025年第三季度经营现金流净额为0.67亿元,同比增长21%,现金流有所改善 [10] - **客户情况**:公司在汽车检测领域客户包括特斯拉、理想、小鹏、长安、东风、广汽等,在电子电气检测领域客户包括华为、联想、小米等 [10] 盈利预测与估值 - **营收预测**:预计公司2025-2027年营收分别为8.08亿元、9.29亿元、10.66亿元,同比增速分别为11.4%、15.0%、14.7% [10] - **归母净利润预测**:预计2025-2027年归母净利润分别为1.96亿元、2.34亿元、2.78亿元(暂未考虑机器人业务),同比增速分别为11.1%、19.8%、18.5% [10] - **估值水平**:对应2025-2027年市盈率(PE)估值分别为46.4倍、38.7倍、32.7倍 [10] 公司基础数据 - 当前股价:37.27元(2026年3月20日收盘价)[7] - 总股本:24,350万股 [7] - 流通A股:16,976万股 [7] - 每股净资产:7.45元 [7] - 近12月最高/最低价:42.00元 / 18.62元 [7]
中部六省加快构建增长新引擎
经济网· 2026-02-10 14:04
文章核心观点 中部六省(山西、安徽、江西、河南、湖北、湖南)2025年经济表现强劲,GDP总量逼近30万亿元,制造业底盘稳固,2026年政府工作报告将“稳增长、扩内需”作为重点,通过布局新消费、促进有效投资、打造现代产业基地,致力于打造中国经济高质量发展的“中部引擎” [1] 中部地区经济表现与总体战略 - 2025年中部地区GDP总量逼近30万亿元,河南以5.6%的增速领跑,湖北、安徽、江西增速均超5% [1] - 安徽、河南的规上工业增加值同比分别增长9.4%和8.4%,凸显制造业底盘稳固 [1] - 2026年中部省份重点工作为“稳增长、扩内需”,依托地方资源禀赋及新消费洞察,在消费与投资两端同步发力 [1] 消费升级与新业态布局 - “情绪价值”、“情绪经济”成为多个中部省份政府工作报告热词,反映对消费趋势变化的洞察 [2] - 湖北提出培育首发经济、会展经济、赛事经济、路衍经济、银发经济等消费新增长点 [2] - 江西提出打造国潮经济、情绪经济等新业态新模式,加快发展服务、数字、绿色、健康、体育消费 [2] - 河南明确提出“推广胖东来经验”,打造带动面广、显示度高的消费新场景 [2] - 山西提出发展首发经济、夜间经济、“体育+”,以及民宿经济、宠物经济、微短剧等新业态 [2] - 安徽将建立健全“大消费”促进机制,发展壮大银发经济、演艺经济、赛事经济、中医药康养等新型消费,并拓展数据券、算力券等新型数字消费 [2] - 河南、湖南关注消费品以旧换新“得补率”,通过优化消费券发放机制释放服务消费、大宗消费潜力 [3] 有效投资与枢纽功能提升 - 中部地区作为连接国内国际双循环的关键枢纽,向水利等领域挖掘投资潜力以促进有效投资 [4] - 河南明确建设物流通道、消费商贸、要素配置、产业链接等四大枢纽,打造三个循环支点,并积极推进内河航运、现代水网体系建设 [4] - 湖北大力推进三峡水运新通道等新建续建项目建设 [4] - 江西力争鄱阳湖水利枢纽工程等重大项目开工,推进浙赣粤运河等项目前期工作 [4] - 山西持续开展重大项目建设年活动,推动骨干水网及县域配套工程等项目建设 [4] - 湖南抓好总投资2万亿元的389个省重点项目,包括梅山灌区、金塘冲水库等重大水利工程 [4] 现代化产业体系构建与重点领域布局 - 中部地区定位为现代装备制造及高技术产业基地,2026年各省着力构建体现地方特色和优势的现代化产业体系 [5][6] - 湖北努力推动世界级存算一体化产业基地纳入国家盘子,大力推进长江存储三期等亿元以上项目建设,并以长江存储为中心打造“5分钟协作圈” [6] - 湖南推进多个产业项目建设,包括新一代锂电池、3D玻璃研发生产、新能源电驱系统制造、矿山机械装备、新能源动力和储能、高性能软磁和钛材料等 [6] - 河南加快推进奇瑞乘用车技改、比亚迪新能源商用车、中州时代电池三期、中创新航动力电池及储能等项目,并支持商业航天企业发展 [6] - 江西加强大飞机整机、直升机、无人机等研发制造,做大做强新能源汽车整车及配套设备,建设中部地区特色装备集聚区 [7] - 山西因地制宜培育壮大新材料、高端装备制造等新兴产业,做精做优电机、信创、集成电路、新能源装备等高成长性产业 [7] - 安徽将深入实施新兴产业集群发展工程,巩固汽车产业优势,打造智能汽车技术和产业创新中心,并拓展先进光伏和新型储能、下一代动力电池、商业航天、高端装备制造等领域 [7]
长江存储三期工厂最新进展!
国芯网· 2026-02-04 21:10
长江存储三期项目进展与规划 - 长江存储三期项目正在安装巨型洁净厂房设备,计划于今年建成投产 [2] - 长江存储三期项目于2025年9月正式动工,项目主体公司“长存三期(武汉)集成电路有限责任公司”同期成立,注册资本达207.2亿元 [4] - 项目公司由长江存储持股50.19%,湖北国资旗下企业湖北长晟三期投资发展有限责任公司持股49.81% [4] 公司背景与市场地位 - 长江存储成立于2016年7月,是中国存储芯片制造领域的龙头企业,产品包括3D NAND闪存晶圆及颗粒、嵌入式存储芯片以及消费级、企业级固态硬盘等 [4] - 2021年12月,长江存储二期科技有限责任公司成立,注册资本600亿元 [4] - 2025年,长江存储在全球产能中的份额约为7%至8% [4] - 若三期扩产按计划完成,长江存储有望在2026年占据全球超过10%的市场份额,并有可能超越美光成为全球第四大存储芯片制造商 [4] 产业发展与战略布局 - 东湖高新区提出将以长江存储为核心,在周边60平方公里范围内打造世界级存算一体化产业基地 [4] - 该计划联合推进“梧桐树计划”,旨在通过需求、设计、技术路线与供应链的协同对齐,构建高效联动的产业协作生态 [4] 行业机遇 - 全球存储行业正步入高景气周期 [5] - 海外头部厂商将更多先进产能向高毛利率产品倾斜,为国产成熟制程存储产品释放出更多市场空间 [5] - 长江存储的相关产品市场布局迎来新的发展机遇 [5]
“世界光谷”全球产业合伙人大会举行 现场签约超200亿
长江商报· 2026-02-03 08:29
世界光谷全球产业合伙人大会核心事件 - “世界光谷”全球产业合伙人大会在武汉东湖高新区举行 现场签约金额超过200亿元 其中世界级存算一体化产业园一期投资80亿元 计划于2028年建成投用 [1] - 东湖高新区未来5年将推动“世界光谷”建设取得决定性进展 目标形成1个万亿级和2个5000亿级产业集群 [1][4] 重大项目与投资 - 世界级存算一体化产业园签约落户光谷 将以长江存储为中心 在60平方公里范围内打造产业基地 联合实施“梧桐树计划”构建“5分钟协作圈” [1] - 博雅新材光学总部、泰晶科技全硅MEMS时钟器件基地、盛创机器人全国总部、纽伦捷生物总部及基因治疗药物研发生产基地等十余个项目签约落地 项目总投资超过200亿元 [2] - 盛创机器人全国总部、览翌航空eVTOL研发生产基地等项目 精准布局人形机器人与低空经济未来产业 [2] 产业基础与集群发展 - 光谷芯片产业已形成完整产业链 聚集300多家相关企业 2025年产业规模突破1000亿元 [2] - 存储器基地一期和二期已投产 三期项目即将启动 吸引了北方华创、奕斯伟、中科飞测等行业龙头落户 [2] - 九峰山实验室化合物半导体中试平台成为工信部首批、全国唯一的集成电路类国家级制造业中试平台 配备7条工艺线和500余台设备 已签约客户570家 [2] 经济发展与规划目标 - 2025年东湖高新区地区生产总值实现3360亿元 同比增长6.3% 规上工业总产值首次突破4000亿元 位居武汉市第一 [3] - “十四五”期间 光谷地区生产总值净增约1400亿元 累计完成产业投资超过2600亿元 企业总数增至16.9万家 高新技术企业增至5821家 上市公司增至71家 [3] - 2026年将实施“世界光谷”全球合伙人行动 创新“共谋共建共投”模式 组建招商突击队 吸引“链主”企业及核心配套项目 [4] 合作伙伴与生态构建 - 禾元生物、并行科技、中信科移动等10家机构被授予“世界光谷全球产业合伙人”称号 [3] - 长江存储执行副总裁程卫华、九峰山实验室主任丁琪超等4人获颁“突出贡献产业合伙人” 过去5年均成功为光谷引进落地重大项目超过5个 [3] - 东湖高新区邀请全球企业家参与产业链构建与协同创新 并邀请全球投资机构作为“耐心资本”合伙人共享产业发展红利 [4]
影响市场重大事件:美国FCC:SpaceX申请部署百万颗卫星,欲建轨道AI数据中心;美国宇航局开始进行载人绕月飞行前的关键测试;3D打印市场需求旺盛,头部企业积极扩产
每日经济新闻· 2026-02-02 07:46
航天与深空探测 - 美国宇航局开始为期两天的模拟倒计时 为新型登月火箭燃料加注做准备 这是决定四名宇航员何时进行绕月飞行的关键测试 宇航员将成为自1972年以来首批飞往月球的人类 [1] - SpaceX向美国联邦通信委员会申请发射并运营一个由至多100万颗卫星组成的星座 以构建轨道AI数据中心网络 支持大规模AI推理及数据中心应用 卫星将在宽度高达50公里的狭窄轨道壳层内运行 [2] - 美国“毅力”号火星车在火星表面首次完成了由人工智能规划路线的行驶任务 任务团队使用具备视觉理解能力的生成式AI分析高分辨率图像及地形数据 帮助火星车安全穿越复杂地形 [3] 3D打印行业 - 下游航天业务复苏及消费级市场需求转旺 带动国内3D打印设备行业销售明显放量 多家头部企业积极扩产承接需求 [2] - 华曙高科表示 2025年航空航天领域部分项目招投标结果显示行业需求较前两年已明显复苏 下游客户对轻量化、精细化打印要求持续提高 [2] - 铂力特在建三期、四期产能 四期部分地块已贡献收入 三期预计2026年上半年陆续投产 [2] 电力设备与变压器市场 - AI算力建设催热变压器市场 2025年国内变压器市场规模同比增长超20% AI算力、特高压相关高端产品订单占比已突破35% 成为产业增长核心引擎 [4] - 全球AI算力建设进入爆发期 大量变压器工厂处于满产状态 部分面向数据中心的业务订单排到2027年 美国市场交付周期已从50周延长至127周 [5] - 2025年我国变压器出口总值达646亿元 比2024年增长近36% 行业企业约3000家 [5] 半导体与算力基础设施 - 世界级存算一体化产业基地签约落户光谷 项目一期投资80亿元 计划于2028年建成投用 光谷将以长江存储为中心、4.5公里为半径 在60平方公里范围内打造该基地 构建高效协同的“5分钟协作圈” [6][7] - 北京经济技术开发区计划推动“量智融合” 建设“量电融合、四算合一”的量子计算基础设施 并强化“6G+AI”协同 搭建6G+AI融合测试验证平台 探索空天智能基础设施建设 [8] 造船业 - 2025年中国造船业三大指标继续全球领跑 连续16年保持世界第一 [9] - 2025年我国造船完工量5369万载重吨 同比增长11.4% 占全球市场总量的56.1% 新接订单量10782万载重吨 占全球市场总量的69% 截至12月末手持订单量27442万载重吨 同比增长31.5% 占全球市场总量的66.8% 手持订单量再创历史新高 [9] 人工智能与医疗 - 华为发布行业AI“梦工厂”的首个专区——智慧医疗专区 提供业界首个服务基层医院的端云协同智慧病理解决方案 基层医生用PC可实现病理AI推理 [10] - 华为与瑞金医院联合发布RuiPath智慧病理一体机 预集成RuiPath病理模型 预安装AI软件平台及配套智算硬件 [10]
“世界光谷”有了“产业合伙人” 80亿元投资存算一体产业园一期项目
长江日报· 2026-02-01 09:00
会议与战略 - 东湖高新区举行“世界光谷”全球产业合伙人大会,授予10家机构“全球产业合伙人”称号,并对4位个人授予“突出贡献产业合伙人”荣誉 [2] - 会议现场签约项目总投资额突破200亿元,涵盖光电子信息、生命健康、现代服务业及未来产业等关键领域 [2] - 此次大会是光谷面向全球的“合伙邀约”,旨在冲刺世界级产业集群,是“世界光谷”建设战略的具体行动延伸 [2][4] 产业发展与规划 - 光谷将以长江存储为中心,在60平方公里范围内打造世界级存算一体化产业基地,联合实施“梧桐树计划”引进上下游伙伴 [3] - 规划构建高效协同的“5分钟协作圈”,通过需求、设计、技术路线与供应链“四个对齐”实现前沿研发聚焦 [3] - 签约项目包括投资80亿元的存算一体产业园一期,直指集成电路核心环节 [3] - 朗来科技AI创新药科技园等项目强化了在生物医药与高端医疗器械领域的创新布局 [3] 未来产业布局 - 会议签约项目精准押注未来赛道,包括盛创机器人全国总部、览翌航空eVTOL研发生产基地等 [3] - 这些项目卡位人形机器人与低空经济这两个全球竞逐的未来产业和新兴产业高地 [3] - 多款人形机器人集结亮相,与空轨列车同框,展现光谷在相关领域的活力 [4] 行业观点与机遇 - 长江存储执行副总裁程卫华表示,AI将推动全球半导体产业在2030年迈入万亿美元规模 [2] - 半导体产业是AI价值链占比最高的产业,2024年占比达80% [2] - 中国企业在半导体关键环节占比仍显薄弱:设备仅5%、材料20%、EDA不足2%,这被视为巨大的增长空间 [2] 合作与生态构建 - 东湖高新区邀请全球企业家做光谷产业发展的“合伙人”,参与产业链、供应链构建与协同创新 [4] - 同时邀请全球投资机构做光谷“耐心资本”的合伙人,共同挖掘优质项目,共享产业发展红利 [4] - 获得“突出贡献产业合伙人”称号的个人在过去5年间均成功为光谷引进落地重大项目超过5个,在产业招引、资源对接、生态构建等方面作出贡献 [2]
英伟达CES发布了什么-星环科技为何受益
2026-01-07 11:05
行业与公司 * 涉及的行业:人工智能计算、数据库、半导体、数据中心基础设施(液冷、光通信)[1][2] * 涉及的公司:英伟达、星环科技、Groq[1][6][9] 英伟达CES发布的核心技术与产品 * 推出名为“记忆中枢”的上下文存储系统,由BlueField 4代DPU驱动,旨在通过智能数据调度和存储优化提升GPU计算效率[3] * 核心优化在于通过PU和SSD提升GPU计算效率,特别是在线学习等新模型架构的数据处理能力[1] * 具体方案为每块GPU背后至少配置1TB的SSD,将冷数据逐步迁移为热数据存储,并用低成本SSD替换高成本DRAM,实现更高效的数据处理和存储[1][3] * 收购Groq并采用Atrium方式优化HBM交互层,使未来模型架构中的固定权重更新更高效,并促进SSD与HBM间的数据传输速度,大幅提高系统性能[1][9] 新技术对数据库市场的影响 * 新架构极大提升内存使用效率,打破“内存墙”,使GPU能更快访问数据,提高整体计算性能[1][4] * 特别利好向量数据库,因其按流量计费,内存墙打破和热数据需求增加将显著提升其数据流量[1][4] * 若未来每块H200芯片配备160GB显存并在国内市场大量采用,向量数据库的业务增量可能达到数百亿级别[4][5] 星环科技的核心优势与受益逻辑 * 星环科技是国内领先的独立第三方向量数据库厂商[1][6] * 其核心优势在于按流量计费模式,这与全球范围内形成的默契及新计算架构的需求相符[6] * 公司能够充分利用英伟达和谷歌推动的存算一体化带来的流量增长,实现业务空间成百倍放大[1][6] 向量数据库与传统数据库的区别 * 最大区别在于收费模式:向量数据库按流量计费,传统数据库按节点收费[1][7] * 数据管理对象不同:向量数据库管理热数据,更适合实时训练和在线学习;传统数据库主要管理冷数据,确保数据不丢失、不变形[7] * 商业模式吸引力:在新架构下,按流量计费模式能更好反映实际使用情况,对企业而言更经济高效,因此更具灵活性和经济性吸引力[1][7] 对其他行业的利好影响 * 对液冷、光通信等数据中心核心基础设施板块产生积极影响,推动相关基础设施发展[2][8] * 新技术提升整体计算效率,为整个产业链带来广泛利好,包括硬件制造、云服务提供商及各类AI应用开发者[2][9]
当千亿参数撞上5毫米芯片
钛媒体APP· 2025-12-10 11:19
文章核心观点 - 全球AI技术发展重点正从追求云端大模型的参数规模,转向解决端侧AI的工程化难题,以实现高智商、低延迟、低功耗的智能应用[4][16] - 端侧AI面临“不可能三角”的物理极限挑战,行业通过“云-边-端”三级分层架构、算法模型压缩、芯片架构创新以及从通用走向专用等路径寻求突破[7][8][11][15] - 中国AI产业出现集体觉醒,不再盲目追求参数之“大”,而是转向追求应用落地之“实”,致力于将AI嵌入万物,实现真正的万物智能[16][18] 技术风向与行业共识 - 2025年技术风向逆转,工程界开始重点攻克“端侧AI”命题,目标是将大模型能力塞进面积数平方毫米、功耗仅几瓦的端侧芯片中[4] - 行业普遍共识是未来AI架构必须是“人格分裂”的“云-边-端”三级分层架构:云端处理复杂长尾问题,端侧负责高频、实时、隐私敏感任务[7] - 端侧AI面临“不可能三角”挑战:高智商、低延迟、低功耗三者难以兼得[7] - 端侧物理条件严苛,主流车载芯片、智能家居SoC或旗舰手机的NPU专用内存仅几GB甚至几百MB,而运行一个700亿参数模型仅加载权重就需约140GB显存[6] 算法层面的优化路径 - 行业主要通过三把“手术刀”对模型进行压缩与优化:知识蒸馏、极致量化、结构剪枝[8][10] - **知识蒸馏**:让云端超大模型(Teacher)将核心逻辑“传授”给端侧小模型(Student),使0.5B参数的小模型在特定垂直场景表现能逼近百亿参数通用模型[8] - **极致量化**:通过训练后量化或量化感知训练,将模型权重从FP16压缩至INT8甚至INT4,使模型体积压缩4倍以上,推理速度成倍提升[10] - **结构剪枝**:剔除神经网络中对输出影响微乎其微的冗余参数,从物理层面减少计算量[10] 芯片架构的创新突破 - 端侧大模型推理的主要瓶颈在于“访存”,传统冯·诺依曼架构下,超过80%的功耗消耗在数据搬运上,即“内存墙”危机[11] - 行业通过DSA领域专用架构来突破瓶颈,核心思路包括存算一体化、异构计算调度和算子硬化[13][14] - **存算一体化**:拉近存储与计算单元的物理距离,甚至在SRAM中直接计算,减少数据搬运开销[13] - **异构计算调度**:在SoC内精细分工,CPU负责流程控制,DSP负责信号处理,定制NPU负责繁重的矩阵乘法运算[14] - **算子硬化**:针对Transformer核心的Attention机制,在硅片上直接“刻死”加速电路,牺牲通用性以换取极高效率,实现毫秒级响应[14] - 云知声、地平线等硬科技企业通过上述架构创新,已将芯片出货量做到上亿颗[13] 应用策略的务实转变 - 行业路径从追求“通用”走向深耕“专用”,承认AI局限性,打造专精的垂直智能体[15] - 商汤医疗采用“平台化”策略,搭建模型生产平台,让医院基于自身高质量数据训练针对特定病种的专用模型,将AI变为“熟练技工”[15] - 云知声的产业路径是避开通用大模型红海,通过在医疗、家居等垂直领域深耕来打磨端侧技术与芯片,赚取数据反馈反哺基础研究[15] - 这种转变旨在让AI更务实,需要的算力更少,但在专业领域给出的建议更靠谱[15] 产业影响与未来展望 - 中国AI产业集体觉醒,转向追求应用落地的“实”[16] - 成千上万的工程师致力于将AI的价格打下来,体积缩下去,使其嵌入生活的每一块玻璃、每一颗芯片[17] - 真正的“万物智能”是让万物拥有一颗微小、聪明且独立的“芯”,不再依赖脆弱的网络连接[18] - 当一颗几十块钱的芯片能跑通拥有逻辑推理能力的大模型且不依赖网络时,智能时代的奇点才算真正到来[18]
人工智能算力基础设施赋能研究报告
中国信通院· 2025-12-09 16:01
报告行业投资评级 未提及 报告的核心观点 在人工智能落地进程中,以智算中心为代表的算力基础设施是重要基石,但目前利用负载差异大,赋能价值待提升;报告围绕需求场景、关键能力、落地生态阐述发展趋势,助力释放智算中心赋能效应,推动人工智能与实体经济深度融合 [5] 各部分总结 人工智能算力基础设施演进态势 - 技术创新:我国人工智能算力基础设施正系统性升级与架构演进,向集约高效、低碳共生、高速泛在的融合形态发展,呈现超大规模集群化、绿色低碳化与高速互联化特征 [12] - 布局优化:政策引导推动智算中心高质量发展,建设加快布局,总体规模增长,区域智能算力向统筹化和集约化部署 [16][17] - 产业升级:智能算力产业发展提质增速,产业链各环节深度融合,三大运营商和AI大厂积极布局智算领域 [18][19][20] 人工智能算力基础设施赋能的重要走势 - 需求场景:定位日益清晰,促使资源优化配置,实现从“以建促用”到“以用带建”转变 [25] - 关键能力:供给持续强化,服务向高层次、全栈化支持体系演进,提升服务效能 [26] - 落地生态:生态体系加速整合,协同机制完善,促进智算赋能价值规模化释放 [28] 人工智能算力基础设施需求场景 - 大模型预训练场景:万卡集群支撑基础大模型预训练,国内通信运营商和AI头部厂商积极建设万卡智算集群并研发基础通用大模型 [30][31][32] - 大模型微调场景:小体量智算中心可有效推进行业模型微调训练,国内多数智算中心着力支撑该场景 [34][36] - 大模型推理场景:云侧推理需求占据主导,不同推理应用场景对推理模型及智算中心需求不同,专用于推理的智算中心持续涌现 [37][39][40] 人工智能算力基础设施关键能力 - 基础支撑能力:训练场景关注集群算力有效性等,推理场景关注token吞吐率等,大模型预训练对绝对算力性能有强要求,模型推理对智算卡内存和通信带宽有强要求 [44][46][48] - 创新服务能力:训练场景关注云服务高效性等,推理场景关注智算资源池化调度能力等,模型训练要求智算中心提供全栈MaaS服务能力 [50][52][53] - 运营保障能力:训练和推理场景都关注算力调度灵活性等,均需推进智能算力灵活调度,追求高性价比,注重提升安全合规性 [55][56][57] 人工智能算力基础设施落地生态 - 智算与数据要素协同:推进与高价值数据协同,提升基础支撑能力,“算力+数据”双轮驱动构建智算生态 [60] - 智算与模型算法协同:推进与高水平模型算法协同,提升创新服务能力,“算力+模型”一体化模式满足智能应用需求 [63] - 智算与跨域智算协同:推进跨域智算互联协同,运营能力跃升,运营商智算中心长距互联实现实践突破 [66][67] - 智算与行业场景协同:推进与行业场景协同,生态持续演进升级,形成“以算促用、以用带算”良性发展机制 [68] - 智算与区域产业协同:推进与区域产业协同,实现多维度、全场景赋能,形成创新闭环和良好生态 [71] 发展展望 - 需求场景:更加多元、复杂且深度融合,政府、地方国投平台和运营方应分别做好引导员、连接器和跟踪者 [76][77] - 关键能力:更加集约、软性,行业组织应完善关键能力体系,运营方应针对性提升关键能力 [78][80] - 落地生态:更加聚合、协同,政府应引导与对接资源,运营方应主动对接外部要素主体 [81][83]