雷峰网
搜索文档
告别天价账单:端云协同与记忆革命,让 Agent 告别「烧钱时代」丨 GAIR Live 029
雷峰网· 2026-05-03 11:33
" 当 Agent 不再是昂贵的实验品,而是像水和电一样的基础设施 时,真正的 AI 时代才算真正降临。 " 作者丨岑峰 2026 年,大模型行业的叙事中心正在经历一场痛苦但必然的位移:从追逐参数规模的"算力竞赛",转向 追求任务落地的"工程突围"。在这场位移中,AI Agent无疑是最被寄予厚望的终极形态,但它正面临一堵 名为"Token 焦虑"的围墙。 闫宇坤 Qiyuan Lab 副研究员 清华大学 THUNLP 实验室客座研究员 两位专家,通过圆桌讨论,揭示了智能体基建如何通过"空间分流"与"时间管理",重构 AI Agent 的成本 价值秩序:闫宇坤领导的 EdgeClaw 试图通过"端云协同"的物理分级,从架构源头切断无效 Token 的消 耗;而李志宇掌舵的 MemTensor 则通过"记忆工程",在既有架构下通过精细化的状态管理榨取极限效 率。 为什么 Agent 的普及如此之难?因为我们正处于一种极其低效的生产模式中:为了让 Agent 维持对话的 连贯性,系统不得不反复加载数万字的上下文;一次简单的任务调度,往往伴随着不可预测的高昂账单; 而数据隐私在端与云的频繁传输中,更是变得岌岌可危。 ...
墓志铭复盘:破碎并非结束,奋斗者仍一往无前
雷峰网· 2026-05-02 18:53
文章核心观点 文章通过分析多家在2024-2026年间陷入困境或倒闭的AI及自动驾驶领域明星创业公司(如达闼、小冰、千挂、森合、禾多、毫末等),总结了其失败的共同教训,核心观点在于创业公司的成功不仅依赖于技术,更取决于创始人及组织在商业模式、现金流管理、商务能力、技术路线选择和公司治理等关键方面的综合能力与进化速度[5][30][32][33]。 根据相关目录分别进行总结 项目制的诅咒 - 自动驾驶行业的To B商业模式存在结构性矛盾,作为供应商的创业公司面对强势车企客户,话语权严重倾斜[7] - 车企常将智驾创业公司视为“备胎”,用于压价或技术储备,一旦完成代码交付,其价值便大幅降低[7] - 项目制(定点项目)导致投入产出极不对称,白盒交付、长期驻场和频繁变更消耗大量现金流和员工士气,例如有公司为比亚迪项目投入大量人力,最终仅上车约1000辆,开发费微薄且占用现金流[7] - 最终能生存的公司需拥有不可替代的核心技术或硬件壁垒(如地平线、英伟达、Momenta),其余大多陷入成本战[8] 商务缺位 - 许多技术驱动的创业公司存在商务能力短板,例如有公司客户招待费申请困难,而竞争对手技术分低但商务满分[10] - 创始人往往重研发轻商务,如纵目科技创始人崇拜极客风格,对产品销售缺乏兴趣[10] - 对“商务能力”的理解存在误判,误以为强势供应商不受欢迎,而华为的成功证明定义标准和争夺产业链话语权才是关键[10] - 商务体系的缺失导致公司无法守住客户并谈出好价格[11] 现金流管理 - 创始人缺乏财务意识是致命问题,例如禾多科技CFO无法说服创始人降成本,导致公司陷入裁员和高层欠薪[13] - 现金流危机不仅源于融资困难,也源于高风险财务操作,如纵目科技与超过三十位投资者签署对赌协议[14] - 现金流管理不善的具体表现包括:员工报销晚发、十三薪推迟发放、三年无年终奖,以及依赖创始人亲属注资救火[14] - 将融资视为“续命手段”而非战略工具,当融资成为唯一目标时公司已身处险境[15] 技术路线的赌注 - 技术路线选择容错率极低,领先或保守都可能导致失败[16][18] - 小冰公司早在2017年其生成模型就出现了类似“思维链”的技术,比ChatGPT早五年,但此技术伏笔被埋没,后续采购GPU和训练大模型的提议也未被采纳,错失先机[17] - 某智驾公司在2023年初否决了布局端到端算法的提议,因认为资源投入过大,直到2024年底才重新评估,导致技术落后至少一个代差[18] - 技术路线选择的本质是创始人对自身资源与行业趋势的综合判断[18] 创始人的天花板 - 创始人的能力边界决定了公司的天花板,这是系列案例中最痛的共识[19][21] - 具体表现多样:达闼创始人过于依赖“关系驱动”(如政府订单)并低估物理交互复杂性[20];纵目科技创始人的极客风格在需要平衡研发与市场时成为双刃剑[21];禾多科技创始人听不进CFO的反对意见[21];千挂科技因股权和权责边界模糊导致核心CEO出局[21] - 从“0到1”阶段依赖创始人勤奋和开放,但“1到10”阶段则考验其领导力与战略眼光,决策一旦被证伪会引发更大负面情绪[21] - 一言堂模式高度依赖老板决策的正确性,错判形势可能带来灭顶之灾[21] 时代的潮汐与资本环境 - 2024-2026年中国创投市场发生巨变,资本向头部和已有商业化进展的企业集中[23] - 2024年,中国自动驾驶领域有37家企业宣布破产或实质停摆,2025年出清加速[23] - 许多创业公司的底层逻辑是“如何用PPT融到下一轮钱”,而非创造可持续价值,当融资游戏结束,公司便难以为继[24] - 案例显示,曾被资本追逐的完美团队(如千挂)和拥有重资产(如达闼价值223亿元的标签及不动产)的公司,在潮水退去后依然可能失败[24] 智驾行业的独特困境 - 智驾创业公司代表了有技术、人才、客户和意愿但仍失败的典型样本[25] - 以某智驾公司为例,其拥有优越的起点(创始人清华、剑桥背景,通用汽车核心研发经验)和开局(2021年通过地平线合作拿下理想ONE订单,出货超15万套),但仍陷入困境[26] - 行业存在结构性两难:做Tier 1则利润被车企挤压,活得卑微;做解决方案商若无算法或硬件壁垒易被替代;做全栈自研则面临技术投入无底洞和激烈竞争[26] - 该公司过于注重“苦干”和“交付”的工程文化,忽视了构建核心技术壁垒和可持续商业模式,最终未能打通任何一条路径的闭环,现已转向氢能智能重卡赛道[27][28] 总结与启示:组织进化 - 这些公司的失败共同原因是,在技术路线、客户定价、股权分配等关键路口出现了一次或多次误判,叠加后拖垮公司[30][31] - 创业的启示在于:技术是手段非目的,融资是资源非答案,客户是伙伴非上帝,团队是资产非工具[31] - 公司的持续生存能力取决于组织进化速度,创始人学习进化速度必须快于组织,而组织进化速度必须快于业务发展速度[32][33] - 具备持续自我进化能力的组织,才能实现增长并穿越周期[34][35]
预埋L3硬件、配「满血」版华为乾崑,启境GT7能让年轻人买单吗?
雷峰网· 2026-05-01 11:34
文章核心观点 - 广汽集团与华为乾崑通过深度战略合作,共同打造了全新高端智能汽车品牌“启境”,其首款车型启境GT7是一款原生融合华为全栈智能技术的L3级猎装车,旨在抓住年轻化、个性化市场机遇,是广汽集团第三次冲击高端市场的战略级项目,也是华为车BU在“鸿蒙智行”模式外,赋能传统车企制造能力的新合作范式验证 [2][6][14][21][27] 启境GT7的产品与技术特点 - **原生AI与深度合作模式**:启境GT7从产品定义、设计、开发到生产环节,均与华为乾崑团队深度融合合作,华为车BU投入数百人常驻启境,双方团队打散办公,实现了“原生智能感”,这是华为乾崑深度战略级的首个合作伙伴 [6] - **首发搭载先进智能驾驶平台**:车型首发搭载华为乾崑ADS 5.0智驾系统,该系统采用全新WEWA 2.0架构,引入AI智能体技术,云端训练强度提升10倍,车端应用安全风险场理论可使碰撞风险减少50% [9][10][11] - **具备L3级自动驾驶能力与准备**:车辆硬件层面为L3做好充分准备,采用896线双光路图像级激光雷达,可识别120米外14厘米的障碍物,并对八项关键零部件做了全链路冗余,目前已获得广州市L3级特定场景自动驾驶道路测试许可,累计测试里程超过10万公里 [11][12] - **集成新一代鸿蒙座舱与情感化交互**:首发搭载新一代鸿蒙座舱,小艺智能体语义理解能力更强,支持基于模糊信息的智能检索,车内还设计了AI智能交互的星环散射体,通过灯光与动作与用户进行情感化交互 [12][17] 目标市场与用户策略 - **明确瞄准年轻高端市场**:启境GT7定位30万级猎装车,目标明确为抓住年轻人心智,满足个性化、情感化需求,市场数据显示26-35岁用户占新能源车主的42.3%,18-25岁占14.1%,两者合计超56%,且首次购车平均年龄已降至22.8岁 [14][15] - **基于场景与情感需求设计**:公司认为技术是基础,但更关注用户使用场景和情感表达,因此在产品中融入了可调光天幕、午休空间、智慧投影大灯以及可交互的星环散射体等功能,以提供差异化陪伴体验 [17] 广汽与华为的合作模式与战略意义 - **全新的深度合作模式**:此次合作跳出了此前Hi模式框架,华为派驻800人研发团队合署办公,引入IPD(集成产品开发)流程,提供全栈技术支持,但品牌、定价、销售渠道由广汽主导,华为不介入终端销售,这是一种深度融合的“陪跑”模式 [22][23][27] - **广汽的战略转型与高端再冲击**:启境是广汽集团的最高优先级项目,被视为“番禺行动”的重要一环和第三次冲击高端的背水一战,广汽为此注资15亿元成立华望公司来运营新品牌,旨在结合自身28年制造底蕴与华为智能化经验 [21][24][26][27] - **华为乾崑合作范式的验证**:在问界、智界等鸿蒙智行模式成功后,启境项目是华为车BU需要证明的另一种路径:在不控股品牌、不进入华为门店的前提下,其智能化技术和流程体系能否与传统车企制造能力形成新的成功合作默契 [27] 营销与渠道建设 - **引入华为成熟体系并组建多元化团队**:启境引入了华为的IPMS(集成产品营销服务)流程体系,销售团队构成中来自广汽的不到20%,超过80%来自其他新势力品牌,以吸收多元经验,华为人员也深度参与终端门店的决策过程 [18][20] - **积极推进渠道培训**:公司已对79个城市、300家门店的销售人员完成了第一轮培训,即将开始第二轮,旨在向用户有效传达产品价值信息 [20]
爱芯元智的双轮驱动:车载放量,边缘爆发
雷峰网· 2026-04-30 18:12
行业背景与核心趋势 - 2026年北京车展成为AI芯片与物理AI(如智驾、边缘大模型)落地的核心节点,行业正经历从L2+标配化、舱驾融合到边缘侧大模型渗透的变革 [2] - AI芯片行业在2025年后进入“车载智能化+边缘大模型”双轮驱动周期,驱动力包括智驾渗透率提升、法规强标、高阶NOA推进、国产替代、出海需求以及以DeepSeek为代表的大模型推动边缘推理规模化 [2] - 行业竞争核心逻辑从“通用算力竞赛”转向“垂直场景深度绑定”,能同时打通车载高可靠与边缘高适配的厂商将占据下一代AI计算主导权 [2] - 国产AI芯片厂商迎来高端化、全球化、场景化的三重历史机遇 [2] 爱芯元智业绩与战略验证 - 公司2025年智能汽车与边缘AI推理两大新兴业务合计营收占比从2024年的5.3%跃升至16.4% [3] - 智能汽车解决方案2025年收入达4817万元,同比暴增618.2% [3][7] - 边缘AI产品2025年收入达4360万元,同比增长134.6% [3] - 两大高增长业务(618%与134%)显示公司的“双轮驱动”战略已跨越概念验证期,进入商业化放量通道 [5] 智能汽车业务分析 - 智驾行业呈现“向下”与“向上”两极分化趋势:“向下”指L2+功能平权普及至10万元级车型,中算力平台是主赛场;“向上”指L3/L4高阶智驾对算力需求提升,本土玩家凭借性价比和工程化能力寻求破局 [7] - 公司采用“哑铃型”市场策略:一端聚焦法规强推的L2级辅助驾驶(如AEB),追求极致性价比;另一端聚焦以城区NOA为代表的高阶智驾,追求安全性与用户体验 [9][10] - 在“哑铃”下端(“向下”市场):M55芯片已规模量产;新一代L2芯片M57在2026年3月实现第一款量产整車面市,并获得多家头部主机厂定点,同时成为安波福、法雷奥等国际Tier 1的选定平台,标志全球化启动 [10] - 在“哑铃”上端(“向上”市场):面向高阶辅助驾驶的M97 SoC于2025年10月投片,2026年1月回片并成功点亮,在算力和带宽方面极具竞争力 [14] - M97芯片设计特点:将DDR带宽拉至行业标杆水平以确保有效算力;专为哨兵模式设计低功耗子模块以降低整车功耗;制程工艺领先市场主流一代,提升性能并改善良率与可靠性 [15] - 业务进展:截至2025年底,智能汽车业务累计实车上险量突破百万辆;2025年全年出货63万颗;新增定点项目超过25个;与零跑、广汽、吉利等15家主机厂及安波福等国际Tier 1建立合作 [7] - 公司预计到2026年底,主流合资品牌都会有公司的项目进行开发或量产 [13] - 公司借助与海外算法伙伴合作,利用其成熟的海外数据库和客户基础,降低中国芯片出海的合规与信任门槛 [12] 边缘AI业务分析 - 边缘AI推理业务是公司正在培育的第三增长极,2025年收入同比增长134.6% [16] - 增长的外部催化剂是2025年初以DeepSeek为代表的开源大模型突破,使市场认识到云端推理存在Token费用高昂、网络延迟大、数据隐私风险三大痛点,推动了“云端训练、边缘推理”趋势 [16] - 公司AX8850N芯片的核心差异化在于原生支持Transformer架构,能高效部署DeepSeek、Qwen等主流大模型,让算力下沉至设备端 [19] - 搭载AX8850N芯片的“帝王虾盒”(AXClaw Box)为智能家居及办公场景提供节省Token、安全可靠、高智价比的本地AI算力方案 [19] - 公司认为AI Agent将成为现象级To C边缘计算大品类,算力可能成为继水、电、煤气、宽带之后的第五大家庭基础设施,且Agent因涉及隐私必须本地运行;边缘侧256 TOPS算力已能支撑30B参数模型运行 [19] - 公司预计2026年下半年将发布两款专为边缘计算打造的新品,以巩固领先地位 [20] 技术底座与研发投入 - 公司自研“AI-ISP + NPU”统一技术平台:爱芯智眸AI-ISP赋能终端与车载感知;爱芯通元NPU兼顾智驾与边缘大模型推理,实现一芯多场景复用,共享IP积累,摊薄研发成本 [22] - 2025年公司研发费用为5.96亿元,通过优化统一研发团队与精细化运营,支撑了多颗高阶SoC的同步研发 [22] - 技术平台的通用性是公司敢于同时进攻车载和边缘两个高门槛市场的底气 [22] 生态定位与开放策略 - 公司自成立之初即定位为独立的Tier 2芯片平台,不做算法,不做Tier 1 [22] - 在行业“垂直整合”与“生态分工”模式碰撞下,公司的“中立”身份将决策权交还车企,使其能自由选择算法伙伴和芯片,公司提供“多一个选择” [25] - 公司联合阶跃星辰、天数智芯等组建“千里联盟”,旨在与算法公司及Tier 1合作形成小生态,与垂直整合模式竞争,但公司保持开放,不排斥与其他伙伴形成新生态 [25] - 在供应链上,公司在SerDes、MCU等周边元器件上完全开放,由客户决定供应商,公司只做验证配合,不做强制绑定,这种“去中心化”思路降低了车企导入门槛 [26] 财务基本盘与未来展望 - 2025年终端计算业务(“黑光”系列芯片)贡献了83.4%的收入,达4.68亿元,为公司提供稳定现金流与试错空间 [27] - 公司预判2026年至2027年将是智能汽车和边缘AI两大新兴业务的爆发期 [27] - 随着M57大规模放量和M97等大算力芯片进入商业化进程,预计到2027年,新兴业务营收占比将快速提升(2025年合计占比约16%) [27] - 公司于2026年2月在港股上市,全球发售募资28.35亿港元,为后续先进芯片的研发与量产补充关键资本 [28]
愿景2036丨一场关于未来10年AI技术主权争夺战,追觅打了头阵
雷峰网· 2026-04-30 11:40
文章核心观点 - AI正在深入硬件,重写家电品类的定义,行业处于“重做一遍”的喧嚣中[2][3] - 公司通过展示可跨品类迁移的技术体系、用户价值驱动的创新方法论及全屋智能生态蓝图,系统回应了谁有资格定义行业新标准的问题[4] - 公司角逐行业话语权的核心依据是技术、方法论与生态的组合拳,这构成了其打开下一个十年技术迭代的钥匙[5] 技术基座:可进化、可迁移的核心能力 - 公司拥有如同生物基因、可在不同产品形态中表达与进化的核心技术体系,确保进入任何品类都能实现降维打击[8] - 仿生机械臂技术是平台型解决方案,从清洁延伸至空调(广角驭风机械臂)和洗碗机(灵动机械振翼喷臂),实现跨品类的功能跃迁[8][10] - 智能感知能力正从“识别”进化到“理解”,从“单体感知”到“系统感知”,例如烟机可动态调整拢烟角度的主动捕烟模式[11][12] - 技术边界正从“执行指令”向“管理生活”拓展,如冰箱能识别食材营养,未来可联动健康数据提供个性化膳食建议[13] - 核心技术决策范畴已从完成单一任务,向优化用户健康与生活品质的更高维度延伸,这是未来竞争所需的前瞻性储备[14] 创新方法论:当“用户痛点”遇见“技术长板” - 公司依仗“N+1”创新方法论,即在行业成熟方案(N)基础上,用技术长板打造解决深层需求的差异化价值(+1)[16][17] - 在空调领域,针对冷风直吹等痛点,其“+1”方案是融合全场景AI感知与广角驭风机械臂,实现气流精准调度,将产品从“空气调节器”转变为“个人体感管家”[17] - 在洗衣机领域,针对全流程家务痛点,其“+1”方案是推出整合AI视觉与仿生机械臂的洗护机器人Z1,旨在接管从分拣到归置的全流程[17] - 在宠物智能用品领域,其“+1”功能是通过高精度称重传感器监测宠物进食量并生成报告,满足健康关怀需求[19] - 该方法论让技术突破锚定具体用户痛点,“技术长板+需求深挖”构成了产品差异化竞争力的核心[19] 生态协同:打破单品孤岛的底层逻辑 - 未来竞争取决于跨场景协同与整体智慧场景体验的定义权,而非单一产品的卓越[21] - 公司已开始探索基于统一底层架构的全屋智能生态构建,描绘了从咖啡机、扫地机器人到空调、冰箱、睡眠戒指自主协同的场景全景图[22] - 生态构建的底气源于公司已在主赛道完成技术布阵,并在空调、冰箱、洗衣机、割草机、泳池机器人等多品类推出具备创新势能的产品[24] - 各品类产品创新出自同一套底层技术体系与方法论,其互联生态是底层架构上天然契合的能力共振,比简单的App联动更深一层[24] 全球市场验证:用业绩铺就通往“主桌”之路 - 公司技术实力已获全球高端市场验证,扫地机器人全球累计销量突破1100万台,在30个国家市占率第一,在德国、瑞士等18国线上占有率超40%[27] - 公司洗地机品类在近20个国家拿下市占率第一[27] - 在北美市场,2026年第一季度多品类同比增长超100%,2025年全年营收同比激增189%[29] - 业绩支撑是“本地化即全球化”的运营逻辑,坚持“一市一样”策略,将全球技术优势转化为解决各地独特生活难题的本地化方案[30] - “技术+本地化”的组合是其持续在全球市场开疆拓土、夯实行业地位的根本策略[31]
美国暂停对华虹半导体部分供货?中方回应;东方甄选奖励300名员工市值4亿股份,人均超140万元;DeepSeek正在灰度测试「识图模式」
雷峰网· 2026-04-30 09:00
要闻提示 NEWS REMIND 1.5月1日起,北京禁飞、禁售无人机! 2.美国暂停对华虹半导体部分供货?中方回应 3.DeepSeek 终于能"看图"了!灰度"识图模式",图片理解功能内测 4.一加、realme合并:成立子系列事业部,李炳忠任总经理 5.主播离职潮后,东方甄选奖励300名员工市值4亿股份,人均超140万元 6.阿里高绩效员工年终奖上浮1-2个月,新员工长期激励首年归属近1/3 7. 官方通报网民称霸王茶姬喝出水银:异物为购买人自己投放 8.SpaceX批准马斯克天价薪酬,若达成市值与火星殖民目标可获2亿股 今日头条 HEADLINE NEWS 5月1日起,北京禁飞、禁售无人机! 4月29日消息,从5月1日开始,北京市无人驾驶航空器管理规定将正式执行(《北京市无人驾驶航空器管 理规定》)。这项新规对无人机的销售、存储、飞行等环节进行了全方位的严厉管控,相关条款直接对标 严打黑飞和严控流通,没有留出模糊空间。 新规明确严禁在北京市区域内销售或租赁无人机及核心部件。任何单位和个人不得向北京区域内的对象提 供整机或飞控、电池、电机等关键零部件。违规者不仅会被没收设备,个人还将面临最高5000元的 ...
独家丨一加、realme合并:成立子系列事业部,李炳忠任总经理;李杰负责子系列产品中心,向刘作虎汇报
雷峰网· 2026-04-29 22:03
OPPO集团组织架构调整:realme回归后的人事与业务整合 - OPPO内部发布公告,宣布新成立子系列事业部,由公司高级副总裁李炳忠负责,该事业部整合了一加和realme的营销服务体系,原realme营销服总裁徐起被任命为子系列事业部营销服负责人 [1] - 产品方面成立子系列产品中心,下设国内与海外产品部,统一由李杰负责并向刘作虎汇报,原realme副总裁王伟担任该中心副总经理并向李杰汇报 [1] - 原realme的研发团队重新回归OPPO集团,其影像、硬件等部门并入OPPO,成为OPPO各硬件部门的下设部门 [1] 整合进程与战略方向 - 早在3月底,OPPO已开始将realme各部门分批搬入其位于滨海湾的总部 [2] - 有OPPO员工透露,在realme与一加合并后,集团将会更加重视产品线的复用情况 [2]
磐脉920亮相,平头哥算存网版图闭环
雷峰网· 2026-04-29 21:24
文章核心观点 - 行业共识正从追求单点算力性能转向关注整个算力网络系统的协同能力,网络已成为制约大规模AI集群效率的关键短板[2] - 平头哥通过发布磐脉920智能网卡,完成了对数据中心算力、网力、存力三大关键环节的芯片全布局,具备了构建完整算力基础设施的底层能力[4][21] - 同时掌握算、存、网三类核心芯片能力的厂商,将有机会重新定义AI基础设施的性能边界与成本结构[22] AI集群的网络瓶颈与行业趋势 - 在网络结构未优化的情况下,大规模AI集群的GPU利用率通常仅维持在30%—40%区间,优化较好也很难超过60%[2][10] - 集群规模扩大进一步放大了网络瓶颈,突发推理流量、复杂拓扑链路拥塞、长数据路径等问题侵蚀算力效率[2] - AI系统负载结构正从训练与推理1:1的比例向4:1演进,网络需承载高频、突发、混合型推理流量,对带宽和时延提出持续挑战[6] - 现有网络体系存在代际差异,传统TCP网卡依赖CPU,RDMA在大规模集群中仍受多层交换拓扑、跨节点同步等因素制约[7] 磐脉920智能网卡的技术与性能 - 磐脉920是AI原生智能网卡,采用PCIe 5.0与112G PAM4以太网技术,最大支持400Gbps吞吐带宽,收发包率达400Mpps[3] - 该网卡每秒可处理4亿个网络数据包,单秒传输能力相当于100部高清视频数据量[13] - 通过多路径RDMA机制、细粒度网络感知与可编程拥塞控制算法,将链路带宽利用率从约60%提升至接近90%[14] - 在网卡内部引入PCIe Switch,直连GPU与SSD,构建更短数据传输链路,降低系统复杂度[15] - 其“内生式网络结构”设计带来了整体系统成本约30%的下降[16] 磐脉920的产品策略与市场定位 - 磐脉920已进入量产阶段,首批产品已上线,订单正在加速交付[4] - 它并非定制化专用网卡,而是一款面向开放市场的通用型产品[19] - 产品将首先在阿里云数据中心部署,并已向外部服务器厂商、部件厂商及多类云厂商开放测试[20][21] - 设计围绕多类算力基础设施需求展开,适配智算集群、通算集群、存储场景及数据库与大数据分析等多种场景[18] 平头哥的芯片布局与战略意义 - 随着磐脉920发布,平头哥已完成数据中心四大核心芯片布局:真武系列AI芯片、倚天系列CPU、磐脉系列智能网卡、镇岳系列存储主控芯片[4] - 这覆盖了算力、网络与存力三大关键环节,意味着公司已具备从提供单一算力器件走向构建完整算力基础设施能力的底层条件[21]
下午 2 点丨这轮AI存储牛市还能走多远?
雷峰网· 2026-04-29 08:26
文章核心观点 - 存储行业在经历历史性上涨大周期后,近期市场出现剧烈波动,引发对市场真实供需状况及未来走势的深度关切 [1][2][3] - 文章旨在通过一场圆桌讨论,邀请产业链核心参与者(渠道商与系统厂商)共同剖析存储市场的真实情况、关键驱动因素及未来趋势 [3][13] 根据相关目录分别进行总结 第一,复盘过去一年的存储大周期 - 行业经历了历史性上涨大周期,TrendForce报告显示,2026年第一季度传统DRAM合约价环比上涨90%到95%,NAND Flash合约价环比上涨55%到60% [2] - 然而,市场在3月下旬突然变脸,DRAM现货市场出现恐慌性抛售,主流32GB DDR5套装价格从3月中旬的2999元左右降至2200元附近,单月跌幅接近27% [2] - 圆桌将探讨渠道商(长虹佳华)对缺货焦虑的起始时间点、引发渠道紧张的关键产品节点,以及系统厂商(中科曙光)在项目交付层面受到涨价影响的实际体感 [14] 第二,聚焦HBM:最紧缺的货品与最大变局 - HBM产能被市场认为已抢光,圆桌将探讨渠道视角下的真实供需状况,以及客户是否因拿不到HBM而被迫修改方案或推迟项目 [15] - 将讨论国产HBM推出后,客户的选择倾向(等待国产还是坚持国际大厂产品)[15] - 将分析三星在HBM4路线上采取的激进策略能否帮助其翻盘,并从技术角度探讨SRAM替代HBM的可能性及英伟达若推出LPU对HBM构成的潜在颠覆风险 [15] 第三,再看其他存储:DDR、SSD等HBM之外的溢出战场 - 将讨论DDR5、SSD等产品的紧张程度,并关注AI带来的溢出需求(如有数据称每128K token需消耗61GB的KV Cache)[18] - 指出市场存在矛盾现象:尽管有AI需求拉动,但DDR4价格此前出现闪崩,华强北市场反映内存生意如同炒股 [18] - 长虹佳华将分享在价格剧烈波动行情中的库存决策策略,中科曙光将分享AI推理对SSD和HDD的具体需求拉动倍数,以及公司在产品设计上所做的相应调整 [18] 第四,最后聊未来:存储的商业模式变革 - 探讨存储定价逻辑的未来演变:可能从按容量定价转向按节省的算力价值分账(例如,若能将GPU利用率从60%提升至80%)[19] - 探讨存储角色可能从“卖容量”转变为“卖效率”,以及这一转变将如何重塑存储厂商在AI产业链中的地位 [19] - 长虹佳华将从渠道商角度,分享本轮周期带来的最大机遇与挑战,并探讨公司是否有意向像部分同行那样向上游自研领域延伸 [19] 圆桌嘉宾背景 - **郭照斌**:中科曙光北京公司副总裁,拥有十五年存储系统设计与研发经验,主导研发的分布式存储ParaStor于2022年登顶IO500全球存储性能榜第一,其团队打造的集中式全闪存储FlashNexus在2025年2月的SPC‑1 V3测试中以超3000万IOPS、0.202ms时延获得全球第一 [22] - **王文浩**:长虹佳华高级副总裁,拥有超过二十年ICT领域经验,自2003年加入公司后专注于存储与数据解决方案,自2013年起带领团队布局数据存储、管理及应用业务,推动构建覆盖热温冷多级数据场景的解决方案体系 [23] 直播信息 - 本次关于存储市场的圆桌讨论直播定于2026年4月29日14:00(北京时间)举行,将在视频号【雷峰网】直播间播出 [5][25]
全网最强万字解读:DeepSeek-V4 掀翻了谁的桌子?
雷峰网· 2026-04-28 12:33
文章核心观点 - 文章核心观点认为,DeepSeek-V4的发布并非简单的价格战,而是一场持续四年的、以“极致效率”为核心的中国AI“效率革命”[2] 其通过革命性的技术方案,将百万上下文长文本的处理成本从“奢侈品”降至“日用品”级别,与海外主流模型形成了370倍的成本鸿沟[2] 这场效率领先的背后是复杂的技术取舍和生态绑定,标志着大模型产业竞争正从“模型竞赛”转向全栈的“系统战争”[20] 产业竞争与市场格局 - **成本颠覆性优势**:DeepSeek-V4的API定价为2.5元人民币/百万Token,而GPT-5.5“大杯版”为130美元/百万Token,两者成本相差370倍[2] 其定价仅为海外大厂的约1/10,形成了“降维打击”式的商业优势[18][24] - **竞争焦点演变**:大模型产业竞争正从单纯的“算力竞赛”和“打榜”转向以长上下文处理能力和综合推理成本为核心的“落地”阶段[20][25] 长上下文已成为支撑Agent等复杂应用的基础设施[35] - **中美技术路线分化**:国内“开源御三家”(DeepSeek、千问、Kimi)主要选择MoE路径,而OpenAI、Anthropic等美国巨头仍倾向于稠密模型[17] 这反映了中美在资源约束(算力封锁、预算受限)与资本驱动下的不同生存策略[17][39] - **商业化潜力分层**:未来市场将明显分层,绝大多数商业场景将流向DeepSeek这类具备10倍以上成本优势的实用模型,而OpenAI等则为对成本不敏感的高风险场景提供顶尖解决方案[49] 技术架构与效率突破 - **核心效率突破**:DeepSeek-V4通过CSA(压缩稀疏注意力)与HCA(混合注意力)的组合方案,将百万上下文(1M)的KV Cache压缩至传统方案的2%,计算复杂度从O(n^2)降至接近线性[9][26] 这使百万级长文本从“高门槛消耗”变为低成本“日用品”[9][26] - **训练成本极低**:公司历史版本已展现出极致效率,V3以不到600万美元训练出GPT-4o级别模型,R1以30万美元纯强化学习涌现出思维链能力[6][11] - **MoE架构的极致运用**:V4采用MoE架构,总参数达1.6T,但每个Token仅激活49B参数(约3%)[17] 通过极致的细粒度稀疏化,实现了以更小计算量处理海量参数[45] - **后训练路径优化**:V4放弃了R1的纯强化学习路径,转而采用OPD(在线策略蒸馏),先在特定领域训练专家模型,再蒸馏到统一模型中,以追求更高效、稳定的训练[31][33] 系统生态与国产化 - **深度软硬一体化绑定**:V4彻底适配了华为昇腾910B芯片并支持FP4精度,标志着从训练到推理实现了中国自主安全可控的闭环[11][24] 这被视为对CUDA生态壁垒的直接挑战[30] - **开源战略坚持**:在友商收紧开源协议的背景下,公司依然坚持最开放的MIT协议,不设商业化限制,形成了显著的生态和价值观优势[24][30] - **推动国产算力生态**:公司的实践为国产算力生态提供了关键牵引,例如利用Agent辅助工具,将国产芯片底层算子的编写时间从一两周缩短至10-20分钟,反向驱动了系统生态的进化[20][50] - **系统复杂性代价**:极致的效率优化带来了系统架构的复杂化,这可能在后续的跨平台迁移、不同芯片算子适配时带来极高的工程难度[12][27] 能力边界与技术取舍 - **长上下文策略的取舍**:公司走实用主义压缩路线,优势是成本极低,支持百万长度,适用于代码重构、长文档总结等场景[36] 代价是在128K长度后的检索性能会出现衰减,存在逻辑断层的可能,与Claude追求的“完美检索”路线不同[9][27] - **MoE的连贯性瓶颈**:在需要高度全局一致性的长程Agent任务(如复杂编程)中,MoE的动态路由机制可能导致逻辑断层,表现可能略逊于稠密模型[17][41] 例如在SWE-Bench测试中,V4(55.4%)略低于Claude 4.5(57.3%)[41] - **长上下文技术的半程**:当前技术主要解决了“记忆”问题,但模型无法在交互中持续更新权重、沉淀个性化知识,从“临时缓存”到“权重更新”的“学习”能力是尚未解决的另一半挑战[14] - **效率与能力的平衡**:公司的技术哲学是在“效率优先”下进行明确取舍,以10%的性能差距换取10倍以上的成本优势,从而将AI能力普及为基础设施[49]