多模态应用
搜索文档
从HBM到SSD:被严重低估的AI存储长周期逻辑
傅里叶的猫· 2026-04-01 23:40
文章核心观点 - 当前AI存储需求被市场低估,尽管近期存储板块出现回调,但AI驱动的存储需求长周期依然强劲,其根本原因在于AI应用(尤其是多模态和Agent应用)对高速存储(如SSD)的消耗量远超传统认知,且AI正从根本上改变存储行业的商业模式和增长逻辑[1][3][13][14] AI用户对存储的需求测算 - 一个日均消耗1000万tokens的AI重度用户(Power User),每天会产生50到100GB的SSD存储需求,计算链条包括:40MB纯文本、30GB向量索引、会话状态、Agent日志及三副本复制[4] - 一个日均消耗100万tokens的普通用户,存储需求约为12GB,是重度用户的十分之一[5] - 并发用户的需求增长并非完全线性,因系统可通过“共享仓库索引”优化,但优化空间有限,特别是当应用从单一Agent转向多Agent协作时,存储压力会快速累积[5] - 编程类Agent(如Claude Code)因同时调用多个Agent(写代码、审查、测试、优化),其存储消耗远超普通对话应用[5] 多模态应用带来的存储挑战 - 从文本到音频,存储需求增长10倍;从音频到视频,再增长100倍;一分钟视频内容的存储体积是同等时长文本的10000倍[6] - 多模态应用(如截图分析、AI视频生成、自动驾驶)产生的数据体积庞大且均为需要快速读取的“热数据”[6] - 在AI推理场景下,所有需要实时响应的数据都必须存放在SSD上,无法使用价格低廉但速度慢的机械硬盘(HDD),HDD仅适用于冷归档数据[7] AI系统的存储层级结构 - **第一层 HBM**:最顶层,直接焊接在GPU上,最贵、最快、容量最小,用于存储模型权重,例如一颗H100 GPU有90GB HBM[8] - **第二层 DRAM**:服务器内存,容量是HBM的4到5倍,用于存储KV Cache等“短期记忆”[9] - **第三层 SSD**:容量从1TB到15TB不等,是“长期记忆”的主力存储,用于RAG知识库、用户历史会话、Agent状态等[9] - **第四层 HDD**:仅用于训练数据归档和冷备份,在推理环节基本不出现[10] - 一个万亿参数模型以INT4精度运行时,大致需要500GB HBM、700到800GB DRAM以及5TB SSD,以实现每秒1000 tokens的推理速度[10] - DeepSeek的engram和Google的TurboQuant等技术试图通过数据迁移或压缩来优化存储占用,但可能面临杰文斯悖论(效率提升导致总消耗增加)[10] 行业级存储需求预测与市场影响 - 根据JPM数据,预计2026到2027年,全球超大规模云服务商的SSD需求将达到200到300 EB(艾字节)[11] - 这200到300 EB需求构成包括:训练检查点占50%到60%,RAG数据湖占10%到15%,其余为数据复制备份及增长最快的多模态推理状态[12] - AI在存储市场中的占比将急剧提升:DRAM市场中AI需求占比将从2023年的9%升至2026年的37%和2028年的53%;NAND闪存市场中AI需求占比将从2023年的2%升至2026年的32%和2028年的41%[13] - 2024到2028年,AI DRAM市场的价值总规模(TAM)年复合增长率预计为105%,远高于非AI DRAM的51%[13] - 供给端存在约束,包括晶圆厂物理空间限制、HBM良率挑战、Agent应用爆发可能带来超预期需求,以及物理AI(机器人、自动驾驶)的存储需求远超软件AI[13] 存储行业商业模式的重构 - AI正推动存储行业从大宗商品模式向定制化解决方案模式转型,HBM、SOCAMM、eSSD等产品需要与客户深度绑定、联合设计[14] - 这种转变有望提升存储厂商的利润率中枢,熨平行业周期波动幅度,并重构行业的估值体系[14]
从阿里云涨价看算力通胀演绎的节奏和阶段
2026-03-20 10:27
关键要点总结 一、 行业与公司 * 涉及的行业:**人工智能(AI)算力产业链**,涵盖**上游硬件**(GPU、芯片、存储、光模块、PCB)、**中游基础设施**(IDC/数据中心、算力租赁、云服务)、**下游应用**(大模型厂商、AI应用)[1][2][5] * 涉及的公司: * **云服务商**:**阿里云**、**百度云**、腾讯云、亚马逊云科技(AWS)、谷歌云、网宿科技、优刻得、字节跳动(未明确表态)[1][2] * **大模型厂商**:**智谱AI**、Minimax、DeepSeek、OpenAI、Anthropic(Claude)[4][8][9][10] * **硬件与上游**:英伟达(GPU)、台积电、中芯国际(晶圆代工)[5][19] * **其他**:OpenRouter(API聚合商)、Devin(龙虾,Agent应用代表)[4][12] 二、 核心观点与论据 1. 算力通胀趋势确立,价格传导路径明确 * **核心观点**:算力通胀已从上游明确传导至国内主流云厂商和模型厂商,**Token价格上涨是必然趋势** [1][2] * **论据**: * **传导顺序**:2026年1月起,通胀从**GPU、存储**(甚至CPU)开始,传导至**云服务**(1月下旬亚马逊、谷歌云提价),2月国内中小云商跟进,近期**阿里云、百度云、腾讯云、智谱AI**正式宣布涨价,标志趋势确立 [2] * **传导路径**:**晶圆代工/芯片 -> IDC/算力租赁 -> 云厂商/模型厂商 -> 应用/用户**,由上游向下游传导 [1][5][21] * **驱动逻辑**:**需求指数级增长**(Coding、Agent、多模态应用) vs **供给线性增长**(上游产能受物理约束)[3][4][20] 2. 需求侧:AI应用演进是Token消耗激增的核心驱动力 * **核心观点**:大模型向**编程(Coding)、智能体(Agent)、多模态**演进,催生Token消耗量呈指数级增长 [3][4][7] * **论据**: * **AI Coding**:是目前全球AI应用中**渗透率最高**的领域,市场规模巨大(国内中期预计550-1000亿美元)[10][11] * **Agent应用**:是当前最热门方向之一,其Token消耗量**较Chatbot高100-1,000倍** [1][13] * 增长逻辑:Coding能力提升(10倍消耗增长)、Agent数量/工作时长/上下文窗口(乘数效应)、多模态应用普及 [12] * 具体原因:上下文积累、多轮循环、定时任务(7x24小时运行)、工具调用日志、多智能体协作 [14] * **多模态应用**:**视频生成**消耗巨大,如生成1秒视频约耗**2万Token**,成本约**1元**,将重塑影视工业流程 [1][17] 3. 供给侧:资本开支增长但面临多重约束 * **核心观点**:尽管资本开支增长,但受**物理约束和集群损耗**影响,**供给增速远不及需求** [18][20] * **论据**: * **资本开支**:2026年初海外主要云厂商资本开支总额预计**6300-6600亿美元**,同比增长**70%-80%**,但面临GPU产能、数据中心硬件(变压器)、电力供应等约束 [18] * **单卡性能**:新卡(如GB200相比H100)能显著降低单位Token推理成本(从1.73美元/百万Token降至0.45美元),但**新卡优先用于训练**,推理主力仍是上一代产品(如H100),存在应用滞后 [19] * **集群损耗**:业务负载率通常仅**50-60%**,国内部分可能低至**30-40%**,制约有效供给 [20] 4. 市场与商业策略变化 * **核心观点**:2026年资本市场风向转变,大模型厂商策略从**扩张转向追求盈利与轻量化** [1][8] * **论据**: * **驱动因素**:二级市场开始关注**投入产出比**,一级市场融资难度增加 [8] * **策略变化**:海外厂商在迭代旗舰模型同时,推出**性价比更高的中端及免费模型**(如GPT 5.4的Mini和Nano版本)[8] * **盈利验证**:**Coding和Agent方向**被验证具备强大盈利潜力,如Anthropic在Coding Agent领域实现**10-15个月内收入增长20倍** [9] 5. 对算力基础设施的结构性影响 * **核心观点**:Agent等应用的普及对算力基础设施产生**结构性需求变化** [15] * **论据**: * **本地/企业算力**:对个人PC/服务器显存要求提高,企业私有化部署需求将爆发 [15] * **云端算力**:需要极高吞吐率和低延迟,增加对**高速互联(光通信)、HBM和先进封装**的需求 [15] * **边缘计算**:个人/企业对边缘服务器、NAS、IoT设备需求增加 [15] * **存储**:增加对**DRAM和企业级SSD**的需求 [15] * **CPU需求**:主要增加**数据中心服务器CPU**需求(高核心密度、高I/O、低功耗),个人PC CPU需求增长感知尚不明显 [16] 6. 投资策略与市场轮动 * **核心观点**:投资应坚持 **“上游优先”** ,重仓竞争格局优、涨价确定性高的环节;市场轮动关注边际变化 [1][22][23] * **论据**: * **投资逻辑**:越靠近上游(如GPU、核心硬件),**竞争格局越集中,议价能力越强**,涨价确定性和持续性越强 [5][6][23] * **市场轮动**:近期市场焦点从GPU转向云服务,是关注**涨价向下游传导的边际变化**;未来若Token需求量再次出现指数级增长,焦点将**重新回归GPU环节**,开启新传导周期 [22] * **配置建议**:算力产业链内,**上游配置较重仓位**,下游适当减轻;短期关注涨价传导机会 [23][24] 三、 其他重要但可能被忽略的内容 * **视频生成成本具体数据**:生成一段15秒视频消耗**30.88万Token**,每分钟视频消耗约**120万Token**;生成100万个10秒短视频,总Token消耗量达**2000亿** [17] * **AI Coding能力迭代速度**:Anthropic的Claude处理代码能力从2025年7月的**1000行**,增长至11月的约**1万行**,再到2026年2月达**10万行** [10] * **Agent应用的市场热度**:Devin在OpenRouter上的Token调用量份额从2025年12月的**10%** 增长至2026年3月的**17%** [12] * **图片生成消耗对比**:每张图片大约消耗**1000个Token**,远低于视频 [17] * **IDC环节涨价预期**:目前涨价已传导至云服务和算力租赁,**IDC环节尚未明显上涨,但预计未来会跟进** [22]
港股将迎来“全球大模型第一股”与“多模态应用第一股”
财经网· 2025-12-17 23:06
行业动态 - 两家中国大模型公司于同日通过港交所上市聆讯,分别为北京智谱华章科技有限公司与上海稀宇极智科技有限公司 [1] - 智谱华章有望成为“全球大模型第一股” [1] - 稀宇极智有望成为“多模态应用第一股” [1] 行业意义 - 两家公司分别代表“基础层”与“应用层”,其同步上市标志着中国AI行业参与全球竞争进入“硬实力”新阶段 [1]
受益多模态应用高速发展 阜博集团推出AI音乐检测服务
智通财经· 2025-11-21 13:35
业务发展 - 公司推出AI音乐检测服务,面向数字平台、音乐发行商及版权管理组织,旨在精准区分人类创作与AI生成音乐[1] - 新服务依托先进的音频、旋律与人声识别技术,通过提升检测准确率与真阳性率构建音乐内容生态的“版权防火墙”[1] - 服务的快速落地得益于公司此前对音频内容识别技术提供商PEX的收购,形成技术协同优势[2] 行业趋势与驱动力 - 随着NanoBanana、Gemini、Sora2等多模态模型的密集落地,AI音乐因算力成本更低、成品成熟度更高已出现可规模化变现的作品[1] - 行业对AI生成内容的识别与确权需求持续激增[1] - 公司收入增长核心动力之一来自AI生成视频数量的快速攀升[2] 财务表现 - 公司25年三季度收入增长超27%[2] - 其中主要来自Youtube平台的美国业务收入增长达33%[2] - 当前公司管理的活跃资产中已有9.1%为AI相关内容,增速远超整体活跃资产增长,对收入形成实质性贡献[2]
受益多模态应用高速发展 阜博集团(03738)推出AI音乐检测服务
智通财经网· 2025-11-21 13:28
服务推出与核心功能 - 公司于11月21日宣布推出AI音乐检测服务,面向数字平台、音乐发行商及版权管理组织 [1] - 该服务旨在精准区分人类创作与AI生成音乐,应对AI音乐泛滥带来的版权确权与合规管理难题 [1] - 服务依托先进的音频、旋律与人声识别技术,通过提升检测准确率与真阳性率,构建音乐内容生态的版权防火墙 [1] 行业趋势与市场需求 - 随着NanoBanana、Gemini、Sora2等多模态模型的密集落地,AI音乐因算力成本更低、成品成熟度更高已出现可规模化变现的作品 [1] - 行业对AI生成内容的识别与确权需求持续激增 [1] - 公司管理的活跃资产中已有9.1%为AI相关内容,其增速远超整体活跃资产增长,对收入形成实质性贡献 [2] 技术基础与业绩表现 - 服务的快速落地得益于公司此前对音频内容识别技术提供商PEX的收购,形成技术协同优势 [2] - 公司25年三季度收入增长超27%,其中主要来自Youtube平台的美国业务收入增长达33% [2] - 收入增长的核心动力之一来自AI生成视频数量的快速攀升 [2]
美团正式上线LongCat App,可体验语音通话等新功能
新浪财经· 2025-11-03 13:11
产品发布与功能 - LongCat-Flash-Omni模型于11月3日正式发布并开源,同时LongCat官方App上线公测 [1] - 新App已支持联网搜索和语音通话功能,视频通话功能将稍后上线 [1] - Web端增加了图片上传、文件上传和语音通话等功能 [1] 技术架构与性能 - 模型基于LongCat-Flash系列的高效架构设计,采用Shortcut-Connected MoE并包含零计算专家 [1] - 集成了高效多模态感知模块与语音重建模块 [1] - 在总参数5600亿(激活参数270亿)的规模下,实现了低延迟的实时音视频交互能力 [1] - 该技术为开发者的多模态应用场景提供了更高效的选择 [1]
百度开源视觉理解模型Qianfan-VL!全尺寸领域增强+全自研芯片计算
量子位· 2025-09-22 19:16
文章核心观点 百度智能云千帆推出全新视觉理解模型Qianfan-VL系列并全面开源 该系列包含3B、8B和70B三个版本 针对企业级多模态应用场景深度优化 在通用能力 垂直场景OCR和教育以及思考推理方面表现卓越 基于百度自研昆仑芯P800芯片实现高效计算 在多项基准测试中达到SOTA水平[1][2][3] 模型性能与效果 - 在通用能力基准测试中 模型性能随参数规模增大提升显著 3B 8B 70B版本在ScienceQA测试中精准度分别达95.19% 97.62% 98.76% 在RefCOCO物体识别测试中平均得分达85.94% 89.37% 91.01%[2][4] - 多尺寸模型满足不同场景需求 3B 8B 70B三种规格覆盖不同规模企业需求 8B和70B模型支持通过特殊token激活思维链能力 覆盖复杂图表理解 视觉推理和数学解题场景[3] - OCR与文档理解能力增强 具备全场景OCR识别能力 包括手写体 数学公式 自然场景文字和卡证票据信息结构化提取 在OCRBench测试中得分达831 854 873[3][5][6] 技术架构与计算能力 - 采用先进多模态架构设计 通过持续预训练和四阶段训练策略实现领域能力显著提升 构建面向多模态任务的大规模数据合成管线 涵盖文档识别 数学解题 图表理解等核心任务[9][12] - 基于百度自研昆仑芯P800芯片构建超大规模分布式计算系统 支持单任务5000卡规模并行计算 显著提升大模型任务处理性能与运行效率[1][12] 应用场景案例 - 数学推理场景中 8B和70B模型在MathVista-mini测试中得分达69.19%和78.6% 在MathVision测试中得分达32.82%和50.29% 展现卓越复杂图表理解和数学解题能力[7][8] - 文档理解场景中 模型可精准解析财务报表等复杂版面文档 实现自动版面元素分析和表格图表解析 支持文档智能问答与结构化解析[27][29][31] - 模型同样适用于图表分析 视频理解等场景 均呈现卓越效果[33] 开源与推广 - Qianfan-VL系列模型全面开源 提供3B 8B 70B三个版本 即日起至10月10日可在百度智能云千帆平台免费体验8B和70B模型[1][34] - 开源资源包括模型Blog GitHub主页 Hugging Face仓库和技术报告 全方位支持开发者使用和研究[34]
硬蛋创新(00400.HK)中期经营溢利2.76亿元 同比增加约20.8%
格隆汇· 2025-08-30 00:56
公司业绩表现 - 报告期内收入约人民币66.77亿元 同比增加54.5% [1] - 经营溢利约人民币2.76亿元 同比增加20.8% [1] - 除税后纯利约人民币1.9亿元 同比增加12.4% [1] - 每股盈利0.086人民币元 [1] 行业发展趋势 - AI应用快速渗透成为全球芯片市场增长核心驱动力 [1] - 上半年全球芯片市场规模达3460亿美元 同比增长18.9% [1] - 生成式AI、大语言模型及多模态应用加速商业化落地 [1] - 数据中心对高性能GPUs、专用AI加速器及先进存储芯片需求大幅上升 [1] 市场需求驱动因素 - 全球主要云服务商大幅增加资本开支用于扩建AI训练及推理服务器集群 [1] - 云计算领域资本开支增加推动高端AI芯片出货量增长 [1] - AI相关需求对全球芯片市场增长贡献尤为突出 [1]
首都在线20250710
2025-07-11 09:05
纪要涉及的公司 首都在线、智谱、地平线、松鼠科技、美图、快手 纪要提到的核心观点和论据 - **业务转型与增长**:2023 年全面转型智算业务,预计 2025 年 GPU 业务增长 60%-80%,因上半年 GPU 市场质和量变化,下半年多模态及其他应用落地或加速增长;CPU 业务增长率约 10%;IDC 业务 2025 年增长有限,2026 年预计增长 0-5%,后年可能达 5%-10% [2][3][7] - **公司战略与平台**:战略为“一云多池、一云多模、一云多芯”,2024 年四季度推出 GPU g 客平台,按节点和 TOKEN 收费,已上线 deep seek、智谱等模型,2025 年三季度或四季度将上线海外版优质模型 [2][3] - **算力基础设施投建**:有四个基地,美国达拉斯节点规划 15 兆瓦并解决能源问题,北京怀来京津冀节点 2025 年底投入使用,规划 50 兆瓦,安徽芜湖节点 2026 年开工建设,规划 100 兆瓦;甘肃庆阳已落成一个万卡集群,联合政府再造一个万卡集群 [4][5] - **芯片购置**:2025 年计划投资 3 - 5 亿元购置芯片,一季度末已花费约 2 亿元,主要用于购买 4,090 和 H200 型号,计划购置芯片还包括 5,090 和 H200 型号 [2][4][6] - **业绩预期**:预计 2025 年利润约 15 亿元,较 2024 年的 13 亿多增长,但仍缩亏;2026 年预计盈利转正,得益于政府补贴回流、GT 充沛度减少、成本下降及集群效应提升毛利率 [2][6] - **客户与服务**:AI 应用爆发后预判下半年放量,主要客户集中在推理侧需求,未来拓展快手等高销量客户,提供裸金属及具备软件层能力的云计算服务 [3][8] - **客户行业占比**:GPU 领域主要客户来自 AIGC、大模型应用、教育、金融和政务行业,互联网行业客户转换量少,多小批量试用 AI 技术 [3][9] - **算力租赁意向**:自建基地,有意向未来进行算力租赁业务,若无法消化内部需求,将租给其他客户 [10] 其他重要但是可能被忽略的内容 - **智谱情况**:是首都在线战略合作伙伴,推理需求大部分依赖首都在线平台,其内部财务规划及资本开支数据无具体信息,应用端使用量无显著变化,市场传闻其正在整合上市 [11] - **数据流量趋势**:当前大模型如文生文和文生图、多模态模型的数据流量调用小,政企和教育行业客户多处于试点阶段,下半年至明年数据流量预计逐步增加,多模态模型及新大型应用发布将推动流量快速增长 [11]
中科金财(002657) - 002657中科金财投资者关系管理信息20250429
2025-04-29 22:40
公司活动信息 - 活动类别为业绩说明会,时间是2025年4月28日,地点是中国证券报•中证路演中心线上会议 [1] - 上市公司参与人员有董事长兼总经理朱烨东、财务总监朱烨华、董事会秘书王姣杰、独立董事季成,外部参与人员是通过中证路演中心参与的广大投资者 [1] AI业务战略规划与进展 - 2025年坚持以金融科技、数据中心及人工智能解决方案为基础,与龙头企业合作,加大在AI Agent、多模态应用、云服务等领域研发投入,拓展金融等行业应用,AI Agent已有订单落地 [1][2] - 以打造多任务、复杂任务智能体为目标,构建技术架构体系,形成AI Agent开发运行平台及多种覆盖银行前、中、后台业务场景的AI Agent产品 [2] AI应用订单与营收情况 - 微短剧领域形成相关产品和解决方案,参与出品微短剧并提供AI技术服务,相关收入占公司整体营业收入比例较小,2025年将加大多模态应用等领域投入 [3] - 2024年人工智能综合服务毛利率为20.70%,2024年四季度AI营收大增2亿,2025年一季度人工智能综合服务营收同比有所增长 [4] 公司营收季节性与业绩情况 - 公司客户采购遵循特定程序,营收呈现季节性,通常第四季度较为集中,2024年第四季度营收增长86%实现扭亏为盈,2025年一季度亏损增加 [4] 金融科技领域成果 - 累计服务国内外银行客户500余家,业务覆盖约5万个银行营业网点,已形成227项软件著作权、13项发明专利,助力银行实现全业务链智能化跃迁 [5] 公司合作情况 - 是阿里云合作伙伴及公共云AI大模型框架服务商,联合阿里云发布智能体解决方案,成为阿里云金融先锋联盟成员单位,建立多层次生态合作模式 [6] 人工智能领域布局与成果 - 搭建覆盖算力基础设施、AI算法、大模型、多模态应用、AI Agent的产业布局,已获得135项软件著作权、4项发明专利 [7] 研发费用情况 - 2025年一季度研发费用4,647万元,去年同期3,785万元,同比增长22.77%,研发投入主要集中在多模态、AI Agent、大语言模型等方向 [7][8]