华为升腾950Pro
搜索文档
DeepSeek-V4-带来哪些投资机会
2026-04-13 14:13
纪要涉及的行业或公司 * **行业**:人工智能(AI)产业链,涵盖大模型、算力(芯片、服务器、零部件)、AI应用[1][2][3][4] * **公司**: * **大模型厂商**:DeepSeek、智谱AI、MiniMax、Kimi、阶跃星辰、小米、OpenAI、Anthropic、Google、xAI、Meta[1][2][3][9][10][11][12][13] * **算力芯片厂商**:华为(升腾)、寒武纪、阿里巴巴(平头哥/PPU、昆仑芯)、海光信息、沐曦、英伟达[1][3][6][15][17][18] * **服务器与零部件厂商**:超聚变、华鲲振宇、神州数码、软通动力、烽火通信、宝德股份、华丰科技、意华股份、川润股份、通富微电、航天电器、光迅科技、华工科技、深南电路、紫光股份[6][20][21][22] * **AI应用厂商**:税友股份、金山办公、鼎捷软件、汉得信息、泛微网络[5] * **其他**:字节跳动、中芯国际[3][15] 核心观点和论据 大模型投资与估值框架 * **两阶段估值法**:2026-2028年,因API收入高速增长(预计翻倍以上)及To B业务渗透加速,采用年化收入(ARR)倍数估值,参考OpenAI的50-60倍及Anthropic的40多倍[1][2];2028年后,收入增速放缓但毛利率提升(预计达70%以上),转向采用毛利倍数估值,毛利增速越高则估值倍数越高[1][2] * **模型能力与定价**:模型智力水平决定token定价能力,高性价比token可扩大使用量,两者共同影响毛利率[2] * **投资观点**:中期看多大模型和算力,战略性回避应用层;若DeepSeek-V4发布,应用领域可能存在短期交易性机会[2][5] 算力市场趋势与催化剂 * **当前阶段**:处于2025年第二季度开始的、由全球推理侧Token需求指数级增长引发的算力主升浪尾声,多数环节已轮动涨价,短期波动大[3] * **未来催化剂**:第二波算力主升浪的核心催化剂是市场明确感知到全球总Token需求再次出现指数级增长[1][3] * **需求侧证据**:字节跳动截至2026年3月底的日均Token消耗量超过120万亿,月均超过3,600万亿,较2025年底的月均1,500万亿增长一倍以上[3];H100 GPU租赁价格近期持续上涨[3] * **潜在超预期增量**:AI Coding加速渗透是明确趋势,而Agent在企业端的爆发将为Token需求带来巨大增量,例如“龙虾”项目已导致谷歌、Anthropic等厂商限制其订阅账户使用额度[3] DeepSeek-V4的预期与影响 * **发布时间**:市场预期在2026年4月发布,已有灰度测试,时间点临近[4][14] * **性能预期**:灰度测试体感显示,性能可能与Codex-3.6持平,代码能力和多轮检索提升显著[4] * **技术路线**:可能采用2026年初提出的Ingram算法(存储换计算),具备多模态理解能力(如图片),但短期不涉足视频生成[14];为适配国产算力,已将训练语言从CUDA和OpenAI Triton迁移至北大开源的TELANG[15] * **投资机会**:主要带来国产算力和AI应用两大类机会[5] * **国产算力适配的不确定性**:关键不确定性在于适配是基于训练与推理的全栈适配,还是仅限于推理端;全栈适配将引发训练需求超预期增长,极大惠及国产芯片厂商;仅推理端适配则影响相对较弱,受益逻辑转变为通过加速AI应用渗透带动推理需求[5] 国产算力产业链分析 * **利好传导顺序**:芯片环节最直接受益 → 服务器整机及板卡放量 → 光模块、液冷、连接器等零部件 → 下游IDC → 反向传导至上游芯片制造与封装[6] * **国产芯片竞争格局**: * **市场份额(2025年)**:英伟达份额从2024年的67%降至55%;国产厂商份额排序大致为:华为、阿里巴巴平头哥、昆仑芯、寒武纪、海光信息、沐曦[6] * **性价比排名(理论/实际)**:阿里巴巴平头哥PPU > 华为升腾950 > 寒武纪690,均已超过英伟达H20水平[1][18][19];实际集群测试数据显示,PPU性价比第一,升腾950约比PPU低20%,寒武纪690又比升腾950低约10%[19][20][21] * **性能参数差异**:寒武纪思元690在FP8精度下算力达1.4 PFLOPS,高于华为升腾950的1 PFLOPS;但华为在片上互联带宽(UV-Mesh协议)方面有显著优势[16][17] * **华为升腾产业链**: * **服务器梯队**:第一梯队(超聚变、华鲲振宇)、第二梯队(神州数码、软通动力)、第三梯队(烽火通信、宝德股份)[6] * **零部件**:连接器(华丰科技、意华股份)、液冷模组(川润股份)、封装(通富微电)[6] * **华为升腾950 Pro核心信息**: * **2026年出货目标**:升腾芯片总目标100万颗,其中升腾910预计35万颗,升腾950预计65万片[15] * **性能参数**:单卡FP8算力1 PFLOPS,支持FP4精度(算力2 PFLOPS)[15] * **内存方案**:精华LPDDR(约5万元)、长鑫存储HBM2(带宽1.6TB/s,5万元以上)、海力士HBM2E主流版(96GB显存,带宽2TB/s,7.2万至7.5万元)[15] * **测试与产能**:已在互联网厂商进行万卡规模测试;中芯国际NPU+2产线月产能6,000-7,000片,年底预计达8,000-9,000片,基本支持年度出货目标[15] * **产品路线图**:2026年Q4推出升腾950DT(低成本,采用长鑫HBM3,带宽2TB/s,定价8-10万元);2027年Q4推出升腾960(FP8算力提升至4 PFLOPS);2028年Q4推出升腾970[16] AI应用投资策略 * **2026年核心策略**:寻找营收与利润双双提速的标的[1][4] * **利润端**:软件公司利用AI技术进行内部降本增效是基本底线,国产模型代码能力提升将改善研发侧效率,率先体现在利润端[4] * **营收端**:反映应用厂商在客户端业务机会的扩张能力[4] * **当前市场状态**:A股AI应用标的普遍处于底部,筹码结构良好,DeepSeek-V4发布可能催化短期普涨行情,但更多是事件性催化或交易性机会[5] 其他重要产业链动态 * **算力配置建议**:中期优先顺序为GPU > 存储 > 互联;液冷和IDC适合小仓位博取弹性[4] * **CPU涨价预期**:2026年3月以来,英特尔和AMD消费级CPU已出现10%至15%的价格上涨,交货周期延长,涨价预期增强[4][7] * **Transformer架构稳定性**:从英伟达GTC大会信息看,硬件深度定制(如NVLink 7.2与Groq 3 LPX合作)、新增“Agentic Scaling”曲线、学术界持续沿用等三方面佐证了其未来一段时间的稳定性[7][8] * **海外大模型动态**: * **Anthropic**:预计2026年10月左右上市;新模型“Mythos”内部测试中,性能强于Opus 4.6但成本高;面临算力不足压力,已限制Harness AI系统带来的API调用激增[9] * **OpenAI**:处于短期战略收缩期,关停Sora并推迟应用商店计划;广告业务年化收入约1亿美金;新基座模型“SPUD”预训练已完成,预计Q2发布[10] * **Google**:模型更新放缓,最新为Gemma 4系列(开源,最小2.54GB可在手机端离线运行);预计2026年5月I/O大会有重大版本发布[10] * **xAI**:初始联合创始人基本离职;Grok-5模型推迟,Q2发布可能性较大;2月被SpaceX收购,合并后估值2,500亿美元[11] * **国内大模型竞争格局**: * **技术路径**:趋于一致,普遍采用混合专家架构,激活参数量级在300亿至400亿之间,激活率约3%至5%,上下文长度支持到200K左右[12] * **定价策略**:与海外数值相近,主要差异在汇率,例如智谱AI GLM模型(32K token以上)定价为每百万token 22元人民币,Anthropic同类服务为25美元[12] * **厂商特点**:小米技术路线紧跟主流;智谱AI在代码生成领域有优势;MiniMax模型参数较小但强化了Agent和工具调用,性价比高;Kimi专注于提升训练稳定性与效率;阶跃星辰产品线覆盖全面,可能成为国内第三家在港股上市的大模型公司(一级市场估值约90亿美元)[12][13] 其他重要但可能被忽略的内容 * **芯片集群性能评估方法**:可通过设定基准场景(如模型DeepSeek-V2,总参数量671B,激活37B,批处理大小32),综合单卡算力(MFU)和显存带宽(MBU)两个瓶颈,计算理论吞吐量来比较不同AI芯片在集群中的实际表现[17] * **配套环节投资机会**:高速连接器领域关注航天电器(已通过测试,招标结果预计2026年5月初落地);光互联领域关注光迅科技、华工科技;另可关注升腾PCB相关的深南电路及交换机卡标的紫光股份[20][21][22] * **国内模型厂商上市进展**:阶跃星辰可能成为国内第三家在港股上市的大模型公司,预计年中可能提交上市申请[13] * **华为升腾产品形态**:预计2026年向互联网大厂出货仍以单卡形式为主,因大厂倾向采用自家超级节点方案;官方虽会推出384卡集群形态,但出货量预计不大[16]