B30

搜索文档
DeepSeek V3到V3.1,走向国产算力自由
虎嗅APP· 2025-08-24 17:02
DeepSeek-V3.1技术升级 - 公司发布V3.1版本采用混合推理架构,同时支持思考模式和非思考模式,提高思考效率并减少token消耗和时间成本[6] - 模型通过后训练优化提升Agent能力,外扩训练增加840B token,上下文长度和两种模式均达到128k[8] - API Beta接口支持strict模式Function Calling,提升工程可靠性和企业易用性,并增加对Anthropic API格式支持以渗透其企业市场[8][9] UE8M0 FP8超低精度创新 - 公司采用UE8M0 FP8 Scale参数精度,这是一种对数数值系统(LNS)特化实现,用于存储缩放因子而非直接权重[11][13][24] - 该格式兼容MXFP8标准,可在支持该标准的硬件(包括英伟达Blackwell和国产GPU)上直接运行,减少75%内存使用并提升训练推理效率[4][13][27] - 超低精度设计覆盖极宽动态范围,通过软件定义适配国产芯片,使国产GPU能高效运行大模型[13][24][27] 算力自主战略路径 - 公司分两阶段突破:先通过魔改PTX指令集最大化利用英伟达GPU算力利用率,再通过UE8M0 FP8降低算力物理需求适配国产芯片[4][26][27] - 软硬件协同优化构建"算力无关"模型生态,长期减少对进口先进GPU依赖并推动国产芯片生态发展[4][27][32] - 超低精度技术加快国产下一代GPU推出(如寒武纪、沐曦、燧原、昇腾),形成去英伟达化路线[14][27][32] 对英伟达市场的影响 - UE8M0 FP8技术降低对H20/B30等缩水版芯片需求,国产芯片生态完善将削弱CUDA锁定效应[29][30][32] - 英伟达优势仍存于G200的更大带宽、更强互联和显存以及CUDA生态绑定,但低成本训练路径弱化其必选性[32] - 公司技术路线可能影响英伟达中国市场策略,中长期国产方案更受成本敏感企业青睐[29][30][32]
开源证券晨会纪要-20250717
开源证券· 2025-07-17 22:12
报告核心观点 - 美国6月通胀如期反弹,核心通胀同步反弹,后续总体通胀或在核心通胀带动下持续上行,但6月通胀反弹对美联储降息决策影响较小,基准情形下美联储首次降息或在11月,全年有1 - 2次降息 [2][7][8][9] - H20恢复供应,国产互联网厂商Capex投入有望加速,带动国产算力产业链订单释放,长期看好AI趋势下国内互联网厂商资本开支的持续性 [3][13] - 完美世界预计2025H1大幅扭亏为盈,重点产品管线清晰,《异环》等产品上线有望带来业绩增长,影视业务提质减量经营趋于稳定,维持“买入”评级 [4][19] 总量研究-宏观经济 - 2025年6月美国CPI同比上升2.7%、环比上升0.3%,核心CPI同比上升2.9%、环比上升0.2%,通胀如期进入回升阶段,后续或持续上行,但核心通胀同比增速相对平稳、环比增速不及预期,部分缓解市场对通胀向上斜率过高的担忧 [6][7] - 6月能源项同比下降0.8%,降幅较5月收窄2.7个百分点,食品项同比上升3.0%,较5月上升0.1个百分点;核心商品对通胀贡献度继续提升,核心商品同比增速较5月上升0.42个百分点至0.7%,核心服务同比上升3.616%,较5月基本持平 [7] - 6月核心商品再通胀显示关税对美国通胀冲击还在进行,超级核心服务通胀同比、环比增速较5月分别上升0.16、0.15个百分点,后续需关注通胀向上斜率、弹性及持久性 [8] - 关税对通胀的影响在6月CPI中已较明显体现,美联储已有预期,关键看后续通胀向上斜率;关税政策有变数增加美联储决策难度;考虑到6月美国居民长期通胀预期下行,2025年美联储仍有降息可能,基准情形下首次降息或在11月,全年有1 - 2次降息,后续关注6月PCE通胀及7月非农情况 [9][10] 行业公司-电子 - 英伟达提交重新销售H20GPU申请,美国政府保证授予许可证,此前H20禁运使国产互联网厂商Capex短期不确定性增加,现不确定性消除,各类项目招标有望重启,带动国产算力产业链订单释放 [13] - 全球AI趋势明确,北美CSP自2023年Q3起持续加大AI基建投入,国内大模型竞赛点燃算力刚需;国内互联网厂商资本开支尚处增长初期,阿里未来3年将投入超3800亿元建设云和AI硬件基础设施,腾讯2025年将在2024年基础上进一步增加资本支出 [14][15] - 建议关注国产算力建设链及AI芯片国产替代机会,国内算力芯片、存储、ASIC定制、PCB、电源等环节有望受益,如寒武纪、香农芯创、芯原股份等公司 [16][18] 行业公司-传媒(完美世界) - 完美世界2025H1预计归母净利润4.8 - 5.2亿元、扣非净利润2.9 - 3.3亿元,实现同比扭亏为盈,2025Q2预计归母净利润1.8 - 2.2亿元、扣非净利润1.3 - 1.7亿元,核心游戏业务表现稳健,业绩增长得益于新游《诛仙世界》、电竞业务流水增长及降本增效 [19] - 维持2025年、上调2026年并新增2027年盈利预测,预计2025 - 2027年归母净利润分别为7.88/14.35/16.22亿元,对应EPS分别为0.41/0.74/0.84元,当前股价对应2025 - 2027年PE分别为35.8/19.6/17.4倍,维持“买入”评级 [4][19] - 《异环》近期在国内外测试获积极反馈,有望加速上线驱动业绩增长;《女神异闻录:夜幕魅影》海外公测获高度认可;《诛仙2》定档8月7日国内公测,有望巩固MMORPG赛道优势 [20] - 影视业务上半年归母净利润约4000万元,经营趋于稳定,公司坚持“提质减量”策略,聚焦精品化平台定制剧,该业务不再是业绩主要拖累项,有助于资源聚焦核心游戏主业 [21]
中美芯片战,正在变成黄仁勋的机会
虎嗅· 2025-07-17 16:29
英伟达在中美芯片战中的战略定位 - 黄仁勋通过"主权AI"概念推动全球各国发展本土AI基础设施,促进英伟达GPU销售 [3] - 公司在中美科技脱钩背景下持续为中国市场定制缩水版芯片(A800/H800/H20)以维持市场份额 [3][10] - 英伟达市值突破4万亿美元,成为AI技术革命的核心受益者 [2] 中国市场策略与表现 - 2024年初H20芯片在中国市场销售额达160亿美元 [11] - 黄仁勋年内三次访华,强调中国供应链先进性和科技创新活力 [1][2] - 公司重要客户包括DeepSeek、阿里巴巴等中国AI领军企业 [1] 地缘政治博弈 - 英伟达成功游说特朗普政府废除拜登时期的AI芯片出口限制政策 [4][5] - 公司通过"技术代差"策略向中国出售性能缩减70%的H20芯片(相比H100) [10] - 黄仁勋同时强化与中东(阿联酋/沙特)的芯片合作 [5] 产品与技术路线 - 计划2024年9月推出为中国定制的Blackwell架构缩水版B30芯片 [11] - 正在出货新一代G200芯片,保持对中国的技术领先 [10] - 通过差异化产品策略延长每代架构的盈利周期 [11] 行业竞争格局 - 中国AI崛起打破硅谷垄断,客观上扩大英伟达GPU需求 [2] - 华为昇腾芯片被黄仁勋公开认可为H20级别竞争对手 [7][8] - 中国具备构建独立AI生态的潜力(算力节点/通信网络/电力供应) [7]
芯片供给改善,利好Capex预期恢复+招标节奏,关注下半年国产算力行情
华福证券· 2025-07-15 21:58
报告行业投资评级 - 强于大市(维持评级) [7] 报告的核心观点 - 芯片供给即将恢复,大厂资本支出预期大幅提升,有望带动机电设备等订单加速释放,行业仍在景气上升初期 [4] - 推理/训练tokens数的指数级增长将带来算力需求增长,反哺芯片出货需求和云厂capex增长,传导至相关设备产业链 [5] 根据相关目录分别进行总结 行业动态跟踪 - 7月15日英伟达宣布恢复H20在中国的销售,其CEO表示正在提交重新销售H20 GPU的申请,美国政府已保证授予许可证,英伟达希望尽快启动交付 [3] - 英伟达CEO宣布推出面向中国特供的B30,性能约为H20的75%,适用于中小机型推理;6月下旬英伟达接到数十万块B30订单,总价值达10亿美元,预计8月开始交付,计划年底前出货数百万块 [3] 供给端观点 - 前期国产算力受压制主要系芯片禁运问题,现阶段地缘政治维稳、国内H20销售恢复在即、B30测试需求火热且大厂新一轮租赁招标稳步推进,多方因素迎来改善 [4] - Q2大厂capex释放节奏受芯片供给压制,环比预期不高且招标节奏放缓;Q3起大厂整体capex有望大幅提升,阿里全年预期有望恢复至1000亿以上,利好电力设备产业链招标节奏恢复,Q4出货兑现确定性高 [4] 需求端观点 - META宣布Hyperion将在数年内扩展到5GW,马斯克表示Grok即将登陆特斯拉汽车,Grok4将深度整合特斯拉AI超级计算机系统,为全自动驾驶、Optimus提供核心技术支持 [5] - H20限售解禁使国内AI垂类模型训练、推理提速,国产AI Agent需求端改善形成正循环,后续可关注GPT - 5、DS2.0、华为智能体等端侧爆款应用的催化 [5] 投资建议 - 柴发:整体供需或仍中性偏紧,短期急单有望催化涨价,Q2业绩预计加速释放,建议关注【玉柴国际】【重庆机电】【潍柴重机】【科泰电源】 [5] - 电源/配电:柜内外头部厂商订单和交付有望随capex释放保持高增,但需关注大厂集采的降价风险,龙头公司规模降本也在持续,建议关注【中恒电气】【欧陆通】【科华数据】【麦格米特】【通合科技】【江海股份】 [5] - 液冷/冷机:数据中心冷量需求大,受益北美订单需求增长和GB系列液冷渗透率预期提升,建议关注【冰轮环境】【英维克】【高澜股份】【申菱环境】 [6] - HVLP铜箔:AI服务器功耗提升,推动高端PCB铜箔放量在即,建议关注【德福科技】【铜冠铜箔】 [6] - 其他环节:建议关注开关柜有望在互联网厂商突破国产替代的【良信股份】;算力租赁有实质订单落地的【宏景科技】;有望受益铜缆订单外溢的【泓淋电力】 [6]
从限售到“解封”:黄仁勋访华,H20回归,英伟达为何力保中国市场?
每日经济新闻· 2025-07-15 21:06
英伟达恢复H20在华销售及新产品布局 - 公司宣布恢复H20 GPU在中国的销售,并推出面向中国市场的新款完全兼容GPU [1] - H20恢复销售旨在稳住云计算等大客户,避免市场份额流失 [1] - 最新推出的RTX PRO GPU定位工业数字化转型市场,避开高算力训练敏感领域 [1] - 公司创始人黄仁勋在中美间奔走,强调AI对全球商业和社会的益处 [1][2] 英伟达中国市场战略及财务影响 - 公司因H20"禁售"导致2026财年第一季度产生45亿美元费用 [3] - 禁售前H20产品销售额为46亿美元,另有25亿美元订单无法交付 [3] - 公司股价在宣布恢复H20销售后一度站上168美元 [3] - 中国市场对公司实现6年后4000亿美元销售目标至关重要 [4] 新产品B30的技术特点与市场定位 - B30是基于Blackwell RTX Pro 6000处理器的修改版本,为符合出口管制特别设计 [6] - 该芯片移除了HBM和NVLink等先进技术 [6] - RTX PRO 6000将采用96GB GDDR7内存,定位AI推理、边缘端深度学习等应用 [6] - 新产品通过架构优化,FP4算力超越H20,能效比更高 [7] 技术调整对性能的影响 - 移除HBM对百亿级以上大模型训练有影响,但通过架构优化仍可保持推理优势 [7] - 改用GDDR7后带宽和性能有所下降,但仍能满足部分需求 [7] - 国内已有曦智科技的光互联技术可替代NVLink [8] 中国市场竞争格局 - 国内头部AI企业正积极测试昇腾、寒武纪等本土替代方案 [8] - 阿里巴巴推出Hanguang 800 AI推理芯片,百度开发Kunlun III [8][9] - 腾讯采用自研AI推理芯片Zixiao及燧原科技解决方案 [9] - 全球半导体产业链已离不开中国市场 [9]
国产AI算力进展汇报
2025-06-23 10:09
纪要涉及的行业和公司 - **行业**:国产AI算力产业、AIDC产业链、游戏电竞行业、数据中心行业、AI硬件行业 - **公司**:中芯国际、寒武纪、海光信息、友方科技、松井科技、云赛智联、海南华铁、智飞生物、光环新网、奥飞数据、新高教集团、大卫科技、万国数据、世纪互联、欧陆通、科华数据、中恒电气、英维克、英伦股份、通飞股份、有源杰科技、华工科技、光迅科技、中际旭创、新易盛、长光华芯、世佳光子、博创科技、紫光股份、中兴通讯、华为、阿里云、腾讯云、英伟达、博通、美满、火山引擎 [12][13][15][16] 纪要提到的核心观点和论据 - **核心观点**:国产AI算力产业长期发展空间大,虽短期受H20断供等影响,但第三季度有望修复,看好算力租赁等方向 [1][2][11] - **论据** - **芯片供给**:H20断供使2025年第二季度市场担忧芯片供给,资本开支下调、招标延缓;第三季度AI芯片供给边际改善,英伟达B30、B40若能顺利测试,巨头或规模下单缓解缺芯 [1][3][5] - **算力租赁**:算力租赁市场发展顺利,租用卡型号升级,为解决短期缺芯提供途径 [1][6] - **中芯国际产能**:2025上半年产能受阻,7月起逐步修复,预计第三季度复苏,2026年国内产能释放有机会 [1][7] - **巨头投资**:国内巨头对AI投资决心坚定,算力投入与公有云营收相关,阿里云和腾讯云增长快,总服务器需求提升 [1][8][9] - **液冷渗透**:自研及国产芯片功耗高,将拉动国内液冷渗透率和普及率超预期 [4][10] 其他重要但是可能被忽略的内容 - **国产大模型发展**:截至2025年5月底,国内大模型发展迅速,如Deepseek更新版本,豆包上线新功能、发布新模型,各场景AI工具调用占比和消耗量增长 [14] - **国内AIDC产业链进展**:华为开发者大会发布新模型和节点,全国首批两个数据中心Reits获批,北京市出台政策支持游戏电竞行业引入AIGC技术并给予奖励 [15] - **海外市场影响**:英伟达数据中心业务发展、GP300样品测试,博通发布新交换芯片,美满预测市场规模,推动计算芯片等需求加速 [16] - **AI技术应用前景**:AI技术在各行业逐步落地,各行业TOKEN消耗量增长,未来拉动低时延需求和推理需求,带动国产AI算力链发展 [17]
【太平洋科技-每日观点&资讯】(2025-06-05)
远峰电子· 2025-06-04 20:24
行情速递 - 主板领涨个股包括中电鑫龙(+10.05%)、御银股份(+10.04%)、光华科技(+10.02%)、中科金财(+10.02%)和中嘉博创(+10.00%) [1] - 创业板领涨个股包括汇金股份(+20.03%)、太辰光(+14.88%)和天阳科技(+12.49%) [1] - 科创板领涨个股包括德科立(+11.56%)、生益电子(+8.54%)和林和微纳(+7.31%) [1] - 活跃子行业中SW通信网络设备及器件上涨3.83%,SW印制电路板上涨3.40% [1] 国内新闻 - 紫光展锐发布智能穿戴平台W527,采用12nm工艺制程,配备1个Arm Cortex-A75主核(2.0GHz)和3个Cortex-A55小核(1.8GHz) [1] - 5月比亚迪销售新车38.25万辆,上汽集团销售36.6万辆,长安汽车销售22.43万辆,奇瑞集团销售19万辆 [1] - 大族激光控股子公司大族数控向港交所递交上市申请,该公司以6.5%全球市占率登顶全球,连续16年位居CPCA专用设备榜首 [1] - 泰凌微推出支持边缘计算和人工智能的芯片产品TL721x/TL751x,已在智能家居、智能办公和无线音频领域广泛应用 [1] 公司公告 - 永信至诚每股现金红利0.05元,资本公积金每股转增0.48股,实际派发现金红利总额5,075,762.90元,转增后总股本增至150,961,519股 [2] - 甬矽电子累计回购股份2,562,688股,占总股本0.63% [2] - 欧莱新材每股派发现金红利0.065元,合计派发10,402,913.56元 [2] - 金安国纪全资子公司广西禅方药业获高新技术企业认定,2024年至2026年可享受15%企业所得税优惠税率 [2] 行业动态 - 英伟达为中国市场研发降规版AI芯片B30,支持多GPU扩展,采用Blackwell架构和GDDR7显存 [3] - 25Q1全球可穿戴腕带市场同比增长13%,出货量达4660万部,苹果Apple Watch市占率从17.5%降至16.3% [3] - WSTS预测2025年全球半导体市场规模达7009亿美元,同比增长11.2%,逻辑和存储器市场将引领增长 [3] - 三星3nm制程良率进展缓慢,量产三年后仍保持在50% [3]