推理

搜索文档
英伟达,大幅调整
半导体行业观察· 2025-03-02 10:43
如果您希望可以时常见面,欢迎标星收藏哦~ 来源:内容 来自华尔街日报 ,谢谢。 去年年初,Nvidia 面临着越来越大的威胁:人工智能世界正在发生变化,引发竞争。 随着数百万人开始使用人工智能工具,运行底层模型来回答他们的许多问题变得比训练模型的计算 密集型工作更重要——这曾将 Nvidia 推到了人工智能热潮的顶峰。许多人预计,这种转变可能会给 包括 AMD 在内的竞争对手提供抢夺市场份额的机会。 但尽管人工智能的发展已经从创建模型转向操作模型(业界称之为"推理"),英伟达仍已做好准 备,继续保持领先地位。 该公司最新的人工智能芯片 Blackwell 体积更大、内存更大,在人工智能计算中使用数字精度更 低。它们还可以通过超高速网络连接在一起,行业研究公司 SemiAnalysis 的创始人 Dylan Patel 表 示,这带来了推理方面的"突破性进展"。 英伟达周三发布的最新季度财报在一定程度上反映了该公司在适应行业转变方面的成功。报告显 示,该公司的销售额和利润均超出分析师预期,同时对本季度的业绩也给出了乐观的预测。 尽管业绩强劲,但英伟达股价周四仍下跌 8.5% 至 120.15 美元,为 2018 ...
电子|阿里Capex会拉动国产算力半导体多少增量
中信证券研究· 2025-03-01 08:55
文章核心观点 - 阿里巴巴未来三年超3800亿元投入是DeepSeek带动AI加速落地标志之一,有望拉动数百亿元级别国产算力及半导体环节增量,总结出三大受益环节 [1] 相关目录总结 阿里巴巴投入情况 - 2月24日宣布未来三年投入超3800亿元用于建设云和AI硬件基础设施,总额超过去十年总和,预计未来AI相关收入增长由训练为主转为训练+推理共同驱动,未来三年计划持续投入AI多领域,基于Qwen2.5Max的深度推理模型亟待发布 [2] - 根据投入估算,假设平均年化1300亿元,IT硬件支出占比70%对应约910亿元,算力芯片占比70%对应650亿元,中性假设50%投入国产算力,对应32 - 40万颗国产算力芯片,制造端对应约2.1 - 4.4万片晶圆年需求,存储芯片需求量级有望达90 - 100亿元量级 [3] 受益环节1:AI芯片与晶圆厂 - AI芯片高度依赖先进制程,外部制裁使国内先进制程产能战略价值凸显,2025/26年国产算力芯片对应晶圆量约为2.6/3.6万片,2025/26年先进制程晶圆代工市场规模为15/16亿美元,考虑CoWoS先进封装额外增加5 - 6亿美元市场需求,头部科技公司上修Capex预期,国产算力和先进制程增量空间有望扩大 [4] 受益环节2:国产算力芯片 - DeepSeek出圈后美国加大对中国算力出口限制,国内华为昇腾等公司完成对DeepSeek适配,阿里Capex超预期增长由训练+推理算力需求驱动,面向推理端对芯片性价比要求高,国产算力芯片部分理论硬件性能接近国际领先水平,但在制程工艺、多卡互联技术上与海外龙头有差距,也提供突破市场机会,中国AI服务器工作负载将从2024年的65%提升到2028年的73% [5] 受益环节3:企业级和定制化存储 - 存储行业市场价格趋稳,库存逐步消化,预计主流NAND Flash价格25Q2开涨,DRAM价格25H2企稳向好,存储模组涨价早于晶圆端,国内模组厂商25Q2有望迎利润拐点,大模型“推理速度”基本90%由decoding阶段决定,内存容量决定大模型推理速度,看好近存计算技术发展趋势 [6] 投资策略 - 美国制裁加紧和头部科技公司上修Capex背景下,国产算力和先进制程增量空间有望扩大 [8] - AI推理增量需求下,国产算力差异化性价比成突围之路,份额有望加速提升 [9] - 存储芯片是核心受益环节 [10]
英伟达(纪要):对中国的出货比例不变
海豚投研· 2025-02-28 19:07
英伟达2025财年第四季度财报核心信息 财务表现 - 2025财年第四季度营收达393亿美元,环比增长12%,同比增长78%,高于375亿美元的预期 [1] - 2025财年全年营收1305亿美元,同比增长114% [1] - 第四季度GAAP毛利率73%,non-GAAP毛利率73.5% [6] - 数据中心部门Q4收入356亿美元,环比增长16%,同比增长93%,全年收入1152亿美元,同比增长超一倍 [3] - 游戏部门Q4收入25亿美元,环比下降22%,同比下降11%,全年收入114亿美元,同比增长9% [3][4] 数据中心业务亮点 - Blackwell产品Q4销售额110亿美元,创公司最快产品爬坡记录,供应快速增加 [3] - 计算收入环比增长18%,同比增长超两倍,推理需求加速,大型集群常以10万颗以上GPU起步 [3] - 大型云服务提供商(CSP)贡献数据中心收入50%,销售额同比增长近2倍 [3] - 消费互联网收入同比增长3倍,受生成式AI和深度学习用例推动 [3] - 企业收入同比增长近2倍,因模型微调、RAG和代理AI工作流程需求增长 [3] 其他业务部门表现 - 专业可视化业务Q4收入5.11亿美元,环比增长5%,同比增长10%,全年收入19亿美元,同比增长21% [5] - 汽车业务Q4收入5.7亿美元(创纪录),环比增长27%,同比增长103%,全年收入17亿美元,同比增长5% [5] - 网络业务Q4收入环比下降3%,因产品过渡至Spectrum X,预计下季度恢复增长 [5] 运营指标 - 库存环比下降11.1%,应收账款/收入比例降至47% [2] - 预付款同比增长116.1%,反映供应链预付需求增加 [2]
英伟达暴跌!一夜蒸发2万亿!
国芯网· 2025-02-28 12:32
国芯网[原:中国半导体论坛] 振兴国产半导体产业! 不拘中国、 放眼世界 ! 关注 世界半导体论坛 ↓↓↓ 2月28日消息,当地时间2月27日,美国科技巨头股价集体下跌,其中AI芯片龙头企业英伟达股价重挫 8.48%,创下一个月来最大单日跌幅,市值蒸发约1.98万亿元人民币,最新市值约为2.93万亿美元。 尽管英伟达刚刚公布了超预期的2025财年第四财季财报,显示其营收达393.31亿美元,同比增长78%, 净利润为220.66亿美元,同比增长72%,但市场对其未来增长前景仍存疑虑。 英伟达CEO黄仁勋在财报中表示,市场对Blackwell芯片的需求"令人惊叹",并强调推理AI的快速发展为 行业带来了新的增长动力。他指出,增加训练计算能力可以使AI模型更智能,而长时间思考所需的额 外算力则使AI的答案更加精准。 半导体论坛百万微信群 加群步骤: 第一步:扫描下方二维码,关注国芯网微信公众号。 第二步:在公众号里面回复"加群",按照提示操作即可。 爆料|投稿|合作|社群 文章内容整理自网络,如有侵权请联系沟通 投稿 或 商务合作 请 联系 iccountry 然而,分析人士指出,英伟达的季度毛利润率指引未达市场 ...
两台运行“满血版”DeepSeek,第四范式推出大模型推理一体机解决方案SageOne IA
IPO早知道· 2025-02-28 12:11
大模型应用成本降低 - 第四范式推出大模型推理一体机解决方案SageOne IA,显著降低大模型推理成本,满血版DeepSeek V3/R1仅需两台一体机即可使用 [2] - 解决方案集成智能算力池化技术,支持主流大模型如DeepSeek V3/R1、QWen2.5、LLama3.3,GPU利用率提升30%以上,推理性能平均提升5-10倍 [2] SageOne IA核心优势 智能算力池化 - 通过第四范式GPU资源池化(vGPU)技术,实现算力和显存智能切分及任务调度,GPU利用率提升30%以上 [4] - 支持多任务共享存储及处理优化,推理性能平均提升5-10倍,具备千卡级别分布式调度与管理能力 [4] 集成大模型工具链 - 开发平台包含数百个开放模型服务及全生命周期管理工具,支持可视化workflow编排和Agent智能体框架 [5] - 开发周期普遍缩短95%以上,企业开发者可数周内搭建生成式AI应用 [5] 内置AI应用套件 - 预装AIGC、智能办公、数字员工等丰富AI应用套件,支持主流大模型按需选择 [6] - 提供开箱即用的AI工具如模型仓库、智能体Agent平台等,加速企业AI落地 [6] 公司业绩与产品动态 - 第四范式前三季度营收同比增长26.1%,超40款AI产品推动长期增长 [11] - 先知AIOS 5.1新增GPU资源池化能力,算力资源利用率进一步提高 [11] - Q1核心业务收入增长84.8%,行业大模型规模效应显著 [11]
【英伟达(NVDA.O)】FY25Q4业绩超预期,Blackwell需求强劲,推理计算需求高速增长——FY25Q4业绩点评
光大证券研究· 2025-02-27 21:48
文章核心观点 英伟达发布FY25Q4及FY25全年业绩,业绩超市场预期,各业务有不同表现,AI大模型推理需求加速增长,下一代产品将推出 [2][3][4] 业绩情况 - FY25Q4营收393.3亿美元,YoY+78%,QoQ+12%,超彭博一致预期;Non - GAAP毛利率73.5%,QoQ - 1.5pct,YoY - 3.2pct;Non - GAAP净利润220.7亿美元,QoQ+10%,YoY+72%,对应Non - GAAP EPS 0.89美元,超彭博一致预期 [2] - FY25全年收入1305亿美元,同比上升114%,超彭博一致预期;Non - GAAP净利润742.6亿美元,同比增加130%,对应EPS 2.99美元,超彭博一致预期 [2] - FY26Q1指引营收430亿美元,YoY+65%,QoQ+9%,超彭博一致预期;Non - GAAP毛利率71%,QoQ - 3pct,低于彭博一致预期 [2] 业务表现 数据中心业务 - FY25全年营收1152亿美元,YoY+142%;FY25Q4营收356亿美元,QoQ+16%,YoY+93%,约50%收入来自大型云厂商,Q4营收贡献占比增至90.6% [3] - Hopper200出货持续环比增长,Blackwell需求强劲,贡献约110亿美元收入,大模型对推理芯片需求持续增长 [3] 游戏业务 - FY25全年营收114亿美元,YoY+9%;FY25Q4营收25亿美元,YoY - 11%,QoQ - 22%,Q4出货量受供应链限制影响,假期需求维持强劲 [3] - 公司预计FY26Q1出货量将恢复增长,搭载GeForce RTX 50系列显卡的笔记本电脑将于3月起发售 [3] 专业可视化业务 - FY25全年营收19亿美元,YoY+21%;FY25Q4营收5亿美元,YoY+10%,QoQ+5%,客户对RTX GPU工作站需求持续提升 [3] 汽车业务 - FY25全年营收17亿美元,YoY+55%;FY25Q4营收6亿美元,YoY+103%,QoQ+27%,增长系自动汽车持续量产爬坡 [3] AI发展情况 - Open AI o3、DeepSeek - R1等大模型推动推理需求加速增长,长思维推理相比一次性推理,需要超100倍的数据量,未来AI大模型计算需求会远超当前大语言模型 [4] - Blackwell需求将持续提升,其供应链问题已解决,下一代Blackwell Ultra将于2025年下半年发布 [4]
【太平洋科技-每日观点&资讯】(2025-02-28)
远峰电子· 2025-02-27 20:03
行情速递 - 主板领涨个股包括德明利(+6.12%)、和而泰(+4.03%)、盈方微(+2.86%)、歌尔股份(+2.61%)、有研新材(+2.55%)[1] - 科创板领涨个股包括云从科技-UW(+19.98%)、天德钰(+13.56%)、翱捷科技-U(+10.04%)、英集芯(+8.28%)、思特威-W(+6.83%)[1] - 活跃子行业中,SW数字芯片设计(+0.55%)和SW被动元件(+0.33%)表现突出[1] 国内新闻 - 2024年中国半导体产业投资总额为6831亿人民币,同比下降41.6%,但半导体设备投资逆势增长1.0%,达到402.3亿人民币[1] - 晶合集成与思特威签署战略合作协议,第一阶段将提供月产能1.5万片Stacked晶圆,第二阶段提升至4.5万片[1] - DeepSeek开源三项优化并行策略,详细展示DeepSeek-V3和R1模型的并行计算优化技术[1] - 芯原股份推出AI图像处理系列IP,包括AINR1000、AINR2000(智能降噪)和AISR1000、AISR2000(超分辨率),覆盖汽车、监控等领域[1] 公司公告 - 华海诚科2024年营收3.32亿元(+17.21%),归母净利润4080万元(+28.97%)[2] - 天承科技2024年营收3.81亿元(+12.32%),归母净利润7684万元(+31.19%)[2] - 微导纳米2024年营收27.00亿元(+60.74%),主要因光伏和半导体设备验收数量增长[2] - 芯源微2024年营收17.70亿元(+3.09%),归母净利润2.11亿元,高温硫酸清洗机台通过客户验证[2] 海外新闻 - 2024年全球电视出货量2.3亿台(+2%),中国出货量首次超过韩国[2] - 2024年全球智能眼镜销量298.3万副,2025年预计增长超4倍,苹果、谷歌等40余家厂商布局[2] - 英伟达财报显示推理需求加速,Blackwell Ultra芯片预计下半年推出[2] - 2024年Q4全球DRAM营收突破280亿美元(+9.9%),Server DDR5合约价上涨及HBM出货推动增长[2] 行业研究团队 - 孙远峰为太平洋证券科技行业首席分析师,团队专注于产业资源赋能研究,获2023年君鼎奖及Wind金牌分析师进步最快奖[3]
英伟达电话会全记录,黄仁勋都说了什么?
华尔街见闻· 2025-02-27 19:09
核心观点 - AI推理需求将远超当前大语言模型(LLM)的计算需求,可能需要比现有计算能力高出数百万倍 [1] - Blackwell系列芯片供应链问题已完全解决,Blackwell Ultra计划于2025年下半年发布 [1] - 公司预计到2025年年底利润率将在70%-80%区间中部 [2] - 数据中心的资本投资持续增长,AI将成为数据中心的主要工作负载 [13] - 企业AI、代理AI和物理AI等新兴领域将推动长期需求增长 [14] 财务表现 - 2025财年第四季度收入为393亿美元,环比增长12%,同比增长78% [32] - 2025财年收入为1305亿美元,较上一财年增长114% [32] - 数据中心收入为1152亿美元,较上一财年翻了一番 [32] - 第四季度数据中心收入达到创纪录的356亿美元,环比增长16%,同比增长93% [32] - Blackwell产品上个季度实现了110亿美元的收入 [8] - GAAP毛利率为73%,非GAAP毛利率为73.5% [43] 产品与技术 - Blackwell架构为推理AI设计,推理性能比Hopper提升25倍,成本降低20倍 [6] - Blackwell的生产涉及350个工厂,150万个组件 [8] - 大型云服务提供商如Azure、GCP、AWS和OCI已经开始部署Blackwell系统 [9] - 公司致力于在两年内将推理成本降低200倍 [36] - Blackwell的FP4 Transformer引擎和NVLink 72扩展结构使处理推理AI模型的速度比Hopper快25倍 [84] 市场需求 - 推理需求正在加速增长,受到测试时扩展和新的推理模型如DeepSeek-R1的推动 [34] - 长思考推理AI可能需要比一次性推理多100倍的计算量 [34] - 训练后的模型定制和微调的总体计算需求可能比预训练高出几个数量级 [34] - 企业收入同比增长了近两倍,得益于对模型微调、RAG和代理AI工作流程的加速需求 [38] - 汽车垂直业务收入预计在本财年将达到约50亿美元 [39] 行业趋势 - AI已成为主流技术,广泛应用于金融服务、医疗保健等行业 [21] - 未来的计算机将是加速的,未来的计算机将基于AI [69] - 公司预计AI将从数字世界扩展到物理世界,推动机器人技术和物理AI的发展 [38] - 全球各国都在构建自己的AI生态系统,对计算基础设施的需求激增 [39] - 初创公司的活跃和创新表明AI市场潜力巨大,需求将持续强劲 [15] 地理分布 - 中国市场的比例保持稳定,大约是出口管制之前的一半 [68] - 由于Blackwell的初步推广,美国的数据中心收入环比增长最为强劲 [39] - 法国的2000亿欧元AI投资和欧盟的2000亿欧元AI计划正在重新定义全球AI基础设施建设 [39] - 中国数据中心的销售额仍远低于出口管制开始时的水平 [40] 产品路线图 - Blackwell Ultra计划在下半年推出,将带来新的网络、内存和处理器等改进 [16] - Blackwell Ultra将无缝对接现有系统架构,继续推动AI基础设施的发展 [18] - 公司与客户和供应链紧密合作,确保从Blackwell到Blackwell Ultra的平稳过渡 [17] - 下一代产品Vera Rubin正在准备中,将带来巨大的性能飞跃 [60] 客户案例 - NAP利用英伟达TensorRT将其截图功能的推理吞吐量提升了三倍,并削减了66%的成本 [35] - Perplexity每月处理4.35亿次查询,并通过英伟达Triton推理服务器将推理成本降低了三倍 [35] - 微软必应利用英伟达TensorRT在视觉搜索中实现了5倍的速度提升 [35] - Meta的Andromeda广告引擎运行在Grace Hopper超级芯片上,将推理吞吐量提升了3倍 [37] - 现代汽车集团宣布将采用英伟达技术来加速自动驾驶汽车和机器人技术的发展 [39]
戴尔第四季度预览:推理 AI 助阵 ,现在是买入好时机吗?
美股研究社· 2025-02-27 18:41
戴尔股价落后原因 - 自11月以来股价落后市场 主要因市场担忧AI数据中心建设放缓 尤其微软资本支出战略变化传闻影响[1] - 市场担忧Blackwell支持的预训练集群效率提升 而AI模型过去三个月未呈指数增长 导致GPU需求增速放缓[1] AI计算范式转变 - 行业正从预训练为中心转向推理计算为中心 后者扩展性更优且成本更低[2] - 推理AI指模型产生预测的过程 相比预训练更快更便宜 预训练则更深入彻底[3] - 未来数据中心将更多采用"推理本田"模式(小型低成本)而非"预训练法拉利"(大型高成本)[3] 戴尔战略合作与技术优势 - 与AMD达成协议 Ryzen AI PRO处理器将为戴尔设备提供实时字幕 语言翻译及更高安全性[4] - AMD CEO指出其MI300X GPU在推理计算TCO上显著优于Nvidia H100 戴尔可通过替代方案降低系统成本[4] - 摩根士丹利数据证实AMD的TCO远低于Nvidia 戴尔将受益于此技术路线[4] 财务表现与预期 - Q4财报预期EPS 2 52美元(同比+14 46%) 收入245 7亿美元(同比+10 09%) 分析师预测区间狭窄显示共识强[5] - 过去三个月EPS预测20次修正中18次下调 收入16次修正中15次下调 但分析师认为存在上行惊喜空间[6][7] 重大商业合作 - 即将与xAI签署50亿美元协议 显著提升AI服务器业务规模[8] - 预计2024-2025财年AI服务器出货量增加40亿美元[9] 估值与增长潜力 - 非GAAP预期市盈率14 5 较行业中值23 87折价39 26% 量化评级A-[9] - 预期市销率0 83 较行业中值3 11低73 43% 量化评级A[9] - 若市盈率回归行业中值 股价潜在涨幅达64 6%[9] 行业趋势支撑逻辑 - 杰文斯悖论显示AI代币使用成本下降将刺激总需求增长 推理计算市场扩张利好戴尔[10] - AI模型工具价值提升推动消费需求 转向低成本推理GPU集群趋势与戴尔战略契合[10] - 与AMD xAI的合作将直接推动销售增长 叠加行业转型形成双重催化剂[11]
专家访谈汇总:DeepSeek催生AI耳机概念股
阿尔法工场研究院· 2025-02-27 18:31
DeepSeek推动AI产业变革 - ScalingLaw理论表明AI模型性能与参数量、数据量、计算量成正比,三者同步提升带来显著性能提升[3] - 公司通过优化模型性能和降低成本推动AI在中小企业、医疗、金融等传统行业的应用,刺激算力需求增长[3] - 公司与华为昇腾、海光等国产芯片厂商合作,增强国产算力自主可控性[3] - 通过蒸馏技术和算法优化降低模型存储需求和计算量,使AI模型能在手机、耳机等智能终端高效推理[3] - 国内多个手机厂商接入公司AI模型,智能穿戴设备成为端侧AI重要应用场景[3] - DeepSeek-R1具备高性能、低成本、开源优势,全球化影响力和用户基础为未来市场增长奠定基础[3] 大语言模型辅助投研 - 自动化编程插件支持VSCode多模式编程、文件操作、命令行集成及多模型API调用,可自动读取文件、安装依赖、运行代码并修复错误[4] - 大语言模型将投资决策主观因素转化为可量化变量,提升量化分析效率[4] - 模型可从分析师报告提取市场趋势、产业链信息及财务数据,为量化模型提供输入[5] - 通过情感分析技术从新闻、社交媒体等文本提取情绪和观点,优化对市场动向的理解[5] - 智能体如ChatGPTTask可自动执行定期获取信息、浏览网页等重复性任务,释放投研人员时间[5] - 知识库构建支持从历史数据快速提取信息,通过直接提问获取答案[5] - 大模型API服务如OpenRouter、火山引擎等为机构提供低运维成本方案,Ollama工具简化本地部署并保障数据隐私[5] AI陪伴与语音交互技术 - 豆包实时语音大模型在拟人度、情商、通话稳定性等维度评测得分4.36(满分5分),优于GPT-4o的3.18分[6] - 仅2%用户反馈豆包语音过于AI化,而GPT-4o该比例超30%[6] - 模型在情绪理解和情感表达的优势成为吸引用户、扩大市场份额的关键[6] - 语音交互技术或应用于智能助手、客服、教育、医疗等行业,可能引领相关领域技术标准[6] - 与Google、亚马逊等相比,豆包更注重情感化和拟人化体验,形成差异化竞争[6] 人形机器人与热管理技术 - 三花智控在家电领域关键产品如四通换向阀、电子膨胀阀全球市场份额达59%、58%[7] - 特斯拉计划2025年量产数千台人形机器人,2026年扩至5-10万台,2027年达50-100万台[7] - 机器人执行器总成价值初期10-20万元,量产后可降至5万元,利润空间随规模扩大[7] - 2025年汽车零部件业务预计恢复20%增长,中国新兴车企(理想、华为、小米等)销量提供支撑[7] - 2024年家电业务受益政策推动(国补、以旧换新),预计增长5-10%,贡献15亿元利润[7] - 2024-2026年归母净利润预计31.6亿、38.1亿、46.2亿元,增速分别为+8%、+21%、+21%[7] 推理算力市场与政策支持 - 政府强调自主创新,国资委发布"AI+"专项行动,政策红利持续释放[7] - AI和国产化龙头公司仍是未来配置主线,阿里计划三年AI基础设施投入超过去十年总和[7] - 推理算力需求因大模型应用扩展短期快速增长,成为算力行业重要驱动力[8]