推理算力
搜索文档
ChatGPT引入PS 一句话即可修图
北京商报· 2025-12-15 23:51
德邦证券认为,GPT-4o原生图片生成跨越了文生图的提示词和效果两大门槛,有望在广告等下游应用 场景广泛使用,降低高质量广告等图片生成成本。而AI生成图片的普及,也需巨量的推理算力有效支 撑,例如此次OpenAI GPUs未能广泛支撑用户对4o图片生成功能的需求,体现了推理算力对AI应用起到 的重要保障作用。 尽管接入了ChatGPT,Adobe强调其核心生成能力仍基于自研的Firefly系列模型。副总裁Alexandru Costin明确表示,所有通过Adobe工具生成的内容均享有商业使用权与版权保障,避免用户陷入第三方 模型潜在的版权争议。这意味着,即使通过ChatGPT调用Adobe功能,底层依然运行在安全、合规的 Firefly生态之上。 而对于OpenAI来说,这也是将更多第三方应用引入其旗舰产品的一部分举措。今年10月,OpenAI首次 推出应用集成功能,目标是将ChatGPT打造成数字服务的"入口",Spotify、Zillow以及Adobe的竞争对手 Figma是首批加入的公司。 去年,OpenAI曾发布GPT-4o原生图像生成功能以来,全球社交媒体迅速被"吉卜力风格"的AI生成图像 刷屏。用 ...
AI应用按下加速键,乌镇峰会热议算力跃升与安全新考题
第一财经· 2025-11-08 20:13
AI应用落地加速 - AI眼镜等终端设备在乌镇峰会展示多种实际功能,包括实时翻译、导航、支付、物体识别和比价,表明AI技术正从概念热议转向具体应用[1] - 搭载蚂蚁智能体的AI眼镜可为景区游客提供实时导览和大会信息查询服务[1] 算力需求结构变化 - AI推理算力需求增速已远高于训练需求增速[4] - DeepSeek等基座大模型的出现推动推理算力需求超过训练需求,推理模式从单机单卡转向集群推理[10] 算力基础设施升级 - 超节点技术成为提升计算集群性能的关键方案,通过减少AI服务器横向互联性能损失来优化单芯片能效[9] - 中科曙光发布单机柜级640卡超节点,采用浸没相变液冷系统散热[5][10] - 华为昇腾384超节点通过总线技术实现384个神经网络处理器互联,壁仞科技、新华三等厂商纷纷入局[5][10] - 中兴通讯超节点服务器单个机柜支持64块卡,高带宽下可扩展至2048卡集群,已有互联网厂商投入使用[11] - 国产算力接受度快速提升,业界通过超节点等系统级方案弥补单芯片性能差距[10] AI安全挑战凸显 - AI换脸技术被用于盗用明星形象进行虚假直播带货,引发广泛社会关注[12] - AI生成内容的虚假信息识别存在技术难点,生成的图片和音频过于逼真导致现有技术难以甄别[13][14] - AI终端设备增加带来网络安全、数据安全和内容安全的新风险,360白皮书归纳了五方面安全风险[14] - 用户使用AI过程中透露的个人信息安全流通、存储和计算成为行业新问题[15] 隐私保护技术发展 - 苹果推出PCC私有云计算架构保护用户数据被大模型使用时的安全[15] - 预计手机厂商将跟进类似安全方案,密态计算技术将保障跨地域数据流动安全[15] - 随着大模型使用数据从公开知识转向专业数据,密态计算技术应用将更加广泛[15]
中际旭创(300308):1.6T上量将进一步提升盈利 光模块全球最佳交付者地位不变
新浪财经· 2025-09-17 12:35
公司财务表现 - 2025年上半年营收147.9亿元 同比增长37.0% 归母净利润40.0亿元 同比增长69.4% [1] - 单Q2营收81.1亿元 同比增长36.2% 环比增长21.6% 归母净利润24.1亿元 同比增长78.8% 环比增长52.4% [1] - 半年报固定资产61.1亿元 较2024年报增长2.9亿元 存货91.7亿元 较2024年报增长21.2亿元 [2] 业务驱动因素 - Q2收入增长和毛利率改善主要因大客户采购加速及高速硅光产品占比提升 800G出货量快速增长 1.6T开始逐步出货 [2] - 上半年光模块产能1161万只 产量940万只 同比分别增长29%和44% 产能向高速高端倾斜 [2] - 国内市场上半年营收20.1亿元 同比增长51.4% 增速高于海外市场 [2] 行业前景 - 2025年海外四大云厂商合计资本开支预计同比增长50%至3338亿美元 2026年投资将进一步扩大 [3] - 美国科技巨头表达投资意愿 Meta计划到2028年投资6000亿美元 苹果6000亿美元 谷歌2500亿美元 微软每年750-800亿美元 [3] - 英伟达GPU和自研ASIC快速迭代 每代芯片带宽保持翻倍提升 带动光模块需求飙升 [3] 竞争优势 - 面向Scaleout和Scaleup场景的光模块定制化难度增加 需要特殊技术能力如环形器BiDi [4] - 在光芯片供给紧张环境下 公司能完全满足头部厂商大客户需求 [4] - 公司在苏州 铜陵 泰国保持多地高标准低成本交付能力 [4] - 硅光龙头地位凸显 在1.6T 3.2T 8通道光模块中成本优势明显 [4] 业绩预期 - 预计2025-2027年归母净利润分别为93.7亿元 181.1亿元 248.9亿元 [5] - 9月16日收盘价对应PE分别为48.8倍 25.2倍 18.4倍 [5]
今晚GPT5?
小熊跑的快· 2025-08-07 17:02
OpenAI直播预告 - OpenAI将于今晚凌晨一点进行直播活动[1] - 直播内容可能涉及RL强化学习技术的最新进展[1] - 行业预期直播将展示强化学习方向的突破性成果[1] 技术发展方向 - 强化学习技术有望实现极致性能突破[1] - 技术突破将推动推理算力需求增长[1] - 推理应用领域可能迎来重大发展机遇[1] 产业链影响 - 推理算力需求增长将利好ASIC芯片市场[1] - 各类推理芯片厂商将迎来发展机会[1] - 行业已为推理芯片需求增长做好准备[1]
对话PPIO姚欣:AI大模型赛道加速内卷,但合理盈利路径仍需探索
钛媒体APP· 2025-08-05 10:23
公司业务与定位 - PPIO是一家独立分布式云计算服务商 专注于边缘云计算和AI云计算服务 在中国独立边缘云计算服务商中排名第一 市场份额为4.1% [4][14] - 公司运营中国最大的算力网络 按计算节点数计 在中国边缘云计算服务提供商中排名第七 [4] - PPIO在IaaS PaaS MaaS三层都具备相应技术能力 为国内外领先科技公司提供服务 包括中国前十大互联网公司的大部分 [14] - 公司正式发布国内首个Agentic AI基础设施服务平台 包括兼容E2B接口的Agent沙箱和模型服务 支持百款主流开源与定制AI模型的快速接入 [5] 技术优势与创新 - 对DeepSeek-R1模型进行优化 采用PD分离等创新分布式计算技术 使吞吐量提高10倍以上 理论运营成本降低高达90% [4] - 通过算子融合 低精度量化及投机采样等技术 将模型输出效率提高7倍以上 理论运营成本降低85.7% [4] - 具备很强的调度能力 融合能力 模型优化 底层算子等技术能力 能提升GPU资源利用率 [14] - 研发国内首款兼容E2B接口的Agent沙箱 专为Agent执行任务设计 在云端环境运行 [5] 市场表现与增长 - AI云计算服务增长迅速 日均token消耗量从2024年12月的271亿次增至2025年6月的2000亿次 在中国独立AI云计算服务供应商中位列前两名 [5] - 公司于2025年6月正式向港交所提交上市招股书 启动IPO上市之路 [5] 行业观点与趋势 - AI Infra基础设施领域是非常低毛利 海量规模 长周期的市场 类比水电气煤等公共基础设施 [6][17] - 未来AI算力需求将从训练转向推理 从中心化架构转向分布式架构 推理计算卡将百花齐放 [7][18] - 推理算力占比将达到95% 训练只占5% 大量数据中心需要分布式以及海量的推理优化 [22] - 开源模型对于AI行业发展更有利 能让AI Infra公司有更多发展机遇 [6][10] 算力架构发展 - 中国AI算力底层做算力网络 东数西算 在算力调度和整合方面具有优势 类似高铁网和电力调度网 [22] - 美国算力底层在做星际之门 堆20万张卡 但面临散热 能耗 电网冲击等挑战 [22] - 训推一定会分离 训练集群和推理集群将是两个集群 目前训推一体是为了训练削峰填谷 [22] 应用场景拓展 - 边缘云和AI推理云业务将融合 满足云边端不同需求 特别是机器人 自动驾驶等对低时延有要求的场景 [25][26] - 机器人 自动驾驶的实时计算需要毫秒级处理速度 只能使用本地化算力 [24] - 复杂任务如任务拆解 推理 形成代码等需要至少30B参数规模 且Agent会运行在云端 [25] 硬件与软件协同 - 国产算力卡在推理时代迎来发展机会 特别是加了PD分离架构之后 [20] - 硬件软件快速迭代 良性结合推动AI时代加速 端到端垂直整合能力越来越重要 [20] - 多卡融合 多卡兼容解决方案成为普遍趋势 以应对AI芯片卡脖子风险 [21]
AI推理算力需求即将爆发,深圳云天励飞加注推理芯片
新浪财经· 2025-07-29 10:53
行业趋势 - AI推理芯片成为人工智能行业新方向 云天励飞宣布全面聚焦该领域 围绕边缘计算 云端大模型推理和具身智能三大场景 [1] - AI正从训练时代迈入推理时代 推理算力需求将迎来爆发式增长 2025年成为人工智能发展重要转折点 大模型技术达到新成熟高度 模型调用成本显著降低 [1] - 三大增量助力推理算力需求加速 包括互联网大厂加速AI与原有业务结合 Agent和深度思考推理结合 多模态加速渗透 [2] - AI将全面重塑各类电子产品 包括智能穿戴设备 家用电器和电动汽车 设备将具备主动工作能力 实现人性化交互和功能跃升 [2] 公司战略与产品 - 云天励飞开发四款AI推理芯片 包括DeepEdge10C DeepEdge10标准版 DeepEdge10Max和DeepEdge200 [3] - DeepEdge10系列芯片面向边缘人工智能 核心定位满足边缘端千亿参数大模型部署需求 支持Transformer BEV CV大模型和LLM大模型等主流模型 [3] - 芯片采用算力积木架构 通过D2D Chiplet技术和C2C Mesh技术 覆盖8T-256T算力需求 实现7B至671B参数量大模型推理 [4] - 架构实现算力纵向拓展 单个封装最多集成8个算力积木 形成128T推理算力的单芯片成果 [4] - 通过C2C Mesh技术实现算力扩展 将多个节点连接形成更大规模算力池 支撑MoE架构大模型推理 [5] 技术突破与适配 - DeepEdge10芯片平台成功适配DeepSeek R1系列模型 QwQ-32B模型及国产鸿蒙操作系统 [5] - DeepSeek R1采用GRPO强化学习策略 专门优化数学推理任务 减少计算资源消耗 实现更低成本 [1] - DeepSeek R1模型价格仅为OpenAI o1模型的几十分之一 具有极高性价比优势 [1] 财务表现 - 云天励飞2024年营收增长81% 今年一季度增速提升至160% [5] - 管理层预计下半年随着AI推理算法迭代 算力需求攀升和应用拓展 将继续保持高速增长态势 [5] 市场前景 - AI推理芯片市场仍处于蓝海阶段 市场规模较数千亿美元训练芯片市场仍较小 [3] - 预计未来三至五年内 AI推理芯片增长速度将大幅超越训练芯片 [3]
云天励飞董事长兼CEO陈宁:推理算力需求将迎来爆发式增长
广州日报· 2025-07-28 20:59
公司战略与产品布局 - 云天励飞展示全自研全国产深界DeepEdge10系列芯片 首创国产工艺下"算力积木"架构实现灵活组建扩展与算力配置 [2] - 公司推出基于DeepEdge 200的深穹X6000加速卡及多款推理一体机 2024年战略全面聚焦AI推理芯片 [2] - 未来围绕边缘计算 云端大模型推理 具身智能三大核心布局打造国产算力加速器 [2] 行业技术发展趋势 - 2025年将成为人工智能发展重要转折点 大模型技术达新成熟高度且调用成本显著降低 [2] - AI从训练时代迈入推理时代 推理算力需求将迎来爆发式增长 [2] - AI将全面重塑电子产品形态与功能 涵盖可穿戴设备 家用电器及电动汽车等领域 [3] 应用场景与算力支撑 - AI推理芯片为底层支撑贯穿端边云 形成全域覆盖算力网络 [3] - 对话式AI得以在各类设备高效运行 推动电子产品从工具向智能伙伴跨越 [3] - 未来电子设备具备主动工作能力 可理解复杂指令并解决实际问题 [3]
算力硬件股反复活跃 景旺电子3天2板创历史新高
快讯· 2025-06-30 13:16
算力硬件股表现 - 算力硬件股反复活跃 PCB方向领涨 景旺电子走出3天2板创历史新高 澳弘电子涨停 源杰科技 中际旭创 生益电子 新易盛等涨幅靠前 [1] 行业驱动因素 - 英伟达瞄准AI基础设施平台商定位 海内外头部厂商持续发力基础设施建设以满足激增的推理算力需求 [1] - ASIC市场空间预期持续上调 算力产业链保持高景气 [1]
推理算力仍具需求爆发潜力,数字经济ETF(560800)近1月新增份额位居可比基金首位
新浪财经· 2025-06-17 11:32
指数表现 - 中证数字经济主题指数(931582)下跌0.69%,成分股涨跌互现,芯联集成(688469)领涨1.52%,江波龙(301308)上涨1.21%,北方华创(002371)上涨1.01%,寒武纪(688256)领跌3.61%,润泽科技(300442)下跌2.42%,海光信息(688041)下跌1.71% [1] - 数字经济ETF(560800)下跌0.54%,最新报价0.74元,盘中换手率0.84%,成交631.05万元 [1] ETF资金动态 - 数字经济ETF近1月份额增长1800.00万份,新增份额位居可比基金1/2 [2] - 近20个交易日合计资金流入1335.41万元 [2] 指数成分与权重 - 中证数字经济主题指数前十大权重股合计占比50.98%,包括东方财富(300059,权重8.12%)、中芯国际(688981,6.58%)、汇川技术(300124,5.49%)、北方华创(002371,4.95%)、海光信息(688041,4.85%)等 [2] - 前十大权重股当日表现分化,北方华创上涨1.01%,东方财富下跌0.32%,中芯国际下跌0.82%,汇川技术下跌0.94% [4] AI产业动态 - 火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 pro、语音播客模型及实时语音模型 [1] - 华龙证券指出AI产业趋势:国产大模型性价比提升、Agent加速落地、推理算力需求爆发潜力,看好计算机行业 [1]
英伟达FY26Q1业绩点评:BLACKWELL进展顺利,指引符合预期
国金证券· 2025-05-29 15:20
报告公司投资评级 - 维持“买入”评级 [4] 报告的核心观点 - 报告研究的具体公司当前AI芯片产品较竞争对手领先,有望受益云厂商资本开支增长和推理算力需求增长 [4] 业绩简评 - 2025年5月29日公司公布FY26Q1(25.1 - 25.4)业绩,营收440.62亿美元,同比+69%,环比+12%,GAAP毛利率60.5%,Non GAAP毛利率71.3%;GAAP净利润187.75亿美元,同比+26%,环比-15%;Non GAAP净利润198.94亿美元,同比+31%,环比-10% [2] - 公司指引FY26Q2营收450亿美元(±2%),已考虑H20禁售80亿美元收入损失,指引FY26Q2 GAAP、Non GAAP毛利率分别为71.8%、72.0%(±0.5%) [2] 经营分析 数据中心业务 - FY26Q1数据中心业务收入391.12亿美元,同比+73%,计算芯片营收341.55亿美元,同比+76%,网络业务收入49.57亿美元,同比+56%,主要动能来自推理算力需求增长和Blackwell放量 [2] - 推理端算力需求持续增长,微软Q1处理超100万亿个token,已部署数万个Blackwell GPU,预计爬坡至数十万个,GB300本月初向客户提供样品 [2] H20影响 - 公司预计H20全年造成150亿美元影响,其中Q1计提库存减值损失45亿,Q1无法发货收入减少25亿,Q2无法发货收入减少80亿 [3] 游戏业务 - FY26Q1游戏业务收入37.63亿美元,同比+42%,因部分客户在数据中心显卡供应有限时转向购买RTX5090、RTX6000系列显卡拉动 [3] 其他业务 - FY26Q1专业图像业务、汽车业务、OEM业务营收分别为5.09、5.67、1.11亿美元,同比+19%、+72%、+42% [3] 盈利预测、估值与评级 - 预计公司FY26 - FY28年GAAP净利润分别为1082.08、1353.40、1527.62亿美元,同比+48.5%、+25.1%、+12.9% [4] 公司基本情况 |项目|FY24|FY25|FY26E|FY27E|FY28E| |----|----|----|----|----|----| |营业收入(百万元)|/|60,922 130,497|195,320|249,578|282,771| |增长率(%)|125.9%|114.2%|49.7%|27.8%|13.3%| |EBITDA|34,717|84,351|127,043|156,373|173,664| |归母净利润|29,760|72,880|108,208|135,340|152,762| |增长率(%)|581.3%|144.9%|48.5%|25.1%|12.9%| |每股收益 - 期末股本摊薄|12.08|2.98|4.42|5.53|6.25| |每股净资产|17.44|3.24|7.60|13.05|19.22| |市盈率(P/E)|50.53|47.90|30.47|24.36|21.58| |市净率(P/B)|34.99|44.01|17.73|10.33|7.01|[9] 利润表预测摘要 |项目/报告期|FY2023A|FY2024A|FY2025A|FY2026E|FY2027E|FY2028E| |----|----|----|----|----|----|----| |营业收入|26,974|60,922|130,497|195,320|249,578|282,771| |营业成本|11,618|16,621|32,639|48,830|67,386|79,176| |毛利|15,356|44,301|97,858|146,490|182,192|203,595| |其他收入|0|0|0|0|0|0| |销售费用|2,440|2,654|3,491|5,078|6,489|7,352| |管理费用|0|0|0|0|0|0| |研发费用|7,339|8,675|12,914|17,579|22,462|25,449| |营业利润|5,577|32,972|81,453|123,833|153,241|170,794| |利息收入|267|866|1,786|172|1,832|4,289| |利息支出|262|257|247|214|259|342| |权益性投资损益|0|0|0|0|0|0| |其他非经营性损益|-48|237|1,034|586|749|848| |其他损益|-1,353|0|0|0|0|0| |除税前利润|4,181|33,818|84,026|124,377|155,563|175,589| |所得税|-187|4,058|11,146|16,169|20,223|22,827| |净利润(含少数股东损益)|4,368|29,760|72,880|108,208|135,340|152,762| |少数股东损益|0|0|0|0|0|0| |净利润|4,368|29,760|72,880|108,208|135,340|152,762| |优先股利及其他调整项|0|0|0|0|0|0| |归属普通股东净利润|4,368|29,760|72,880|108,208|135,340|152,762|[10] 市场中相关报告评级比率分析 |日期|一周内|一月内|二月内|三月内|六月内| |----|----|----|----|----|----| |买入|0|0|0|0|0| |增持|0|0|0|0|0| |中性|0|0|0|0|0| |减持|0|0|0|0|0| |评分|0.00|0.00|0.00|0.00|0.00|[11]