Workflow
推理算力
icon
搜索文档
今晚GPT5?
小熊跑的快· 2025-08-07 17:02
OpenAI直播预告 - OpenAI将于今晚凌晨一点进行直播活动[1] - 直播内容可能涉及RL强化学习技术的最新进展[1] - 行业预期直播将展示强化学习方向的突破性成果[1] 技术发展方向 - 强化学习技术有望实现极致性能突破[1] - 技术突破将推动推理算力需求增长[1] - 推理应用领域可能迎来重大发展机遇[1] 产业链影响 - 推理算力需求增长将利好ASIC芯片市场[1] - 各类推理芯片厂商将迎来发展机会[1] - 行业已为推理芯片需求增长做好准备[1]
对话PPIO姚欣:AI大模型赛道加速内卷,但合理盈利路径仍需探索
钛媒体APP· 2025-08-05 10:23
公司业务与定位 - PPIO是一家独立分布式云计算服务商 专注于边缘云计算和AI云计算服务 在中国独立边缘云计算服务商中排名第一 市场份额为4.1% [4][14] - 公司运营中国最大的算力网络 按计算节点数计 在中国边缘云计算服务提供商中排名第七 [4] - PPIO在IaaS PaaS MaaS三层都具备相应技术能力 为国内外领先科技公司提供服务 包括中国前十大互联网公司的大部分 [14] - 公司正式发布国内首个Agentic AI基础设施服务平台 包括兼容E2B接口的Agent沙箱和模型服务 支持百款主流开源与定制AI模型的快速接入 [5] 技术优势与创新 - 对DeepSeek-R1模型进行优化 采用PD分离等创新分布式计算技术 使吞吐量提高10倍以上 理论运营成本降低高达90% [4] - 通过算子融合 低精度量化及投机采样等技术 将模型输出效率提高7倍以上 理论运营成本降低85.7% [4] - 具备很强的调度能力 融合能力 模型优化 底层算子等技术能力 能提升GPU资源利用率 [14] - 研发国内首款兼容E2B接口的Agent沙箱 专为Agent执行任务设计 在云端环境运行 [5] 市场表现与增长 - AI云计算服务增长迅速 日均token消耗量从2024年12月的271亿次增至2025年6月的2000亿次 在中国独立AI云计算服务供应商中位列前两名 [5] - 公司于2025年6月正式向港交所提交上市招股书 启动IPO上市之路 [5] 行业观点与趋势 - AI Infra基础设施领域是非常低毛利 海量规模 长周期的市场 类比水电气煤等公共基础设施 [6][17] - 未来AI算力需求将从训练转向推理 从中心化架构转向分布式架构 推理计算卡将百花齐放 [7][18] - 推理算力占比将达到95% 训练只占5% 大量数据中心需要分布式以及海量的推理优化 [22] - 开源模型对于AI行业发展更有利 能让AI Infra公司有更多发展机遇 [6][10] 算力架构发展 - 中国AI算力底层做算力网络 东数西算 在算力调度和整合方面具有优势 类似高铁网和电力调度网 [22] - 美国算力底层在做星际之门 堆20万张卡 但面临散热 能耗 电网冲击等挑战 [22] - 训推一定会分离 训练集群和推理集群将是两个集群 目前训推一体是为了训练削峰填谷 [22] 应用场景拓展 - 边缘云和AI推理云业务将融合 满足云边端不同需求 特别是机器人 自动驾驶等对低时延有要求的场景 [25][26] - 机器人 自动驾驶的实时计算需要毫秒级处理速度 只能使用本地化算力 [24] - 复杂任务如任务拆解 推理 形成代码等需要至少30B参数规模 且Agent会运行在云端 [25] 硬件与软件协同 - 国产算力卡在推理时代迎来发展机会 特别是加了PD分离架构之后 [20] - 硬件软件快速迭代 良性结合推动AI时代加速 端到端垂直整合能力越来越重要 [20] - 多卡融合 多卡兼容解决方案成为普遍趋势 以应对AI芯片卡脖子风险 [21]
AI推理算力需求即将爆发,深圳云天励飞加注推理芯片
新浪财经· 2025-07-29 10:53
行业趋势 - AI推理芯片成为人工智能行业新方向 云天励飞宣布全面聚焦该领域 围绕边缘计算 云端大模型推理和具身智能三大场景 [1] - AI正从训练时代迈入推理时代 推理算力需求将迎来爆发式增长 2025年成为人工智能发展重要转折点 大模型技术达到新成熟高度 模型调用成本显著降低 [1] - 三大增量助力推理算力需求加速 包括互联网大厂加速AI与原有业务结合 Agent和深度思考推理结合 多模态加速渗透 [2] - AI将全面重塑各类电子产品 包括智能穿戴设备 家用电器和电动汽车 设备将具备主动工作能力 实现人性化交互和功能跃升 [2] 公司战略与产品 - 云天励飞开发四款AI推理芯片 包括DeepEdge10C DeepEdge10标准版 DeepEdge10Max和DeepEdge200 [3] - DeepEdge10系列芯片面向边缘人工智能 核心定位满足边缘端千亿参数大模型部署需求 支持Transformer BEV CV大模型和LLM大模型等主流模型 [3] - 芯片采用算力积木架构 通过D2D Chiplet技术和C2C Mesh技术 覆盖8T-256T算力需求 实现7B至671B参数量大模型推理 [4] - 架构实现算力纵向拓展 单个封装最多集成8个算力积木 形成128T推理算力的单芯片成果 [4] - 通过C2C Mesh技术实现算力扩展 将多个节点连接形成更大规模算力池 支撑MoE架构大模型推理 [5] 技术突破与适配 - DeepEdge10芯片平台成功适配DeepSeek R1系列模型 QwQ-32B模型及国产鸿蒙操作系统 [5] - DeepSeek R1采用GRPO强化学习策略 专门优化数学推理任务 减少计算资源消耗 实现更低成本 [1] - DeepSeek R1模型价格仅为OpenAI o1模型的几十分之一 具有极高性价比优势 [1] 财务表现 - 云天励飞2024年营收增长81% 今年一季度增速提升至160% [5] - 管理层预计下半年随着AI推理算法迭代 算力需求攀升和应用拓展 将继续保持高速增长态势 [5] 市场前景 - AI推理芯片市场仍处于蓝海阶段 市场规模较数千亿美元训练芯片市场仍较小 [3] - 预计未来三至五年内 AI推理芯片增长速度将大幅超越训练芯片 [3]
云天励飞董事长兼CEO陈宁:推理算力需求将迎来爆发式增长
广州日报· 2025-07-28 20:59
公司战略与产品布局 - 云天励飞展示全自研全国产深界DeepEdge10系列芯片 首创国产工艺下"算力积木"架构实现灵活组建扩展与算力配置 [2] - 公司推出基于DeepEdge 200的深穹X6000加速卡及多款推理一体机 2024年战略全面聚焦AI推理芯片 [2] - 未来围绕边缘计算 云端大模型推理 具身智能三大核心布局打造国产算力加速器 [2] 行业技术发展趋势 - 2025年将成为人工智能发展重要转折点 大模型技术达新成熟高度且调用成本显著降低 [2] - AI从训练时代迈入推理时代 推理算力需求将迎来爆发式增长 [2] - AI将全面重塑电子产品形态与功能 涵盖可穿戴设备 家用电器及电动汽车等领域 [3] 应用场景与算力支撑 - AI推理芯片为底层支撑贯穿端边云 形成全域覆盖算力网络 [3] - 对话式AI得以在各类设备高效运行 推动电子产品从工具向智能伙伴跨越 [3] - 未来电子设备具备主动工作能力 可理解复杂指令并解决实际问题 [3]
算力硬件股反复活跃 景旺电子3天2板创历史新高
快讯· 2025-06-30 13:16
算力硬件股表现 - 算力硬件股反复活跃 PCB方向领涨 景旺电子走出3天2板创历史新高 澳弘电子涨停 源杰科技 中际旭创 生益电子 新易盛等涨幅靠前 [1] 行业驱动因素 - 英伟达瞄准AI基础设施平台商定位 海内外头部厂商持续发力基础设施建设以满足激增的推理算力需求 [1] - ASIC市场空间预期持续上调 算力产业链保持高景气 [1]
推理算力仍具需求爆发潜力,数字经济ETF(560800)近1月新增份额位居可比基金首位
新浪财经· 2025-06-17 11:32
指数表现 - 中证数字经济主题指数(931582)下跌0.69%,成分股涨跌互现,芯联集成(688469)领涨1.52%,江波龙(301308)上涨1.21%,北方华创(002371)上涨1.01%,寒武纪(688256)领跌3.61%,润泽科技(300442)下跌2.42%,海光信息(688041)下跌1.71% [1] - 数字经济ETF(560800)下跌0.54%,最新报价0.74元,盘中换手率0.84%,成交631.05万元 [1] ETF资金动态 - 数字经济ETF近1月份额增长1800.00万份,新增份额位居可比基金1/2 [2] - 近20个交易日合计资金流入1335.41万元 [2] 指数成分与权重 - 中证数字经济主题指数前十大权重股合计占比50.98%,包括东方财富(300059,权重8.12%)、中芯国际(688981,6.58%)、汇川技术(300124,5.49%)、北方华创(002371,4.95%)、海光信息(688041,4.85%)等 [2] - 前十大权重股当日表现分化,北方华创上涨1.01%,东方财富下跌0.32%,中芯国际下跌0.82%,汇川技术下跌0.94% [4] AI产业动态 - 火山引擎发布豆包大模型1.6、视频生成模型Seedance 1.0 pro、语音播客模型及实时语音模型 [1] - 华龙证券指出AI产业趋势:国产大模型性价比提升、Agent加速落地、推理算力需求爆发潜力,看好计算机行业 [1]
英伟达FY26Q1业绩点评:BLACKWELL进展顺利,指引符合预期
国金证券· 2025-05-29 15:20
报告公司投资评级 - 维持“买入”评级 [4] 报告的核心观点 - 报告研究的具体公司当前AI芯片产品较竞争对手领先,有望受益云厂商资本开支增长和推理算力需求增长 [4] 业绩简评 - 2025年5月29日公司公布FY26Q1(25.1 - 25.4)业绩,营收440.62亿美元,同比+69%,环比+12%,GAAP毛利率60.5%,Non GAAP毛利率71.3%;GAAP净利润187.75亿美元,同比+26%,环比-15%;Non GAAP净利润198.94亿美元,同比+31%,环比-10% [2] - 公司指引FY26Q2营收450亿美元(±2%),已考虑H20禁售80亿美元收入损失,指引FY26Q2 GAAP、Non GAAP毛利率分别为71.8%、72.0%(±0.5%) [2] 经营分析 数据中心业务 - FY26Q1数据中心业务收入391.12亿美元,同比+73%,计算芯片营收341.55亿美元,同比+76%,网络业务收入49.57亿美元,同比+56%,主要动能来自推理算力需求增长和Blackwell放量 [2] - 推理端算力需求持续增长,微软Q1处理超100万亿个token,已部署数万个Blackwell GPU,预计爬坡至数十万个,GB300本月初向客户提供样品 [2] H20影响 - 公司预计H20全年造成150亿美元影响,其中Q1计提库存减值损失45亿,Q1无法发货收入减少25亿,Q2无法发货收入减少80亿 [3] 游戏业务 - FY26Q1游戏业务收入37.63亿美元,同比+42%,因部分客户在数据中心显卡供应有限时转向购买RTX5090、RTX6000系列显卡拉动 [3] 其他业务 - FY26Q1专业图像业务、汽车业务、OEM业务营收分别为5.09、5.67、1.11亿美元,同比+19%、+72%、+42% [3] 盈利预测、估值与评级 - 预计公司FY26 - FY28年GAAP净利润分别为1082.08、1353.40、1527.62亿美元,同比+48.5%、+25.1%、+12.9% [4] 公司基本情况 |项目|FY24|FY25|FY26E|FY27E|FY28E| |----|----|----|----|----|----| |营业收入(百万元)|/|60,922 130,497|195,320|249,578|282,771| |增长率(%)|125.9%|114.2%|49.7%|27.8%|13.3%| |EBITDA|34,717|84,351|127,043|156,373|173,664| |归母净利润|29,760|72,880|108,208|135,340|152,762| |增长率(%)|581.3%|144.9%|48.5%|25.1%|12.9%| |每股收益 - 期末股本摊薄|12.08|2.98|4.42|5.53|6.25| |每股净资产|17.44|3.24|7.60|13.05|19.22| |市盈率(P/E)|50.53|47.90|30.47|24.36|21.58| |市净率(P/B)|34.99|44.01|17.73|10.33|7.01|[9] 利润表预测摘要 |项目/报告期|FY2023A|FY2024A|FY2025A|FY2026E|FY2027E|FY2028E| |----|----|----|----|----|----|----| |营业收入|26,974|60,922|130,497|195,320|249,578|282,771| |营业成本|11,618|16,621|32,639|48,830|67,386|79,176| |毛利|15,356|44,301|97,858|146,490|182,192|203,595| |其他收入|0|0|0|0|0|0| |销售费用|2,440|2,654|3,491|5,078|6,489|7,352| |管理费用|0|0|0|0|0|0| |研发费用|7,339|8,675|12,914|17,579|22,462|25,449| |营业利润|5,577|32,972|81,453|123,833|153,241|170,794| |利息收入|267|866|1,786|172|1,832|4,289| |利息支出|262|257|247|214|259|342| |权益性投资损益|0|0|0|0|0|0| |其他非经营性损益|-48|237|1,034|586|749|848| |其他损益|-1,353|0|0|0|0|0| |除税前利润|4,181|33,818|84,026|124,377|155,563|175,589| |所得税|-187|4,058|11,146|16,169|20,223|22,827| |净利润(含少数股东损益)|4,368|29,760|72,880|108,208|135,340|152,762| |少数股东损益|0|0|0|0|0|0| |净利润|4,368|29,760|72,880|108,208|135,340|152,762| |优先股利及其他调整项|0|0|0|0|0|0| |归属普通股东净利润|4,368|29,760|72,880|108,208|135,340|152,762|[10] 市场中相关报告评级比率分析 |日期|一周内|一月内|二月内|三月内|六月内| |----|----|----|----|----|----| |买入|0|0|0|0|0| |增持|0|0|0|0|0| |中性|0|0|0|0|0| |减持|0|0|0|0|0| |评分|0.00|0.00|0.00|0.00|0.00|[11]
专家访谈汇总:DeepSeek催生AI耳机概念股
阿尔法工场研究院· 2025-02-27 18:31
DeepSeek推动AI产业变革 - ScalingLaw理论表明AI模型性能与参数量、数据量、计算量成正比,三者同步提升带来显著性能提升[3] - 公司通过优化模型性能和降低成本推动AI在中小企业、医疗、金融等传统行业的应用,刺激算力需求增长[3] - 公司与华为昇腾、海光等国产芯片厂商合作,增强国产算力自主可控性[3] - 通过蒸馏技术和算法优化降低模型存储需求和计算量,使AI模型能在手机、耳机等智能终端高效推理[3] - 国内多个手机厂商接入公司AI模型,智能穿戴设备成为端侧AI重要应用场景[3] - DeepSeek-R1具备高性能、低成本、开源优势,全球化影响力和用户基础为未来市场增长奠定基础[3] 大语言模型辅助投研 - 自动化编程插件支持VSCode多模式编程、文件操作、命令行集成及多模型API调用,可自动读取文件、安装依赖、运行代码并修复错误[4] - 大语言模型将投资决策主观因素转化为可量化变量,提升量化分析效率[4] - 模型可从分析师报告提取市场趋势、产业链信息及财务数据,为量化模型提供输入[5] - 通过情感分析技术从新闻、社交媒体等文本提取情绪和观点,优化对市场动向的理解[5] - 智能体如ChatGPTTask可自动执行定期获取信息、浏览网页等重复性任务,释放投研人员时间[5] - 知识库构建支持从历史数据快速提取信息,通过直接提问获取答案[5] - 大模型API服务如OpenRouter、火山引擎等为机构提供低运维成本方案,Ollama工具简化本地部署并保障数据隐私[5] AI陪伴与语音交互技术 - 豆包实时语音大模型在拟人度、情商、通话稳定性等维度评测得分4.36(满分5分),优于GPT-4o的3.18分[6] - 仅2%用户反馈豆包语音过于AI化,而GPT-4o该比例超30%[6] - 模型在情绪理解和情感表达的优势成为吸引用户、扩大市场份额的关键[6] - 语音交互技术或应用于智能助手、客服、教育、医疗等行业,可能引领相关领域技术标准[6] - 与Google、亚马逊等相比,豆包更注重情感化和拟人化体验,形成差异化竞争[6] 人形机器人与热管理技术 - 三花智控在家电领域关键产品如四通换向阀、电子膨胀阀全球市场份额达59%、58%[7] - 特斯拉计划2025年量产数千台人形机器人,2026年扩至5-10万台,2027年达50-100万台[7] - 机器人执行器总成价值初期10-20万元,量产后可降至5万元,利润空间随规模扩大[7] - 2025年汽车零部件业务预计恢复20%增长,中国新兴车企(理想、华为、小米等)销量提供支撑[7] - 2024年家电业务受益政策推动(国补、以旧换新),预计增长5-10%,贡献15亿元利润[7] - 2024-2026年归母净利润预计31.6亿、38.1亿、46.2亿元,增速分别为+8%、+21%、+21%[7] 推理算力市场与政策支持 - 政府强调自主创新,国资委发布"AI+"专项行动,政策红利持续释放[7] - AI和国产化龙头公司仍是未来配置主线,阿里计划三年AI基础设施投入超过去十年总和[7] - 推理算力需求因大模型应用扩展短期快速增长,成为算力行业重要驱动力[8]