AI云计算
搜索文档
PPIO姚欣:AI正在进入自主行动与创造时代,智能体需要全新的操作系统|MEET2026
量子位· 2025-12-15 18:33
AI行业趋势:迈向Agentic AI时代 - AI行业正从生成式AI迈向自主执行和创造的Agentic AI时代,这被视为真正的落地元年,正在改变应用形态并重塑AI技术栈的底层逻辑[1] - 未来的AI应用将从回答问题的工具转向能够直接完成任务的助手,行业迫切需要一种新的基础设施——Agent时代的操作系统[2] - 智能体将成为未来AI应用的主力,而Agent Infra将成为下一个AI时代的操作系统,其核心目标是通过新的Runtime体系,实现模型能力、工具能力与执行能力的高度融合[3] 智能体的定义与演进 - 行业正从Generative AI向Agent AI进步,标志性产品如豆包手机能够自动下单、比价比价和执行任务,展示了AI应用像智能体一样自动化完成任务和进行创作[8] - 当前行业内许多人将智能体定位为工作流,但早期的编排工具(如扣子)或具备Deep Research功能的AI工具只是智能体的早期形态,并非完全体[9][10][11] - 真正的完全态智能体需要具备自主分析、自主决策以及自动化完成任务的能力,其核心在于执行与落地环节[11] - 真正的智能体需要从能力堆叠走向系统化结构,它需要全新的架构和形态,不能依赖旧式应用或工作流体系[12][13] 智能体的核心架构与组件 - 根据OpenAI研究员的论文,真正的智能体包含四个核心组件:记忆、规划、工具和行动[14][15] - 在数字生命体类比中,记忆类似于大脑的记忆功能,负责短期和长期记忆;规划更像思考单元,负责深度推理和分析;工具和行动则类似于感知和影响外部世界的五官与手脚[17] - 真正的智能体是一个具备从思考到执行再到分析的综合系统,而不仅仅是执行机器[17] Agent Infra:AI时代的操作系统 - 智能体的基础设施更像操作系统,它是管理异构资源、抽象标准化功能调用的核心中间层,这一角色在PC、移动和云时代都未改变[18][21][22] - Agent Infra本质上是构建AI时代的操作系统,它管理的资源是模型能力、工具调用能力以及任务和执行能力,并完成资源管理、统一调度与抽象,以方便上层应用构建[23] - 在整个Agent Infra体系中,最核心的部分是Runtime,它解决智能体“能否跑起来”的问题,确保其能在各种环境下大规模、通用地适配并稳定运行[24] PPIO的实践与产品 - PPIO是一家AI云计算公司,构建了从底层算力到IaaS、PaaS、MaaS的完整AI云能力,为Agent Infra提供底座支撑[26] - 在算力网络层面,公司整合了大量数据中心闲置算力,在中国拥有4000多个算力节点和1300多个合作伙伴,并在2024年将算力网络部署扩展至全球六大洲三十多个地区和国家[28] - 在GPU推理云平台层面,公司于2023年打造了第一代推理云平台,2024年推出分布式推理引擎,托管近百个开源与社区模型,每天处理接近2000亿Token[28] - 公司发布了首个兼容E2B的Agent沙箱,这是一个专为Agent执行任务设计的云端运行环境,以Runtime为核心整合了模型调用、记忆和数据库能力[28][29] - PPIO Agent沙箱基于Firecracker MicroVM构建,具备强安全隔离、毫秒级极速启动(小于200毫秒)、高并发创建(可同时快速启动数千个实例)三大特性[31] - 该沙箱支持动态调用多种工具,旨在为Agent赋予安全可靠、高效敏捷的“手和脚”,并通过安全隔离环境帮助降低错误率,自上线以来月度活跃数持续增长[29][31][32]
一则消息,全线爆发!
格隆汇APP· 2025-12-09 18:54
核心观点 - 英伟达H200芯片获准供应中国被视为对中国AI产业的重大利好,将直接缓解高端算力缺口、收窄技术代差并优化成本,有望推动产业链基本面实现量价齐升 [1][4] - 资本市场中,CPO(共封装光学)和AI云计算产业(包括自建算力与算力租赁)是直接受益的核心板块,相关公司已展现出强劲的业绩增长 [11][14] - 机构与被动资金持续加大对AI算力产业链的战略性配置,资金流向基于长期产业趋势,行业高景气度得到业绩验证 [18][19][22] 行业影响与产业逻辑 - 中国AI算力需求井喷:截至2025年上半年,国内已备案的生成式AI大模型数量达439款,较2024年同期的197款几乎翻倍 [5] - 算力缺口与成本高昂:头部互联网公司因算力不足和调度低效导致的年研发延误损失估计达50-80亿元人民币 [6] - H200芯片性能显著提升:相比此前对华销售的“阉割版”H20芯片,H200的FP8算力预计可达H20的2倍以上,内存带宽提升超50% [6] - 缓解三大产业瓶颈: 1. **填补算力缺口**:中国头部云厂商的高端AI芯片储备普遍不足英伟达全球供应的10%,H200有望短期内将大模型训练效率提升30%以上 [7] 2. **收窄技术代差**:H200的引入可为国产AI芯片(如昇腾910B)在生态适配性上追赶CUDA体系赢得时间窗口 [8][9] 3. **优化成本**:H200获准供应有望降低AI算力成本约40%,并使云厂商能推出单价可比普通计算实例高300%的“弹性高保真集群”等高溢价服务 [10] 直接受益板块分析 - **CPO(共封装光学)产业**: - 核心逻辑:H200的3.2Tb/s NVLink带宽要求CPO方案降低功耗50%以上 [12] - 市场规模:2025年全球CPO市场规模预计将突破22亿美元,中国企业在光引擎、光纤连接器等环节占比超30% [11] - 业绩弹性:若H200在华年出货量达10万张(占全球预估15%),将带动国内CPO企业年营收增长20%-30% [13] - 代表公司业绩(2025年第三季度): - 中际旭创:营收102.16亿元,同比增长56.83%;归母净利润31.37亿元,同比增长124.98%;毛利率43% [16] - 新易盛:营收60.68亿元,同比增长152.53%;归母净利润23.85亿元,同比增长205.38%;毛利率46.94% [16] - 天孚通信:营收14.63亿元,同比增长74.37%;归母净利润5.66亿元,同比增长75.68%;毛利率53.68% [16] - **AI云计算产业**: - 直接采购方:阿里云、腾讯云、百度智能云等大厂,其规划的年新增AI服务器集群在50万台以上,英伟达方案占比或从2024年的35%回升至60%以上 [14] - 成本与收益:H200批量部署后,头部云厂商单机柜年收益可提升18万元 [15] - 推动应用需求:更稳定的算力供给有望使主要科技公司的大模型API调用量继续保持每年翻倍的增长速度 [15] - 代表公司业绩(最新季度): - 阿里云智能:营收同比增长34%至398.24亿元,AI相关产品收入连续9个季度保持三位数同比增长,云业务经调整EBITA同比增长35%至36.04亿元 [17] - 腾讯金融科技及企业服务:营收581.7亿元,同比增长10%,其中企业服务收入保持双位数增长 [17] - 金山办公“WPS 365”业务:收入同比大幅增长76.61% [17] 资金动向与市场表现 - **机构资金配置**: - 截至2025年第三季度末,主动偏股型公募基金对计算机(含云计算/AI)、通信(含CPO/光通信)、电子三大行业的合计持仓占比达到约40%,为近五年峰值 [19] - 2025年第三季度,AI算力为核心的TMT板块成为公募增仓幅度最大的方向 [20] - 具体持仓: - CPO龙头中际旭创出现在超500只主动权益类基金的前十大重仓股名单中 [20] - 北向资金在第三季度对中际旭创加仓比例达332.1%(外资持股比例4.52%),对新易盛加仓比例达123.42%(外资持股比例3.61%) [20] - **ETF资金流入**: - 人工智能ETF(159819):年内涨幅67.58%,年内资金流入额超68亿元,最新规模235.77亿元,为市场中唯一规模超200亿的AI赛道ETF [2][23] - 云计算ETF(516510):年内涨幅51.41%,年内资金净流入超3亿元,最新规模19.74亿元 [2][26] - **投资逻辑延伸**: - 机构测算显示,H200放开供应可使龙头CPO公司2026年的利润增速提升5-10个百分点 [21] - 资金布局从算力基建向AI应用层扩散,关注在金融、办公、工业等场景率先落地的公司 [22]
毕盛投资王康宁最新发声
中国基金报· 2025-08-12 17:39
核心观点 - 全球AI发展重心从硬件转向软件应用,中国凭借低成本、开源友好的AI服务及庞大用户基数、丰富应用场景、工程师红利和数据资源,在全球AI标准制定中具备优势[1][4] - 中国资产风险溢价具备吸引力,尤其看好港股的结构性机会,重点关注AI应用端、互联网平台、创新药和医疗器械、品牌消费龙头、高壁垒电气设备、周期性子行业龙头及泛金融[1][7][8] - 采用"四类阿尔法"(成长型、价值型、周期型、机会型)和"四顶帽子"(财务评估、企业家视角、合规验证、内部模型)的投研框架,当前组合中成长型阿尔法占比最高[2][3] 四类阿尔法投研框架 - **成长型阿尔法**:关注行业壁垒、管理层能力及行业空间,科技公司研发能力是关键,AI领域聚焦中游云计算平台和下游垂直应用[3][4] - **价值型阿尔法**:与高分红股票重合度高,如寿险、公用事业、传统制造业,需综合基本面评估而非仅看分红率,部分寿险企业估值低于内涵价值[5] - **周期型阿尔法**:看好设备制造业龙头,行业供需周期长,2023年触底后进入上升阶段,需求来自全球产能重新布局[5] - **机会型阿尔法**:未明确提及具体行业,但框架包含灵活切换四类阿尔法以分散风险[3][5] 重点行业与公司机会 - **AI与科技**:中国AI应用端优势显著,商业模式或类似"卖方研报嵌入经纪服务",大模型无壁垒但垂直应用领域有潜力[1][4] - **互联网平台**:广告业务与经济企稳强相关,预计复苏中受益显著[8] - **创新药与医疗器械**:部分公司此前市值接近账面现金,研发管线被低估,情绪修复后进入合理估值区间[8] - **品牌消费**:啤酒、体育服饰、白电龙头存在过度折价,经济复苏后有望通过品牌影响力夺回市场份额[7][8] - **泛金融**:寿险和零售端银行被低估,吸储能力在低利率环境下的增值服务潜力未充分定价[8] - **军工**:长期看是科技升级的重要抓手[9] 市场展望 - A股处于底部构建阶段,港股已进入稳定复苏,更看好港股结构性机会[7] - 消费领域受宏观压力和房价抑制,但随家庭资产负债表修复,品牌消费龙头将受益[7][8] - 国际资本重新审核全球布局,中国政策环境积极,市场活跃度提升[7]
CoreWeave抢先获得首批英伟达GB300服务器
硬AI· 2025-07-04 22:50
核心观点 - CoreWeave获得市场首个基于英伟达最新高端芯片GB300 NVL72的AI服务器系统,该系统由戴尔科技制造,首批将在美国组装和部署 [1][2] - 新系统将帮助客户更快开发和部署更大、更复杂的AI模型,推动AI发展的边界 [2] - 消息公布后,CoreWeave股价上涨近9% [1][2] 行业动态 - 云计算巨头竞相布局AI基础设施,CoreWeave作为AI云计算服务商,在为需要强大英伟达芯片的企业提供云计算能力租赁服务方面占据重要地位 [3][4] - 戴尔通过向xAI等公司销售AI服务器重振业务,反映科技行业对AI基础设施需求的持续增长 [4] 技术升级 - GB300 NVL72服务器机架代表英伟达最新一代AI芯片技术,是对当前顶级Grace Blackwell系统的升级 [2] - 新芯片于今年3月发布,预计本季度上市 [2] 客户与市场 - CoreWeave的客户包括OpenAI等知名AI公司,此次率先获得新系统部署突显其市场地位 [4] - 尽管AI基础设施需求强劲,但新芯片推出时芯片贸易政策和全球经济环境仍存在不确定性 [4][5]