Workflow
Kubernetes
icon
搜索文档
2025年算力调度平台行业:优化计算资源,支撑AI应用
头豹研究院· 2025-08-22 20:29
2025年算力调度平台行业 优化计算资源,支撑AI应用 ◼ 研究背景 随着人工智能技术的迅猛发展,全球 范围内对算力的需求呈现指数级增长, 因此需要算力调度来实现跨地域、跨 平台的算力资源整合与优化调度。 ◼ 研究目标 概览标签:算力、算力调度 Computing Power Scheduling Platform Industry 計算力スケジューリングプラットフォーム業界 报告提供的任何内容(包括但不限于数据、文本、图表、图像等)均系头豹研究院独有的高度机密性文件(在报告中另 行标明出处者除外)。 ,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改 编、汇编本报告内容,若有违反上述约定的行为发生,头豹研究院保留采取法律措施、追究相关人员责任的权利。头豹 研究院开展的所有商业活动均使用"头豹研究院"或"头豹"的商号、商标,头豹研究院无任何前述名称之外的其他分支机构 ,也未授权或聘用其他任何第三方代表头豹研究院开展商业活动。 头豹研究院 1 01 异构算力调度面临的挑战: ◆ 异构算力调度面临多重核心挑战:资源异 构性与软件环境碎片化显著增加调度复杂 性;跨架构任务迁移成本高导致效率低下; 缺乏统一调 ...
谷歌将 A2A 捐赠给 Linux 基金会,但代码实现还得靠开发者自己?!
AI前线· 2025-06-24 14:47
A2A项目成立 - Linux基金会联合AWS、思科、谷歌、微软等科技巨头成立A2A项目,旨在通过开源协议解决AI智能体间的通信孤岛问题[1] - 谷歌捐赠A2A协议规范及SDK作为初始内容,该协议支持跨厂商智能体互操作,已有超100家企业支持[1] - 项目采用Linux基金会中立治理模式,确保厂商中立性和社区驱动特性[1] 谷歌技术捐赠历史 - 谷歌曾将Kubernetes捐赠给CNCF并后续提供900万美元云资源支持其生态发展[2] - 本次A2A捐赠与Kubernetes不同,仅提供标准而非完整解决方案,开发者需自行实现逻辑[2] A2A与MCP协议对比 - MCP聚焦大模型与外部工具集成,解决M个模型与N个工具的组合爆炸问题,服务器数量从2月500台增至4000台[3][4][6] - A2A定位更高层级,实现智能体间安全通信与任务协商,采用HTTP协议和"代理卡"JSON描述机制[6] - 开发者认为A2A可能通过索引机制重构代理生态,但存在算法控制权引发的开放性争议[7] 协议应用场景差异 - MCP已适配Cursor、Claude等客户端但集成复杂,Claude桌面端四个月未完全支持其功能[11] - A2A基于HTTP协议更易集成,ACP则填补本地优先通信场景,适用于低延迟或离线环境[11][12][16] 行业应用现状 - 仅5%生成式AI项目实现盈利,企业需先明确用例再选择协议而非相反[15][18] - 复杂多智能体工作流需MCP/A2A支持,简单场景可能无需协议[13] - 微软采用NPS衡量AI性能,协议安全性需强化OAuth和RBAC机制[17] 技术发展趋势 - A2A被官方定义为MCP补充,前者连接AI与AI,后者连接AI与工具,共同构成模块化基础[7] - 行业需解决智能体可靠性衡量难题,当前缺乏标准化的SLA和监控机制[17][18]
香港已成为全球云原生开源重要贡献者
新浪财经· 2025-06-11 14:27
中国及香港地区云原生生态发展 - 中国和香港地区已成为全球云原生领域发展最早和最强大的生态系统之一,开源贡献达106.86万次,其中对Kubernetes开源项目贡献32.74万次,均排名全球第二 [1] - 云原生计算基金会(CNCF)生态中有44个成员来自中国和香港地区 [1] - 2024年CNCF新增140名成员,目前拥有超过200个项目和728名成员,贡献者超过27万名,覆盖189个国家 [4] 云原生技术应用与突破 - 中国企业在云原生领域贡献了多个具有全球影响力的项目,如Volcano、Dragonfly、KubeEdge、OpenYurt,展现了在边缘计算、容器调度、分布式处理等方面的能力 [2] - 阿里、华为等公司在Kubernetes分布式共识机制上取得突破,使节点扩展能力从最初的5000个提升至三至四倍 [5] - 科大讯飞利用Volcano将GPU利用率提升40%以上,故障恢复时间缩短70% [6] 香港地区云原生发展现状 - 香港凭借国际金融中心和亚洲科技枢纽优势,在云原生领域展现出强劲增长潜力 [5] - 金融机构是香港云计算技术核心采用者,如香港交易所的FINI平台和HKEX Synapse平台采用云端技术提升效率 [5] - 香港政府将云计算和云原生视为智慧城市发展的关键技术,推动其在电子政务、智慧交通、医疗保健等领域的应用 [8] 人工智能与云原生结合 - 云原生技术的资源弹性、开发敏捷性、数据融合效率等优势有望为AI产业带来系统性革新 [6] - 容器化工作负载是未来十年方向,特别是AI领域,因AI工作负载高度依赖GPU [7] - CNCF计划在未来6-12个月内获取更多案例研究,展示如何利用其项目解决AI挑战 [7] 基础设施与政策支持 - 香港拥有世界级海底光缆系统,网络延迟低,是服务亚太及全球用户的理想节点 [6] - 华为云在香港发布CloudPond和AI加速计划,其KooVerse覆盖30个地理区域88个可用区,香港region是本地唯一4AZ数据中心 [6] - 香港推出首个人工智能大模型HKGAI V1,计划下半年推出"港话通"大语言模型,支持粤语、英语、普通话 [8]
行业简报:算力调度平台规模化发展-Deepseek带动算力需求井喷,算力调度平台成最优解
头豹研究院· 2025-06-06 20:33
报告行业投资评级 未提及 报告的核心观点 在AI大模型驱动下,中国智能算力需求与供给同步高速攀升,具备高效资源整合与调度能力的平台,将具备突出的规模化发展价值;算力调度中心的盈利高度依赖政府补贴,企业需战略性早期介入并契合政府多维核心价值;平台需具备高效整合和调度各地异构算力的技术能力;算力平台规模化价值变现的核心在于庞大且多元的客户基础,结合高效的生态合作与增值服务策略 [10]。 根据相关目录分别进行总结 算力需求增长迅速 - 中国智能算力需求与供给同步高速攀升,超大规模、高性能算力中心加速布局,带动整体算力基础设施快速扩容,具备高效资源整合与调度能力的平台有突出规模化发展价值 [10][11] - 智能算力需求在大模型应用领域激增,大模型需求占比接近60%,反映AI技术快速发展和未来算力市场巨大潜力 [14] - 互联网巨头和超大规模云服务提供商持续扩展算力中心,预计至2028年,中国智能算力整体需求将超20,000MW [16] 算力调度平台的价值 - 算力调度平台通过统一架构智能整合异构资源,核心价值在于提升利用率、降低使用门槛、简化算力获取流程,实现高效便捷的服务供给 [20] - 解决资源“碎片化”与“利用率低”痛点,汇聚碎片化、异构算力,通过智能调度提升整体资源利用率与可及性 [19] - 降低用户“成本”并提升“灵活性”,提供弹性、按需、高性价比的算力使用模式,显著降低用户成本和获取门槛 [19] - 简化算力“获取与管理复杂度”,统一管理并智能匹配算力与任务需求,简化用户操作,优化资源分配效率 [19] 政府补贴是核心来源 - 政府补贴是驱动算力调度中心商业模式及盈利的关键,政府核心诉求是确保本地已建算力资源充分利用,并通过结构化补贴机制激励用户、降低平台风险 [30] - 企业要成功赢得政府订单,需战略性早期介入以影响决策,精准把握、满足政府在经济、社会效益及政绩等多维度的核心价值诉求 [30] 优质算力调度平台技术特征 - 平台需具备精细化资源切片、异构算力兼容、跨地区调度、实时监控与动态调度等能力,实现算力资源的高效复用和低成本变现 [38] - 细粒度切片,将整块算力资源精准拆分为小单元,满足不同客户多样化需求,实现闲置资源充分复用 [33][38] - 异构算力兼容能力,具备兼容性,通过资源虚拟化技术统一调度不同芯片架构,确保用户体验不受硬件差异影响 [36][38] - 跨地区调度能力,整合各地区算力资源,实现资源跨区域调度,降低单一地区资源不足或故障的风险 [34][38] - 实时监控与动态调度能力,建立完善监控系统,实时跟踪客户算力使用状态,动态调整和打包复用闲置算力,提升资源利用率和收入 [37][38] - 潮汐调度能力,根据客户需求波动和使用高峰低谷,合理安排任务分配,实现资源高效变现 [35][38] 算力调度中心规模化的核心 - 算力平台需依托庞大且多元的客户基础,并结合高效的生态合作与增值服务策略,实现算力的规模化价值变现 [42] - 足够大的客户规模是快速盈利和达成目标的基础,高价值、需求稳定的大客户是核心目标,促使平台就近部署以优化服务 [42] - 客户群的丰富性允许通过分层定价实现算力溢价,最大化整体收益 [42] - 通过合作生态转型为“批发商”,聚焦高毛利算力销售并由伙伴完成低毛利交付,有效控制风险、提升利润 [42] - 在基础算力之上提供存储、网络等增值服务进行交叉销售,增加收入,提升客户粘性与终身价值 [42]
社交APP开发的技术框架
搜狐财经· 2025-05-28 14:49
社交APP技术架构 前端开发 - 移动端分为iOS和Android原生开发,iOS推荐Swift和SwiftUI框架,Android推荐Kotlin和Jetpack Compose框架,性能最佳但开发成本高 [6] - Web端采用React.js、Vue.js、Angular等框架构建单页应用(SPA),适用于社交APP的Web版本和后台管理系统 [5] - 跨平台开发方案包括React Native(JavaScript)、Flutter(Dart)、uni-app(Vue.js)和Taro(React/Vue),可降低多端开发成本,其中uni-app和Taro特别适合中国市场的小程序生态 [6] 后端开发 - Java(Spring Boot/Cloud)适合大型复杂社交APP,具备高并发处理能力 [9] - Python(Django/Flask)适合快速原型开发,语法简洁但高并发性能较弱 [9] - Node.js(Express/NestJS)适合实时聊天等I/O密集型场景,开发效率高 [9] - Go语言适合高并发核心服务,性能接近C/C++且内存占用低 [9] 数据库与存储 - 关系型数据库MySQL和PostgreSQL适合存储用户数据和好友关系 [9] - 非关系型数据库MongoDB适合动态/评论等非结构化数据,Redis用于缓存和实时计数 [9] - 图数据库Neo4j适合处理复杂社交关系网络 [9] - 对象存储(阿里云OSS/腾讯云COS)和CDN用于静态资源分发 [9] 第三方服务集成 - 即时通讯可选用融云/环信等国内SDK或自建WebSocket/MQTT系统 [9] - 音视频处理采用FFmpeg或云服务商(腾讯云TRTC/阿里云RTC) [9] - 内容审核需集成阿里云/腾讯云的内容安全API [8] 中国市场特殊考量 - 必须完成ICP备案和APP备案等合规要求 [8] - 优先选择阿里云/腾讯云等国内云服务商 [8] - 开发框架推荐支持多端发布的uni-app或Taro [8]
3 No-Brainer Cloud Computing Stocks to Buy Right Now
The Motley Fool· 2025-05-25 17:20
云计算行业概述 - 云计算是通过互联网交付计算服务的模式 采用基础设施即服务(IaaS)模型 客户可灵活调配处理能力和存储资源 无需自行购买和维护服务器[1] - 行业具有高固定成本特性 规模经济显著 达到盈亏平衡后盈利增速远超收入增速[2] - AI技术兴起推动行业加速增长 客户利用云计算服务定制基础AI模型或开发专属应用[3] 主要云服务商分析 亚马逊AWS - 全球最大云服务商 市场份额近30% AWS上季度收入同比增长17%至293亿美元 运营利润增长22%至115亿美元[6] - 通过Bedrock提供第三方AI基础模型定制服务 SageMaker支持用户从零构建模型[7] - 自研Trainium和Inferentia AI芯片 相比通用GPU能效更高 成本优势显著[8] 微软Azure - 市场份额约22% 过去七个季度收入增速均超30% 上季度增长33%[9] - 与OpenAI深度合作 直接集成其领先AI模型 并将技术嵌入GitHub等生态产品[10] - 开始托管xAI模型 聘请DeepMind联合创始人开发自研AI模型 拓展技术路线[11] 谷歌云 - 市场份额约12% 一季度收入增长28%至123亿美元 运营利润暴涨142%至22亿美元[12][13] - Vertex AI提供端到端机器学习平台 BigQuery分析工具和Kubernetes容器技术构成差异化优势[14] - 基于Gemini基础模型开发定制AI解决方案 与Broadcom合作研发专用AI芯片降低成本[15] 行业增长驱动因素 - 企业从本地化解决方案向云端迁移持续进行 AI应用爆发成为新增长引擎[3] - 三大云厂商均通过自研芯片优化AI算力成本 形成技术护城河[8][15] - 云服务商面临数据中心建设节奏把控挑战 需平衡产能扩张与需求匹配[5]
当前时点如何看待云基础资源投资机会
2025-04-30 10:08
纪要涉及的行业和公司 - **行业**:云基础设施、云计算、IDC、数据中心配套建设、通信、液冷、AIGC 基础设施、柴油发电机、燃气轮机、机械 - **公司**:阿里巴巴、腾讯、字节跳动、金山云、奥飞、润泽、光环、英维克、科华数据、胜宏科技、明阳电气、迈米、应流股份、泰豪科技、潍柴重机、科泰、长园 纪要提到的核心观点和论据 1. **云技术资源投资机会大**:2025 年 2 月起国内进入 AI 技术资源大规模投入周期,如阿里巴巴宣布未来三年投 3800 亿人民币;2024 年 Q4 起阿里和腾讯财报显示 K8S 季度显著增长,所以 2025 年云技术资源紧密度和景气度高[1][2] 2. **2025 年云基础设施市场景气度快速提升**:2024 年 Q4 云技术资源配套的 IDC 服务器采购量明显增长;春节后 DGP 大火,国内应用高速发展,各大厂商推出 AI 芯片推动 AI 应用落地,带动云技术资源进入新一轮成长周期[1][3][4] 3. **当前适合布局云计算板块**:一季度 IaaS 大涨后深度调整,因短期涨幅大、业绩兑现滞后、市场担忧等因素,目前悲观预期充分消化,多数个股调整 30% - 40%;5 月财报季若实际需求未下滑,有望预期修复,国内大厂财报可能亮眼[1][5] 4. **国内与海外云计算结构不同**:国内推理相关占比预计比海外高,近期模型和应用进展好,如阿里巴巴发布原生多模态大模型等,AI 模型应用能力和算力有显著增长空间[1][6] 5. **云基础设施建设落地依赖生态完善**:依赖 MCP 及各种服务完善、工程优化,普生碳模型打开上限,2025 年下半年这些因素加速推进将带动技术资源消耗[7] 6. **看好云技术资源布局**:中期云技术和应用落地顺利,当前看好云技术资源布局机会,重点推荐阿里和金山云;AI 化由训练向推理切换,云环节边际提升显著;也看好 IDC、算力国产化及配套建设方向[8] 7. **IDC 行业供需格局改善**:2021 年后供大于求,政府管控有助于改善格局;2025 年交付节奏和规模大,如奥飞和润泽交付体量达截至 24 年底的 70% - 80%;三大运营商一季报显示 IDC 业务快速增长,龙头公司回调至年初位置,是布局良机[1][9][12] 8. **数据中心配套建设业绩确定性强**:依赖 IDC 厂商资本开支扩张,2025 年是扩张年份;一季报部分公司业绩不及预期,但散热系统受确认节奏影响,需关注存货和合同负债变化,云计算板块回调是配置机会,推荐英维克[1][10][12] 9. **通信行业推荐相关赛道**:推荐 IDC、散热、国产算力相关赛道;政府对 IDC 行业管控利于健康发展;2025 年交付节奏和规模大,关注收入端兑现;数据中心配套受确认节奏影响,关注存货和合同负债,散热推荐英维克[11][12] 10. **英维克公司发展乐观**:当前估值 30 - 35 倍,预计 2025 年达 35 倍;未交付项目二季度确认收入将好转;毛利率下滑因会计准则变化,调整后合理;存货和合同负债上涨,未交货订单处历史高位[13] 11. **液冷技术应用前景好**:H20 被禁对 IDC 短期影响小,国产算力发展提升液冷比例,2025 年关注厂商认证和渗透率提升;看好液冷赛道,关注升腾链大厂测试进展及出货情况[3][14] 12. **AIGC 基础设施公司资本开支不悲观**:一季度财报显示 IDC 相关业务增长显著,如科华数据 AIDC 业务增长 40%,胜宏电能质量增长 20% - 30%;海外谷歌资本开支计划未调整,AI DC 电机设备板块迎底部布局机会[15] 13. **AI DC 电机设备板块有潜在催化**:五一后海外大厂发布财报、DP4 卡 R2 模型等推出、腾讯新一轮招标将推动 AI 应用需求增长,形成新订单催化,建议布局相关公司[16] 14. **IaaS 领域价格长期上涨**:受国内外资本开支和算力建设等因素影响,短期内股价回调;柴油发电机招标价格持续小幅上涨,散单突破 300 万元,5 月或继续涨价[19] 15. **柴油发电机行业供需偏紧**:与船舶行业相似,需求景气向上,供给端核心发动机资源紧缺,后续涨价及量价齐升趋势确定[20][21] 16. **柴油发电机交付集中在三四季度**:Q1 交付量相对不多,同比小幅改善;核心发动机 Q2 逐步交付,主要集中在三季度和四季度,5 月可能有订单催化[23] 17. **东南亚市场对柴油发电机有积极影响**:有催化机会,不占用国内资源,柴发加储能及出口东南亚市场有积极变化,反映设备供需紧缺[24] 18. **应流股份表现良好**:今年陆续签单,与外资厂商签长协,月订单达亿元级别;燃气轮机制片配套刚性,作为叶片供应商确定性高;资本开支和研发投入前置,下半年盈利改善可期[25] 19. **关注机械板块相关企业**:财报季后,云计算等环节回调后有布局机会,建议关注泰豪科技等企业及应流股份,把握产业链盈利兑现机会[26] 其他重要但是可能被忽略的内容 - 散热系统从发货到确认收入需 6 - 9 个月,季度业绩受项目确收节奏影响[10][12] - 2025 年是液冷行业 1 - 10 阶段[14] - 2025 年需关注国产算力厂商认证情况及液冷行业渗透率提升,跟踪升腾链大厂测试进展及出货情况[3][14][18]