Workflow
算力调度
icon
搜索文档
恒为科技20260114
2026-01-15 09:06
纪要涉及的行业或公司 * 公司:恒为科技(上市公司)及其并购标的数恒科技[1] * 行业:AI应用(特别是AI营销)、网络可视化、智能系统平台、算力基础设施[3] 核心观点与论据 1 并购战略与业务布局 * 恒为科技通过并购数恒科技布局AI应用侧,旨在弥补中国在AI应用收入上与算力上的差距[1][3] * 恒为科技主营业务为网络可视化(首家上市公司)和智能系统平台(从信创向AI基础架构、算力底座转型,包括AI一体机、AI工作站、计算交换机)[3] * 选择数恒科技因其深刻掌握营销场景并能转化为实打实的收入和利润,其创始人团队在大数据和投流时代经验丰富[4][5] 2 数恒科技核心技术与发展历程 * 公司成立于2017年,是企业级场景化AI解决方案服务商[6] * 自2020年起研发大模型SGPT(Small and Smart GPT),强调小参数模型解决实际问题,2023年完成可本地部署的SGPT 1.0上线[2][6] * 构建了从算力层、模型层、智能体层到应用层、解决方案层的完整技术栈[7] * 算力层适配英伟达、AMD及国产GPU(昆仑芯、天智芯片),并自主搭建算力调度平台[2][7] * 模型层结合自研GPT模型与市场开源模型,通过微调满足需求,并开发了傻瓜式训练机[7] 3 核心产品“知新AI中台”在营销场景的应用 * 知新AI中台整合AI技术,提升营销效率和效果,分为业务流程中心、通用问答功能和具体业务流程应用三大板块[2][9] * AI agent能解读客户需求,指导策划人员制定精准策划案(如确定核心沟通点KPI、预算、周期)[9] * 市场环境分析结合小红书官方信源及联网搜索,实现广度与深度兼具的数据分析,确保数据可靠性和报告贴近实际市场[2][11] * 媒介执行方面,多模态基建结合小红书笔记信息分析达人感性层面,利用RPA工具在蒲公英平台快速联系达人,提高选人效率[10] * 智能创作板块提供智梦AI生成图和笔记工厂工具,为KOC级别达人批量生成内容[10] 4 商业模式与客户情况 * 采用以结果收费为主导的商业模式,根据与客户约定的科学KPI完成量收费,包括固定服务费、绩效服务费和研发费用[4][15] * 不按模块收费,而是采用RAS模式,关注模块和智能体间的协作效果,通过AI技术赋能客户提高效能[18] * 2026年初深耕快消品、酒水饮料和出行(酒店)等行业,并在汽车、教育培训、运营商等领域对接储备[4][13] * 与大客户(集团公司)合作紧密,已与十几个产品线展开合作,客户相信AI技术能带来二次增长[17] * 净利润因技术复用和效能提升而稳中有升,公司采取进取策略将收益投入新行业及海外市场扩展[20] 5 竞争优势与发展规划 * 优势体现在数据、业务和大模型三个核心维度:积累了大量的数字资产(客户授权资料、自有内容、上万名达人信息);开发人员深入了解业务需求;拥有自己的算力平台和训练平台,能快速工程化训练验证模型[2][12] * 与小红书有深度合作,包括研究院人员深度交流,获得平台认可[4][15] * 在GEO(基于生成式模型优化)领域因拥有备案大模型和工程化训练能力而具备优势[19] * 通过AI赋能团队提高人效,人员稳中有序扩张,智能体平台完善增强了解决客户问题的能力,毛利稳步上升[14] * 计划将AI产品应用到更多行业,如线下融合产品、法务一体机升级及政企行业升级,预计2026年带来显著增长[13] 其他重要内容 1 协同效应 * 恒为科技与数恒科技的协同效应包括:恒为的AI一体机与数恒的垂类模型、智能体结合;恒为在运营商及政府等国产化、私有化部署客户市场的渠道,结合数恒模型Agent撬动市场;合作开发算力调度平台,共同运营国产算力中心;共同开拓海外市场[21]
让算力像水和电一样方便取用(创新故事)
人民网· 2026-01-12 06:43
文章核心观点 - 贵州作为“东数西算”国家枢纽节点,正从“数据仓库”向“算力工厂”加速转型,通过建设大规模、绿色化的智算中心,提升网络传输效率,并构建算力调度平台,旨在打造全国领先的算力产业生态,推动数字经济高质量发展 [1][2][3][4] 算力基础设施发展 - 贵州成功完成全球首次单波400G与800G双速率混合组网试点验证,推动算力资源高效互联 [1] - 东数西算(贵州)智算中心项目致力于打造集通算、超算、智算于一体的绿色数据中心 [1] - 智算能力从最初的2P(1P约等于每秒1000万亿次计算速度)提升至超过1万P [1] - 贵州在建及投运数据中心达50个,算力规模达150百亿亿次/秒 [4] - 智算占比、国产化率、区域集中度均超过90%,成为全国智算能力最强、智算资源最多的地区之一 [4] 网络传输能力提升 - 通过核心节点项目将网络层级提升至核心层,开通直达24个城市的直联专线 [2] - 建成“贵阳—桂林—广州”低损耗光缆,时延较传统方式降低33% [2] - 粤港澳大湾区企业每日产生1PB数据,通过该超高速通道几分钟可传至贵州,成本下降超30% [2] 算力调度与应用创新 - 推动“息壤”算力调度平台落地贵州,可在全国范围内进行算力统筹和调度 [3] - 与贵州省气象局合作,应用轻量级气象扩散大模型,提高短临降雨预测精准度、时效性和分辨率 [3] - 研发5G智慧工厂平台,搭载2000个智能终端,通过人工智能大模型实现生产销售全流程数字化 [3] - 打造化工“5G+数字孪生工厂”,通过机器狗巡检、智能安全帽监测,将厂区事故率降低40%,管理效率提升30% [3] - 组建轻量化大模型团队,率先布局轻量化大模型的预训练工作 [3] 产业生态与经济效益 - 贵州软件和信息技术服务业收入在2024年突破1000亿元,数字经济增速连续多年位居全国前列 [4] - 构建“一中心、一基地、一平台”的数字经济产业格局,形成“云服务—数据存储—数据清洗加工—数据应用”的全产业链生态 [4] - 率先开展数据要素市场化配置改革,推动公共数据资源开发利用,培育数据交易市场 [4] 未来发展规划 - 未来将聚焦算力、数据、应用、产业,大力发展以智算为重点的算力产业、高质量数据集为重点的数据产业、行业大模型为重点的人工智能产业、数智化为特色的电子信息产业 [5] - 正牵头建设贵州省人工智能实验室,以吸引更多算力产业链上下游企业集聚 [3]
下一个“AI卖铲人”:算力调度是推理盈利关键,向量数据库成刚需
华尔街见闻· 2025-12-24 12:17
AI基础设施软件行业概览 - 生成式AI应用加速渗透,AI基础设施软件成为应用落地的关键“卖铲人”,行业正迎来黄金发展期 [1] - 与模型训练环节被巨头垄断不同,推理和应用部署环节为独立软件厂商打开了新的商业空间 [1] - 当前两类产品最为关键:算力调度软件和数据类软件 [1] 算力调度软件 - 算力调度能力是决定模型推理服务盈利水平的核心变量,直接决定毛利率 [1][6] - 在单日10亿查询量场景下,使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点 [1][6] - 敏感性分析显示,当单卡吞吐从基准值的0.6倍提升至1.4倍时,毛利率可从52%提升至80% [6] - 海外云厂商毛利率差异显著,2025年三季度谷歌云毛利率43.3%,微软智能云34.6%,亚马逊AWS仅为23.7%,硬件调度能力影响关键 [8] 国内厂商算力调度实践 - 国内模型价格战激烈,成本控制至关重要,例如Deepseek V3定价为每百万token输入2元、输出3元,远低于海外同类产品1.25-5美元的价格 [5] - 华为Flex:ai实现异构算力统一调度,通过芯片级切分技术,在特定场景下可将平均利用率提升30% [5] - 阿里巴巴Aegaeon实现token级动态调度,将10个模型所需GPU数量从1192张锐减至213张,资源节约率达82% [5] - 英伟达Run:ai可将GPU利用率提升5倍,Deepseek自研调度系统实现成本利润率545% [6] 向量数据库与RAG技术 - 向量数据库是RAG应用的刚需基础,Gartner预测2025年企业RAG技术采用率将达68% [1][10] - 2024年全球已有45%的企业在智能客服、数据分析等场景部署RAG系统 [10] - 向量数据库核心价值在于支撑海量数据的毫秒级检索,需在亿级数据规模下保持高QPS实时检索能力 [10] - 从2024年四季度开始,通过API接口接入大模型的Token消耗量一年内翻了近10倍,直接拉动了向量数据库需求 [11] 数据库格局重塑 - 生成式AI时代,数据架构正从“分析优先”转向“实时运营+分析协同”,高频、低延迟的实时事务处理需求凸显OLTP数据库优势 [12] - MongoDB凭借低门槛、高弹性契合中小客户AI落地需求,2026财年一至三季度核心产品Atlas收入增速分别为26%、29%、30% [15][16] - MongoDB在2025年2月以2.2亿美元收购Voyage AI补齐向量检索能力,其嵌入模型在HuggingFace RTEB测评中排名前列 [16] - 2026财年三季度MongoDB毛利率达76%,预计年底经营利润率达18%,全年营收增长率约21%-22% [16] 数据平台厂商的应对策略 - Snowflake与Databricks选择向上下游纵向拓展,打造全栈工具链 [15][17] - Snowflake 2025财年收入达36.26亿美元,同比增长29.21%,预计2026财年收入44.46亿美元 [17] - Databricks 2025年年化收入超48亿美元,同比增长55%,数据湖仓产品年化收入超10亿美元,净留存率超140% [17] - 截至2026财年三季度,Snowflake年消费超100万美元的高价值客户达688家,福布斯全球2000强企业中已有766家成为其客户 [17] 存储架构技术升级 - AI推理进入实时化、PB级数据访问新阶段,存储IO性能至关重要,LLM推理的KV缓存访问粒度仅8KB-4MB,向量数据库检索粒度低至64B-8KB [18] - 英伟达推出SCADA方案实现GPU直连SSD,将IO延迟从毫秒级降至微秒级,测试显示1颗H100 GPU的IO调度效率是Gen5 Intel Xeon Platinum CPU的2倍以上 [18] - 向量数据库需进行技术升级,包括采用GPU适配的列式存储、将检索算法改为GPU并行版本、自主管理GPU显存分配 [19]
我省构建异构智算调度技术破解电力行业“算力调度难”
新华日报· 2025-12-24 05:48
核心观点 - 国电南瑞旗下公司研发的“电力异构智算调度技术”通过鉴定,整体达到国际领先水平,该技术解决了电力行业算力供需矛盾,实现了不同品牌、型号算力资源的高效协同,并已在11个省份成功应用 [1] 技术背景与行业痛点 - 随着人工智能技术推广,电力行业对算力需求呈爆发式增长 [1] - 现有算力资源处于“各自为战”状态,机房同时部署昇腾、寒武纪等10余种国产GPU,导致高端算力资源紧张排队,中低端算力闲置浪费,形成显著的“算力孤岛” [1] 技术原理与创新 - 该技术相当于为算力资源搭建“智能调度中心”,通过一系列技术创新实现异构算力的“互联互通” [1] - 采用统一接口将各类GPU纳入统一管理,构建“网络+算力”协同机制,控制单节点性能损耗 [1] - 将大模型拆解为可灵活部署的模块,使中低端算力也能参与高端任务,且推理速度不受影响 [1] - 通过智能路由精准匹配算力需求与资源,提升路由准确率 [1] 应用平台与性能表现 - 集成关键技术的“瑞腾智算调度平台”在实际应用中表现突出 [2] - 在支撑电网供电方案生成时,工单响应时长平均仅用7.241秒 [2] - 平台并发处理能力由40提升至800,基层业务处理效率实现倍增 [2] 市场推广与行业拓展 - 该平台已在国家电网总部及江苏、山东等地的11家省电力公司投入运行,正在向全国逐步推广 [2] - 平台正逐步拓展至军工、电信、公安等领域,完成多场景落地验证 [2] 技术成果与知识产权 - 相关项目已取得19项专利授权,发表19篇高水平论文 [2] - 项目牵头制定3项国家标准,核心技术属行业首创 [2] - 团队将持续优化技术体系,打造自主可控的智算基础平台,赋能更多行业数字化转型 [2]
未来网络试验设施正式投入运行,完成120项重大创新试验
环球网资讯· 2025-12-06 09:50
项目概况与定位 - 我国信息通信领域首个国家重大科技基础设施——未来网络试验设施正式投入运行 [1] - 该设施总部位于江苏南京的紫金山实验室,已于2024年8月正式建成 [1] 技术能力与规模 - 设施覆盖全国40个城市,包括88个主干网络节点和133个边缘网络节点 [1] - 光传输总长度超过5.5万公里 [1] - 能支持4096个异构业务并行试验,并可实现与国内外现有网络互联互通 [1] - 网络数据传输具备高效、高速、低延迟、低抖动特性,丢包率仅百万分之一 [1] 应用领域与方向 - 为工业制造、能源电力、教育医疗、低空经济等领域提供开放试验支撑 [1] - 在AI大模型训练、算力调度、算网协同、光电融合等前沿方向开展示范应用 [1] 服务客户与成果 - 已累计服务国家级科研机构(如中国科学院国家天文台、中科院高能所)、四大运营商(中国电信、中国移动、中国联通、中国广电)、多所知名高校(如北京大学、南京大学、浙江大学、香港中文大学)以及龙头企业(如华为、新华三、百度) [1] - 已完成120项重大创新试验 [1] - 试验内容涵盖核心芯片、网络操作系统、路由控制、安全可信、大规模组网、新型AI业务等关键维度 [1]
释放算力潜能 服务数智发展
人民日报· 2025-11-27 06:21
开源欧拉操作系统发展现状 - 预计2025年底装机量将突破1600万套 [1] - 在互联网、金融、能源等领域广泛应用 [1] - 在国内服务器操作系统市场份额保持领先 [1] 行业应用与性能提升 - 在中国工商银行实现“一云多算”和资源按需流动 [1] - 助力南方电网将工业自动化响应时间提升至微秒级 [1] - 通过AI异构算力加速使大模型推理吞吐性能提升10%至30% [1] 技术演进与未来规划 - 服务器操作系统正从“适配”迈向“AI原生驱动” [1] - 将推出全球首个面向超节点的操作系统 计划于2025年12月30日在社区上线 [1] - 超节点技术通过整合分散算力形成“超级大脑”以实现高效调度 [1] 社区生态与产业贡献 - 华为向开源欧拉社区开放灵衢互联协议2.0并贡献支持超节点的操作系统插件代码 [2] - 开源欧拉社区成员单位超2100家 全球贡献者突破2.3万人 用户超过550万人 [2] - 已成为全球最活跃的开源操作系统技术社区之一 [2]
园区息壤公共算力服务平台获“华彩杯”算力大赛总决赛一等奖
苏州日报· 2025-11-14 06:47
赛事与项目获奖情况 - 第三届“华彩杯”算力大赛总决赛获奖结果公布 全国首单息壤算力调度平台商用落地攻坚项目获得一等奖 [1] - 大赛自今年3月启动 吸引全国超10000个项目参与 覆盖产业门类30个 最终150个项目入围总决赛 [1] - 获奖项目为苏州工业园区公共算力服务平台 实现了经济、社会双价值落地 [1][3] 算力平台技术与能力 - “息壤”平台是承载于“东数西算”长三角算力调度中心的天翼云4.0算力分发网络平台 打造五位一体智能云服务体系 [2] - 平台构建覆盖云、边、端的协同网络体系 支持智算、超算、通算等异构算力的统一接入、封装、调度 [2] - 平台已对接全国100多个算力资源池节点 [2] - 平台实现9家多元异构厂家算力统一接入 接入算力2000P 算力资源13类 规格近200种 [3] - 资源调度成功率稳定保持在99.99% 资源利用率提升17%以上 [3] 市场应用与服务成效 - 平台服务苏州10个产业集群、30条产业链组成的“1030”体系 并通过孵化赋能催生长三角数字经济新业态 [2] - 平台已服务行业用户40余家 在线需求超600家 [3] - 平台构建“政府引导+平台赋能+企业受益”的可持续机制 打造通智超算一体化服务体系 [3] 行业趋势与公司战略 - 算力已成为发展新质生产力的关键力量 [1] - 公司致力于成为本地智能算力的主要提供者、通用大模型的先行者、行业大模型的共拓者 [1] - 公司加快构建新型云网融合基础设施 并打造可信AI安全防护体系保障应用安全稳定运行 [1][2]
Gartner 2026战略技术趋势:AI原生、多智能体与物理AI引领产业变革
搜狐财经· 2025-11-11 11:39
文章核心观点 - AI正从技术工具全面渗透为业务核心驱动力,呈现出架构师、协调者、哨兵三大主题 [1] - 2026年十大战略技术趋势重点聚焦于八大新兴方向,涵盖AI原生开发、多智能体系统、物理AI等关键领域 [1] AI原生开发平台 - AI原生开发平台是下一代软件工程核心,通过自然语言提示词直接生成完整应用或辅助编写代码,实现“氛围编程” [2] - 市场上已出现一键生成前后端网站的工具及集成AI的IDE开发环境,部分技术公司20%–40%的代码由AI生成 [2] - AI正在重构软件开发本质,其价值更多体现在模块化、标准化任务的自动化上,难以独立完成复杂系统重写 [2] AI超级计算平台 - AI超算平台作为未来算力底座,呈现混合AI算力与算力调度两大特征,以应对模型规模与数据量激增带来的指数级算力需求 [3] - 云端与终端芯片协同工作,NVQLink和CUDA-Q等技术实现量子计算与经典超算的联动,形成跨架构任务调度能力 [3] - 中国企业推出“超节点”技术,通过堆叠AI芯片实现算力聚合,是地缘政治背景下的务实选择 [7] 多智能体系统 - 多智能体系统通过“分而治之”将复杂任务拆解,由不同智能体分工协作再整合结果,解决单智能体可靠性低、成功率随步骤骤减的问题 [8] - 案例包括贝塔斯曼的跨业务内容检索和GitHub上用于股票分析的开源多智能体项目 [8] - 多智能体是AI从“工具”走向“协作者”的关键一步,未来企业AI架构或将出现“智能体中台” [9] 特定领域语言模型 - 企业级AI项目失败率高达95%,核心问题在于通用大模型“不懂业务” [10] - 特定领域语言模型通过行业数据再训练成为解决之道,使AI从“通才”走向“专才” [10] - 企业需投入数据治理与领域训练,否则将陷入“有模型无智能”的局面 [10] 物理AI - 物理AI指能与现实世界交互的AI系统,主要应用于自动驾驶与机器人,技术路径包括VLA模型和“世界模型” [11] - 特斯拉、蔚来等车企正积极布局能理解物理规律、进行预测与规划的“世界模型” [11] - 物理AI是AI与实体经济融合的桥梁,将在制造业、物流、医疗等领域逐步替代重复性劳动 [11] 前置式主动网络安全 - AI驱动的攻击如“氛围黑客攻击”可自动化完成漏洞探测、钓鱼攻击甚至勒索软件生成,降低了黑客门槛 [12] - 前置式主动网络安全系统应运而生,包括预测性威胁情报、自动移动目标防御等技术 [12] - 企业需建立“预测-响应-欺骗”三位一体的主动安全体系,而非依赖静态防御 [14] 数字溯源 - 数字溯源通过建立软件SBOM、模型MLBOM等清单体系,追踪组件来源与安全性,以应对软件供应链攻击 [15] - AI生成内容的水印与标识技术正在逐步标准化 [15] - 中国在AI内容标识方面的法规实践值得行业关注 [16] 地缘回迁 - 地缘政治风险促使企业将数据与应用从全球公有云迁移至本土“主权云”,欧洲企业受影响最深 [17] - 中国早在信创与国产化替代中布局,DeepSeek为适配国产芯片支持特定数据格式,标志中国AI生态逐步闭环 [17] - 中国企业需在自主可控与全球协作之间找到平衡点,避免陷入“技术孤岛” [17] 延续性趋势与重点方向 - “机密计算”通过可信执行环境保护使用中数据,“AI安全平台”防范提示词注入、模型越狱等新型攻击,共同构成AI时代“安全双翼” [18] - 物理AI、AI原生开发平台、特定领域语言模型、多智能体系统是最值得中国企业在未来一年关注的四大重点趋势 [18] - 企业应避免盲目追逐技术热点,聚焦于将AI嵌入业务流程、具备护城河及形成生态协同,在制造业场景中可结合“组合式AI”实现投入与效果平衡 [18]
马斯克预言五年后人机交互将转向意图驱动
新浪财经· 2025-11-02 18:06
核心观点 - 马斯克预言五年后不再有手机和App的核心价值在于指明了人机交互从手动到意图驱动的不可逆趋势 [2] 投资趋势 - 投资者无需等待手机被完全颠覆,应关注神经交互、算力调度等进化赛道以把握趋势复利 [2]
2025年算力调度平台行业:优化计算资源,支撑AI应用
头豹研究院· 2025-08-22 20:29
行业投资评级 - 报告未明确提供行业投资评级 [1] 核心观点 - 人工智能技术迅猛发展推动全球算力需求指数级增长 需要算力调度实现跨地域 跨平台的资源整合与优化 [2] - 中国算力规模快速增长 2024年总规模达280EFLOPS 智能算力占比32% 数据生产总量达41.06ZB 同比增长25% [20][23][25] - 算力调度平台通过基础设施层 管理编排层 服务运营层和算力应用层四层架构 实现算力资源的高效整合与智能调度 [40][41] - 异构算力调度面临资源异构性 软件环境碎片化 跨架构迁移成本高 缺乏统一标准等核心挑战 [4][43][44][45][46] - 国内算力调度平台形成国家级 省级/跨省级 市级三级体系 运营商主导平台侧重跨区域资源整合 科技企业主导平台聚焦垂直领域 [5][48][49][50] - 开源算力调度技术平台中 openFuyao在国产化适配支持上具有优势 Kubernetes和Slurm分别在云原生和HPC领域有深厚积累 [6][52] 算力调度行业综述 算力定义与分类 - 算力指计算机设备或数据中心处理信息的能力 狭义以FLOPS衡量 广义包括数据存储 网络传输 任务调度等能力 [15][17] - 算力分为通用算力(基于CPU 适用云计算 边缘计算) 智能算力(基于GPU/FPGA/ASIC 专为AI任务设计) 超算算力(基于超级计算机 解决复杂工程问题) [18][19] 算力规模与数据生产 - 中国算力总规模从2020年135EFLOPS增长至2024年280EFLOPS 智能算力占比从20.7%提升至32% [20][21][23] - 2024年中国数据生产总量达41.06ZB 同比增长25% 增速较2023年提高2.56个百分点 智能应用推动数据量增长40.95% [25][26] 算力网络与算网融合 - 算力网络是以算为中心 网为根基的新型信息基础设施 实现算力按需分配和灵活调度 [27][28] - 算网融合是计算与网络资源在硬件 软件 平台 应用等多层面的深度整合 追求算力即插即用和网络按需适配 [27][29] - 中国移动算网融合架构分为基础设施层(物理底座) 编排管理层(调度中枢) 运营服务层(能力平台)三层 [30][31] 异构算力定义与分类 - 异构算力通过结合CPU GPU FPGA ASIC等不同架构处理器 提升整体计算性能 能效比和灵活性 [33][36] - 处理器按架构分为CPU(灵活性高) GPU(并行能力强) FPGA(可编程) DSA(特定领域性能高) ASIC(性能最优但无灵活性) [34][36] 算力调度平台与异构计算调度系统 - 算力调度平台面向多类型计算资源 解决宏观资源分配问题 异构计算调度系统针对异构硬件架构 解决微观任务优化问题 [37][39] - 两者关系为异构计算调度系统构建于算力调度平台的基础能力之上 实现硬件抽象 资源池化 细粒度调度等核心扩展能力 [38] 算力调度平台架构与技术 - 算力调度平台技术架构分为基础设施层(整合计算 存储 网络资源) 管理编排层(统一管控 智能调度) 服务运营层(算力交易与服务运营) 算力应用层(多行业场景) [40][41] - 关键技术包括算力感知(实时监测资源状态) 算力度量(量化评估异构资源) 算力路由(任务流量路由至最优节点) 算网编排(计算与网络资源统一编排) 算力交易(智能公平交易) [41] 异构算力调度挑战 - 资源异构性与软件环境差异增加调度复杂性 任务代码需适配目标硬件编程接口 [43] - 跨架构任务迁移需重写代码或调整算法 受限于不同硬件内存管理机制和专用开发工具链 [44] - 缺乏统一计量标准和接口规范 跨厂商作业调度生态支持能力弱导致资源利用率受限 [45] - 异构硬件性能受多重因素影响呈非线性动态变化 传统调度模型无法精准预测任务执行损耗 [46] 国内主要算力调度平台 - 国家级平台包括全国一体化算力算网调度平台(首个人工智能公共算力开放创新平台(9家建设+16家筹建) 东数西算一体化算力交易平台 北京算力互联互通和运行服务平台 国家超级计算中心体系(天津"天河" 广州"天河二号" 济南"神威" 无锡"曙光"等) [48] - 省级/跨省级平台覆盖长三角(长三角一体化示范区异构智算云网调度平台) 粤港澳大湾区(粤港澳大湾区算力调度平台) 成渝(四川省算力调度服务平台) 京津冀(山东省黄河工业算力调度服务平台)等重点区域 [48] - 市级平台包括深圳市智慧城市算力统筹调度平台 杭州市算力资源调度服务平台 武汉市算力公共服务平台 青岛市算力调度服务平台 天津市算力交易中心等 [48] - 运营商主导平台如中国电信"息壤"算力分发网络平台 中国移动云智能算力调度平台(基于"4+N+31+X"梯次化布局) 中国联通云星罗先进算力调度平台(千卡级集群管理能力) 依托全国网络覆盖整合跨区域异构算力资源 [50] - 科技企业主导平台如中科曙光一体化算力交易调度平台 阿里云震旦异构计算平台 百度百舸AI异构计算平台 华为公共多样性算力服务平台 浪潮AI计算系统及推理平台(千卡集群线性加速比96%) 聚焦垂直领域或特定技术 [50] 开源算力调度技术平台 - openFuyao由华为 中国移动 联通等主导 支持CPU/GPU/FPGA多架构算力统一调度 优化大规模集群资源利用率 计划2025年Q3正式开源 [52] - Kubernetes是云原生容器编排平台 支持自动调度与扩缩容 服务发现与负载均衡 多集群管理 [52] - Slurm是HPC领域作业调度系统 支持分区管理 资源隔离 公平调度 [52] - Volcano是Kubernetes批处理调度插件 专为AI/大数据优化 支持Gang调度和多集群调度 [52] - YARN是Hadoop生态资源调度框架 支持资源抽象 多框架兼容(MapReduce Spark) 弹性资源分配 [52]