Workflow
算力调度
icon
搜索文档
一次算力政策研讨实录:算力调度的七个问题
36氪· 2026-02-12 19:08
中国算力产业发展的关键阶段与挑战 - 未来五年(2026年-2030年)是中国算力产业发展的关键阶段 [1] - AI产业的快速发展对算力产业提出了更高要求 [1] - 行业面临的挑战包括资本支出规模处于劣势以及先进AI芯片供应受限 [1] - 企业正致力于将芯片、算法、能源、网络等要素组合成效率更高、成本更低的系统,以实现算力的可持续商业回报 [1] 政策研讨与“算力调度”共识的形成 - 2026年初,在国家信息中心支持下,针对算力政策进行了讨论与意见征集,梳理出七个关键问题 [2] - 讨论主要聚焦“算力调度”对产业发展的价值,参与者包括电信运营商、科研院所及咨询机构的专家 [2] - 国家信息中心长期进行全国一体化大数据中心、“东数西算”工程及全国一体化算力网等政策研究 [2] - 各方共识认为,算力调度是充分利用现有算力、减少闲置资源、实现合理配置的重要方法 [3] - 算力调度复杂度远超水电调度,因为算力是高度异构和非标准化的,而水电是同质的物理资源 [3] - 全国算力调度“一张网”的建设需通过“政府搭台、标准引领、市场运作”的综合模式推进,而非仅靠行政指令 [3] 中国算力产业政策与现状 - 产业政策在算力产业布局中发挥重要作用,关键节点包括2022年2月启动的“东数西算”工程和2023年12月出台的全国一体化算力网政策 [3] - 在政策引导下,中国算力区位布局变得更合理,数据中心分散建设情况好转,算力背后的绿电占比提升,网络成本持续下降 [3] - 国家数据局2025年5月数据显示,枢纽节点地区新增算力占全国新增算力的60%以上 [3] - 截至2024年末,中国算力中心标准机架数超过900万,算力规模达到280 EFLOPS,位居全球前列,算力中心平均电能利用效率(PUE)降至1.46 [3] “算力调度”的概念与内涵 - “调度”一词带有时代色彩,指资源跨区域调配以实现供需匹配平衡,如同农业时代的水资源调度和工业时代的电力调度 [9] - 在数字经济时代,算力像水力、电力一样成为重要的社会资源,需要通过调度解决区域供需错配问题 [9] - 算力资源在物理空间和时间上不均衡,东部需求大但电力贵,西部资源多但本地需求少,不同行业和时间的算力潮汐现象明显 [10] - “调度”体现了对算力资源供需匹配的主动管理,通过全局优化实现计算任务与算力资源的高效匹配,是资源配置模式的变革 [11] - 算力调度需要在跨地域、跨层级、跨架构的复杂环境中,对算力、运力、存力与电力等资源进行综合编排并优化配置 [11] 算力调度的实质与对象 - 算力调度调度的并非物理形态的算力(如芯片、服务器),因为它们是无法移动的 [12] - 其实质是调出方的数据和任务在算力网中移动传输,利用调入方的算力设施进行处理 [13] - 严格来说,算力调度的是“计算任务”,通过网络将任务和数据分发到不同节点执行,实现算力资源的灵活分配 [13] - 调度对象首先是“程序”,它需要针对不同芯片架构和算力特性进行优化 [14] - 调度对象还包括“数据”,需权衡传输成本与时间成本,决定是否传输到远端节点计算 [14] - 调度对象也涵盖“能源”,可将计算任务分配到可再生能源丰富或电价低廉的地区和时段 [15] - 算力调度是在计算任务与算力资源之间建立高效智能匹配机制,实现有条件的动态平衡 [15] 算力调度与物理资源调度的异同 - 算力调度与水利、电力调度具有相似的宏观目标,都是为了解决资源在时空分布上的不均衡,促进跨域资源互补与供需平衡,实现“削峰填谷” [16] - “东数西算”与“南水北调”、“西电东送”有类似的战略考量,共同承载着提升国家资源整体配置效率的使命 [16] - 不同点在于:电是标准化的同质产品,容易计量和替代;而算力是高度异构和非标准化的,不同架构的芯片无法简单混合使用,调度适配难度高 [16] - 水和电的传输是相对单向且“无状态”的;算力调度是双向传输且“有状态”的,计算任务需要输入并产生数据,且对网络延时极度敏感 [16] 全国一体化算力网与相关概念的区别 - 全国一体化算力网是一个综合性的国家算力数字基础设施体系 [17] - 运营商网络是该体系的重要组成部分,为其建设提供网络保障和技术支持,但全国一体化算力网的内涵超越单纯的通信网络 [17] - 全国一体化算力网的核心目标是实现算力资源像水电一样在“网”中跨地域、跨主体的高效调度与普惠服务 [17] - 除了运营商网络,华为、阿里等头部企业以及地方国资、民企所建的算力网络也需要接入,形成全国算力“一张网” [17] - 全国一体化算力网更强调将多源异构的算力在区域空间范围进行一体化联通整合,以及算力、网络、数据、电力等的协同运营 [18] 算力调度面临的挑战与讨论 - 技术经济账方面,存在对跨域调度网络成本可能抵消西部电价优惠的担忧 [20] - 技术痛点方面,不同厂商的芯片架构和软件生态差异导致模型应用跨厂商、跨架构调度面临复杂度高和成本高的问题 [20] - 商业机制方面,算力资源掌握在不同企业手中,存在竞争关系,涉及算力定价和利益分配的难题 [20] - 数据安全方面,客户担心数据被调度出本地后,其隐私和主权难以保障 [20] - 未来核心问题是构建一个能覆盖网络成本、平衡各方利益并保障数据安全的成熟机制 [20] 算力调度对全国一体化算力网建设的作用 - 算力调度是全国一体化算力网的“神经中枢”和“操作系统”,决定了数据中心是孤岛还是能动态响应需求的智能资源池 [21] - 首要作用是整合闲置的碎片化算力资源,提升国家整体算力设施利用率,减少重复建设浪费 [21] - 调度是实现“算电协同”的关键抓手,能把高能耗计算任务引导到西部风光水电丰富的区域,使用绿色能源,助力实现双碳目标 [23] - 能降低全社会创新成本,让中小企业像使用水电一样方便地使用数据中心算力,无需自购昂贵硬件,并能通过超大规模算力联动服务国家战略 [23] 全国算力调度“一张网”的建设路径 - 建设是一项涉及标准制定、平台搭建和机制创新的系统工程,仅铺设网络和建设数据中心远远不够 [24] - 必须“标准先行”,建立统一的算力网标准和度量衡,让不同厂商、架构、芯片的算力能在统一调度框架下被识别、管理和调用 [24] - 需明确“监测为基、调度为核”的建设思路,构建多层次的“调度平台”,包括国家级顶层枢纽以及区域和行业节点,形成全国一体化算力监测调度平台体系 [24] - 需构建可持续的算力调度运营服务机制,通过市场化撮合与价格发现机制,促进算力供需双方快速匹配及灵活交易,用价格信号引导资源流动 [24] - 安全是底座,必须同步构建跨域安全传输和隐私计算体系,确保数据在调度过程中“可用不可见” [24] - 总体建设需通过“政府搭台、标准引领、市场运作”的综合模式推进 [25]
A股晚间热点 | 国常会重磅!研究促进有效投资政策措施
智通财经网· 2026-02-07 00:15
宏观经济与政策 - 国务院常务会议强调促进有效投资对稳定经济增长和增强发展后劲具有重要作用 将创新完善政策措施 加力提效用好中央预算内投资、超长期特别国债、地方政府专项债券等资金和新型政策性金融工具 [1] - 政策将着眼于长远发展 结合“十五五”规划 在基础设施、城市更新、公共服务、新兴产业和未来产业等重点领域谋划推动一批重大项目、重大工程 [1] - 宏观政策要靠前发力 财政资金尽可能提前安排 加强资金下达和项目建设的协同配合 以尽快落地见效 同时坚持政策支持与改革创新并举 以激发市场活力和挖掘内需新增长点 [2] 算力与人工智能基础设施 - 工信部发布通知 组织开展国家算力互联互通节点建设 旨在实现不同区域、主体、架构的算力资源标准化互联和高效流动应用 以提升整体算力水平 [3] - 行业节点将建设服务平台 为行业内算力互联互通提供算力资源汇聚、算力标识、算力选择等市场化服务 并接入区域节点 [3] - 阿里“千问”APP因“春节30亿免单”活动遭遇巨大流量冲击 出现卡顿 阿里方面回应正在紧急加资源保障顺畅 [3] - 国金证券观点认为 AI基础设施(AI Infra)是决定AI生态“成本曲线”与“能力天花板”的关键基石 其中算力调度作为集群神经中枢 其核心在于高效编排大规模异构处理器任务并通过故障自愈机制保障训练连续性 [3] - 自选股梳理了年内回撤幅度居前的算力概念股名单 包括易华录(年内最高价24.00元 收盘价12.48元)、开普云(年内最高价279.81元 收盘价164.50元)、寒武纪(年内最高价1550.00元 收盘价1036.99元)等 [4][5] 虚拟货币监管 - 中国人民银行等八部门发布通知 明确指出虚拟货币不具有与法定货币等同的法律地位 比特币、以太币、泰达币等不应且不能作为货币在市场上流通使用 [6] - 通知要求持续整治虚拟货币“挖矿”活动 国家发展改革委将严格管控 全面梳理排查并关停存量项目 严禁新增项目 并严禁“矿机”生产企业在境内提供销售等服务 [6] 公司动态与市场事件 - 国投瑞银基金已成立工作小组 研究制定相关工作方案 支持白银LOF基金投资者通过和解、调解、仲裁等渠道解决诉求 并承诺保障投资者合法权益及基金公允定价 [7] - 亚马逊2025年第四季度营收同比增长14%至2134亿美元 高于市场预期的2113亿美元 净利润212亿美元 同比增长6% 但稀释后每股收益1.95美元低于市场预期的1.97美元 [8] - 亚马逊预计2026年资本支出或将达2000亿美元 该巨额支出计划引发市场担忧 导致其股价一度跌超9% [8] - 快手平台因未履行网络安全保护义务、未及时处置系统漏洞及违法信息等问题 被北京市互联网信息办公室处以警告及1.191亿元人民币罚款 并责令限期改正 [13] 消费与服务行业政策 - 商务部表示将搭建培育服务消费新增长点的“1+N”政策体系 计划制定出台家政、汽车后市场、演艺、铁旅融合、入境消费等10多项具体领域支持政策 [9][10] 金融市场与监管 - 上海黄金交易所调整部分合约保证金水平和涨跌停板 Au(T+D)等合约保证金比例从17%调整为18% 涨跌停板从16%调整为17% Ag(T+D)合约保证金比例从23%调整为24% 涨跌停板从22%调整为23% [11] - 证监会监管持续升级 2026年以来已有至少6家上市公司或其关键人物被立案调查 平均每6天一例 另有13家公司收到行政处罚决定书或事先告知书 平均不到3天一例 处罚力度显著加大 [12] 预制菜行业 - 国家卫生健康委就预制菜食品安全国家标准公开征求意见 将从食品安全和营养健康方面对预制菜作出规定 明确其定义及原料、生产过程、标签标识等要求 [14] - 财通证券研报指出 预制菜国标推进有利于规范行业 头部企业将享受合规红利和市场份额提升的双重利好 [14] - 自选股梳理显示8只预制菜概念股年报净利润预增翻倍 其中好想你预告净利润变动中值为1281.25%居首 百洋股份预增404.84% 香雪食品预增383.77% [14][16] 其他行业与公司公告 - 特斯拉中国AI训练中心已投入使用 [17] - 2026年北京汽车以旧换新补贴于2月9日启动 最高补贴2万元 [17] - 广电总局将制定实施《微短剧发展管理办法》以促进市场公平竞争 [17] - 我国正推动ISO水务能效管理国际标准研制 聚焦全球城市污水处理 [17] - 皖通高速拟投资54.2亿元建设G30连霍高速公路安徽段改扩建工程 [17] - 联环药业拟对全资子公司增资5000万元 [17] - 侨银股份预中标约7380万元内蒙古自治区呼和浩特市新城区城区环卫一体化服务项目 [17] - 中兴通讯拟出资2亿元认购粤港澳大湾区创业投资引导基金合伙企业份额 [17] - 大连电瓷预中标金额约1.19亿元 [17] - 天晟新材因涉嫌信息披露违法违规被证监会立案 [17] - 同德化工公司部分资产被查封冻结 [17] - 三孚股份股东元亨科技拟减持不超过3%公司股份 [17] - 沪硅产业股东国家大基金拟减持不超过3%公司股份 [17] - 九洲集团实际控制人李寅和赵晓红合计减持1132.6万股 [17][18]
思特奇(300608) - 300608思特奇投资者关系管理信息20260204
2026-02-04 18:52
业务发展格局 - 公司深耕电信行业30年,基本格局为深度赋能运营商、城市、产业企业及东数西算等领域客户,助推客户数智化转型 [2] 市场竞争策略 - 在运营商领域,竞争策略更多采用直销模式 [2] - 在城市和数字经济领域,侧重于构建生态合作伙伴模式,以协同合作共同做大市场 [3] 出海业务布局 - 出海业务以深圳为起点,从服务香港运营商出发拓展其他业务 [3] - 在出海领域,以AI、算力等标准化产品为重点突破口 [3] AI与算力业务优势 - 在算力调度业务上,核心优势在于整合需求,系统性参与国家算力发展,并侧重于城市经济等方面的全面统筹 [3] - 公司开始做AI的时间很早,能够提供一整套AI开发工具,让业务人员通过外部接口实现AI赋能,提高开发效率 [3] - 在模型选择上,通识性任务选用通用大模型,企业内部知识则进行专门训练,使用业务模型分解事项并提供解决方案 [3] AI应用与成效 - AI应用主要在代码校验、提升运营和管理效率、实现数智化报销及办公信息化数字化等方面,旨在解放生产力 [3] - 公司的人工智能观是实现人的时间效率解放,而非替代,以腾出更多时间拓展市场 [3] 营收与订单预期 - 公司营收比较依赖运营商,但2025年运营商具体订单预期未披露,需关注年度报告 [3] - 公司第二、第三曲线业务不断发展并稳步推进,其成效预计将在后续年度逐步释放 [3]
大模型API的大众点评来了:7×24小时实测,毫秒级延迟智能路由,选API必备
量子位· 2026-02-02 11:39
文章核心观点 - 大模型API服务市场存在严重的信息不对称和评测标准混乱问题,导致开发者选型困难、成本高昂[1][2][3] - 清程极智公司推出的AI Ping产品,旨在通过7×24小时持续评测、智能路由和统一度量衡三大核心功能,解决上述痛点,成为大模型API领域的“大众点评”,推动行业从经验驱动转向数据驱动[7][8][9][71] 行业痛点与市场现状 - 大模型API选型是AI应用开发团队的“至暗时刻”,缺乏可靠的公共参考体系[1][10] - 不同供应商提供的同一模型架构,在价格、延迟、稳定性和吞吐量等关键指标上波动巨大,堪比“霸天虎过山车”[2] - 在API调用动辄几十万、上百万token的时代,选型仍依赖经验反复试错,导致大量重复劳动[3][16] - 厂商宣传指标与真实调用环境存在差距,行业缺乏统一的性能描述标准,导致横向比较困难[15][41][42] AI Ping产品功能与解决方案 - **核心功能一:7×24小时持续评测的客观性能和模型精度榜单** - 提供动态监控而非静态跑分,实时公开吞吐、P90首字延迟、稳定性等图表化指标[19][21][22] - 引入多维度精度评估体系,持续监测模型在不同时间段及负载下的输出质量波动[24][25] - 扮演“教导主任”角色,一旦模型有异动,榜单上立即反馈[26] - **核心功能二:智能路由动态匹配** - 类似实时导航系统,根据实时评测数据,帮助接入侧动态选择最合适的API执行路径[27][29] - 当监测到某供应商延迟高或错误率攀升时,能毫秒级地将请求自动路由至表现最好的供应商,保障系统持续可用性与执行效率[31][32] - **核心功能三:统一大模型API的度量衡** - **提供多平台统一API接口**:充当“万能转接头”,开发者只需面对一套标准化API接口,即可轻松接入或切换文心、Qwen、GLM、Kimi等不同模型,降低维护成本[35][37][38][39] - **确立行业性能评测规范**:固定硬核指标的定义、采集方式与统计口径,例如严格区分TTFT(首字生成时间)与E2E Latency(端到端延迟)[43][44] - **坚持真实数据说话**:基于持续大规模的真实调用数据,其洞察的颗粒度甚至可能超过厂商自身公开的信息,使结果具备可比较性和可复现性[45][46][47] - **形成行业共识**:其评测标准已支撑清华大学与中国软件评测中心联合发布2025大模型服务性能榜单[48][49] 清程极智公司的优势与定位 - **公司定位与背景**:成立于2023年12月,深耕AI Infra领域,定位为连接“算力与应用”及“国产硬件与大模型”的“双重桥梁”[56][57] - **中立性与公正性**:公司不自研大模型,也不自持算力提供MaaS服务,保证了第三方评测的客观性[59] - **独特的行业理解**:长期处在算力部署与模型服务一线,既懂底层芯片硬件,也懂上层模型应用,能深度理解各方痛点[60][61] - **深厚的技术底座**:在国产GPU算力调度、异构芯片适配、大规模集群系统优化等领域有深厚积累,发布了赤兔推理引擎、八卦炉智能计算软件栈等产品,为AI Ping的高并发评测和智能路由提供了技术支持[63][64][65] 产品价值与行业影响 - **为开发者提供高性价比选择**:作为资源聚合者,清程极智通过集采效应,使AI Ping上的API调用可能比直接向厂商调用更具性价比[53][54] - **填补市场空白**:填补了国内大模型服务实时性能监测的空白,用榜单、评分等通俗易懂的方式呈现信息[67][68] - **推动行业范式转变**:推动大模型API选型逻辑从经验驱动走向数据驱动[71] - **促进行业良性竞争**:对供应商形成倒逼效应,促使其优化服务质量、提升稳定性、降低延迟,从而降低全行业的开发与选型成本,推动AI生态向更规范、高效方向发展[72][73]
北京佳杰云星数据科技有限公司:算力调度平台赋能东莞大模型中心,构建三方共赢数字生态
经济观察网· 2026-01-29 13:49
公司业务与定位 - 公司为北京佳杰云星数据科技有限公司,深耕信息技术软件领域,聚焦智能体开发、算力调度和管理、多云管理三大核心业务 [2] - 公司凭借持续加码的研发投入与技术创新,已成长为数字基础设施建设领域的中坚力量 [2] 项目背景与挑战 - 东莞作为制造业重镇与数字经济发展前沿城市,亟需构建城市级人工智能基础公共服务平台以推动产业升级 [4] - 平台建设面临两大核心挑战:一是AI算力资源分布不均,企业存在算力需求缺口,需高效调度机制;二是大模型中心缺乏标准化、完备的运营平台来支撑全生命周期的计费、管理与可持续盈利 [4] 解决方案与关键举措 - 公司深度参与东莞人工智能大模型中心的建设与运营,以自主研发的算力调度与运营平台产品体系提供针对性解决方案 [4] - 方案围绕大模型中心运营平台及算力调度平台搭建,通过四大关键举措破解难题:统一纳管、一站式服务门户、生态开放、精细化运营 [4][5][9] - 统一纳管:平台支持自动化与人工注册双模式,实现各类算力资源的统一纳管,兼容多种主流芯片及AI开发平台,打破资源分散管理壁垒 [9] - 一站式服务门户:面向企业用户搭建统一算力服务门户,集中呈现模型、AI智能体等50余种算力相关产品,简化使用流程,降低应用门槛 [9] - 生态开放:为算力及算法供应商提供自主上架销售渠道,鼓励生态伙伴参与,形成“平台搭建桥梁、伙伴提供产品、企业享受服务”的良性循环 [9] - 精细化运营:平台配备完善的运营管理模块,涵盖运营分析、费用核算、算力调度分配等核心功能,实现全流程精细化管控 [5] 项目成效与价值 - 平台自2024年启动实施以来已取得显著成效,并于2025年正式上线后全面释放价值 [6] - 技术价值:实现了不同类型AI计算资源的集约化管理与高效调度,资源利用率较传统模式大幅提升 [9] - 服务价值:集中化的服务入口大幅提升企业获取算力服务的效率,50余种多元化服务覆盖制造、金融、科技等多个行业需求 [9] - 运营价值:账单线上化结算系统与多维度分析功能,支持多种优惠营销方式,既降低企业使用成本,又为平台可持续盈利提供保障 [9] - 生态价值:成功联动平台运营方、算力供应商与企业用户,构建起三方共赢的生态循环,为东莞数字经济发展注入持久动力 [9] 行业意义与展望 - 该实践不仅解决了城市级算力平台建设的核心痛点,更探索出算力资源市场化配置的有效路径 [7] - 平台将持续助力东莞大模型中心提升运营效率与价值创造能力,为区域产业数字化转型提供坚实的算力支撑 [7] - 该模式为全国城市级人工智能公共服务平台建设提供了可复制、可推广的实践经验 [7]
恒为科技20260114
2026-01-15 09:06
纪要涉及的行业或公司 * 公司:恒为科技(上市公司)及其并购标的数恒科技[1] * 行业:AI应用(特别是AI营销)、网络可视化、智能系统平台、算力基础设施[3] 核心观点与论据 1 并购战略与业务布局 * 恒为科技通过并购数恒科技布局AI应用侧,旨在弥补中国在AI应用收入上与算力上的差距[1][3] * 恒为科技主营业务为网络可视化(首家上市公司)和智能系统平台(从信创向AI基础架构、算力底座转型,包括AI一体机、AI工作站、计算交换机)[3] * 选择数恒科技因其深刻掌握营销场景并能转化为实打实的收入和利润,其创始人团队在大数据和投流时代经验丰富[4][5] 2 数恒科技核心技术与发展历程 * 公司成立于2017年,是企业级场景化AI解决方案服务商[6] * 自2020年起研发大模型SGPT(Small and Smart GPT),强调小参数模型解决实际问题,2023年完成可本地部署的SGPT 1.0上线[2][6] * 构建了从算力层、模型层、智能体层到应用层、解决方案层的完整技术栈[7] * 算力层适配英伟达、AMD及国产GPU(昆仑芯、天智芯片),并自主搭建算力调度平台[2][7] * 模型层结合自研GPT模型与市场开源模型,通过微调满足需求,并开发了傻瓜式训练机[7] 3 核心产品“知新AI中台”在营销场景的应用 * 知新AI中台整合AI技术,提升营销效率和效果,分为业务流程中心、通用问答功能和具体业务流程应用三大板块[2][9] * AI agent能解读客户需求,指导策划人员制定精准策划案(如确定核心沟通点KPI、预算、周期)[9] * 市场环境分析结合小红书官方信源及联网搜索,实现广度与深度兼具的数据分析,确保数据可靠性和报告贴近实际市场[2][11] * 媒介执行方面,多模态基建结合小红书笔记信息分析达人感性层面,利用RPA工具在蒲公英平台快速联系达人,提高选人效率[10] * 智能创作板块提供智梦AI生成图和笔记工厂工具,为KOC级别达人批量生成内容[10] 4 商业模式与客户情况 * 采用以结果收费为主导的商业模式,根据与客户约定的科学KPI完成量收费,包括固定服务费、绩效服务费和研发费用[4][15] * 不按模块收费,而是采用RAS模式,关注模块和智能体间的协作效果,通过AI技术赋能客户提高效能[18] * 2026年初深耕快消品、酒水饮料和出行(酒店)等行业,并在汽车、教育培训、运营商等领域对接储备[4][13] * 与大客户(集团公司)合作紧密,已与十几个产品线展开合作,客户相信AI技术能带来二次增长[17] * 净利润因技术复用和效能提升而稳中有升,公司采取进取策略将收益投入新行业及海外市场扩展[20] 5 竞争优势与发展规划 * 优势体现在数据、业务和大模型三个核心维度:积累了大量的数字资产(客户授权资料、自有内容、上万名达人信息);开发人员深入了解业务需求;拥有自己的算力平台和训练平台,能快速工程化训练验证模型[2][12] * 与小红书有深度合作,包括研究院人员深度交流,获得平台认可[4][15] * 在GEO(基于生成式模型优化)领域因拥有备案大模型和工程化训练能力而具备优势[19] * 通过AI赋能团队提高人效,人员稳中有序扩张,智能体平台完善增强了解决客户问题的能力,毛利稳步上升[14] * 计划将AI产品应用到更多行业,如线下融合产品、法务一体机升级及政企行业升级,预计2026年带来显著增长[13] 其他重要内容 1 协同效应 * 恒为科技与数恒科技的协同效应包括:恒为的AI一体机与数恒的垂类模型、智能体结合;恒为在运营商及政府等国产化、私有化部署客户市场的渠道,结合数恒模型Agent撬动市场;合作开发算力调度平台,共同运营国产算力中心;共同开拓海外市场[21]
让算力像水和电一样方便取用(创新故事)
人民网· 2026-01-12 06:43
文章核心观点 - 贵州作为“东数西算”国家枢纽节点,正从“数据仓库”向“算力工厂”加速转型,通过建设大规模、绿色化的智算中心,提升网络传输效率,并构建算力调度平台,旨在打造全国领先的算力产业生态,推动数字经济高质量发展 [1][2][3][4] 算力基础设施发展 - 贵州成功完成全球首次单波400G与800G双速率混合组网试点验证,推动算力资源高效互联 [1] - 东数西算(贵州)智算中心项目致力于打造集通算、超算、智算于一体的绿色数据中心 [1] - 智算能力从最初的2P(1P约等于每秒1000万亿次计算速度)提升至超过1万P [1] - 贵州在建及投运数据中心达50个,算力规模达150百亿亿次/秒 [4] - 智算占比、国产化率、区域集中度均超过90%,成为全国智算能力最强、智算资源最多的地区之一 [4] 网络传输能力提升 - 通过核心节点项目将网络层级提升至核心层,开通直达24个城市的直联专线 [2] - 建成“贵阳—桂林—广州”低损耗光缆,时延较传统方式降低33% [2] - 粤港澳大湾区企业每日产生1PB数据,通过该超高速通道几分钟可传至贵州,成本下降超30% [2] 算力调度与应用创新 - 推动“息壤”算力调度平台落地贵州,可在全国范围内进行算力统筹和调度 [3] - 与贵州省气象局合作,应用轻量级气象扩散大模型,提高短临降雨预测精准度、时效性和分辨率 [3] - 研发5G智慧工厂平台,搭载2000个智能终端,通过人工智能大模型实现生产销售全流程数字化 [3] - 打造化工“5G+数字孪生工厂”,通过机器狗巡检、智能安全帽监测,将厂区事故率降低40%,管理效率提升30% [3] - 组建轻量化大模型团队,率先布局轻量化大模型的预训练工作 [3] 产业生态与经济效益 - 贵州软件和信息技术服务业收入在2024年突破1000亿元,数字经济增速连续多年位居全国前列 [4] - 构建“一中心、一基地、一平台”的数字经济产业格局,形成“云服务—数据存储—数据清洗加工—数据应用”的全产业链生态 [4] - 率先开展数据要素市场化配置改革,推动公共数据资源开发利用,培育数据交易市场 [4] 未来发展规划 - 未来将聚焦算力、数据、应用、产业,大力发展以智算为重点的算力产业、高质量数据集为重点的数据产业、行业大模型为重点的人工智能产业、数智化为特色的电子信息产业 [5] - 正牵头建设贵州省人工智能实验室,以吸引更多算力产业链上下游企业集聚 [3]
下一个“AI卖铲人”:算力调度是推理盈利关键,向量数据库成刚需
华尔街见闻· 2025-12-24 12:17
AI基础设施软件行业概览 - 生成式AI应用加速渗透,AI基础设施软件成为应用落地的关键“卖铲人”,行业正迎来黄金发展期 [1] - 与模型训练环节被巨头垄断不同,推理和应用部署环节为独立软件厂商打开了新的商业空间 [1] - 当前两类产品最为关键:算力调度软件和数据类软件 [1] 算力调度软件 - 算力调度能力是决定模型推理服务盈利水平的核心变量,直接决定毛利率 [1][6] - 在单日10亿查询量场景下,使用H800芯片,单卡吞吐能力每提升10%,毛利率能够提升2-7个百分点 [1][6] - 敏感性分析显示,当单卡吞吐从基准值的0.6倍提升至1.4倍时,毛利率可从52%提升至80% [6] - 海外云厂商毛利率差异显著,2025年三季度谷歌云毛利率43.3%,微软智能云34.6%,亚马逊AWS仅为23.7%,硬件调度能力影响关键 [8] 国内厂商算力调度实践 - 国内模型价格战激烈,成本控制至关重要,例如Deepseek V3定价为每百万token输入2元、输出3元,远低于海外同类产品1.25-5美元的价格 [5] - 华为Flex:ai实现异构算力统一调度,通过芯片级切分技术,在特定场景下可将平均利用率提升30% [5] - 阿里巴巴Aegaeon实现token级动态调度,将10个模型所需GPU数量从1192张锐减至213张,资源节约率达82% [5] - 英伟达Run:ai可将GPU利用率提升5倍,Deepseek自研调度系统实现成本利润率545% [6] 向量数据库与RAG技术 - 向量数据库是RAG应用的刚需基础,Gartner预测2025年企业RAG技术采用率将达68% [1][10] - 2024年全球已有45%的企业在智能客服、数据分析等场景部署RAG系统 [10] - 向量数据库核心价值在于支撑海量数据的毫秒级检索,需在亿级数据规模下保持高QPS实时检索能力 [10] - 从2024年四季度开始,通过API接口接入大模型的Token消耗量一年内翻了近10倍,直接拉动了向量数据库需求 [11] 数据库格局重塑 - 生成式AI时代,数据架构正从“分析优先”转向“实时运营+分析协同”,高频、低延迟的实时事务处理需求凸显OLTP数据库优势 [12] - MongoDB凭借低门槛、高弹性契合中小客户AI落地需求,2026财年一至三季度核心产品Atlas收入增速分别为26%、29%、30% [15][16] - MongoDB在2025年2月以2.2亿美元收购Voyage AI补齐向量检索能力,其嵌入模型在HuggingFace RTEB测评中排名前列 [16] - 2026财年三季度MongoDB毛利率达76%,预计年底经营利润率达18%,全年营收增长率约21%-22% [16] 数据平台厂商的应对策略 - Snowflake与Databricks选择向上下游纵向拓展,打造全栈工具链 [15][17] - Snowflake 2025财年收入达36.26亿美元,同比增长29.21%,预计2026财年收入44.46亿美元 [17] - Databricks 2025年年化收入超48亿美元,同比增长55%,数据湖仓产品年化收入超10亿美元,净留存率超140% [17] - 截至2026财年三季度,Snowflake年消费超100万美元的高价值客户达688家,福布斯全球2000强企业中已有766家成为其客户 [17] 存储架构技术升级 - AI推理进入实时化、PB级数据访问新阶段,存储IO性能至关重要,LLM推理的KV缓存访问粒度仅8KB-4MB,向量数据库检索粒度低至64B-8KB [18] - 英伟达推出SCADA方案实现GPU直连SSD,将IO延迟从毫秒级降至微秒级,测试显示1颗H100 GPU的IO调度效率是Gen5 Intel Xeon Platinum CPU的2倍以上 [18] - 向量数据库需进行技术升级,包括采用GPU适配的列式存储、将检索算法改为GPU并行版本、自主管理GPU显存分配 [19]
我省构建异构智算调度技术破解电力行业“算力调度难”
新华日报· 2025-12-24 05:48
核心观点 - 国电南瑞旗下公司研发的“电力异构智算调度技术”通过鉴定,整体达到国际领先水平,该技术解决了电力行业算力供需矛盾,实现了不同品牌、型号算力资源的高效协同,并已在11个省份成功应用 [1] 技术背景与行业痛点 - 随着人工智能技术推广,电力行业对算力需求呈爆发式增长 [1] - 现有算力资源处于“各自为战”状态,机房同时部署昇腾、寒武纪等10余种国产GPU,导致高端算力资源紧张排队,中低端算力闲置浪费,形成显著的“算力孤岛” [1] 技术原理与创新 - 该技术相当于为算力资源搭建“智能调度中心”,通过一系列技术创新实现异构算力的“互联互通” [1] - 采用统一接口将各类GPU纳入统一管理,构建“网络+算力”协同机制,控制单节点性能损耗 [1] - 将大模型拆解为可灵活部署的模块,使中低端算力也能参与高端任务,且推理速度不受影响 [1] - 通过智能路由精准匹配算力需求与资源,提升路由准确率 [1] 应用平台与性能表现 - 集成关键技术的“瑞腾智算调度平台”在实际应用中表现突出 [2] - 在支撑电网供电方案生成时,工单响应时长平均仅用7.241秒 [2] - 平台并发处理能力由40提升至800,基层业务处理效率实现倍增 [2] 市场推广与行业拓展 - 该平台已在国家电网总部及江苏、山东等地的11家省电力公司投入运行,正在向全国逐步推广 [2] - 平台正逐步拓展至军工、电信、公安等领域,完成多场景落地验证 [2] 技术成果与知识产权 - 相关项目已取得19项专利授权,发表19篇高水平论文 [2] - 项目牵头制定3项国家标准,核心技术属行业首创 [2] - 团队将持续优化技术体系,打造自主可控的智算基础平台,赋能更多行业数字化转型 [2]
未来网络试验设施正式投入运行,完成120项重大创新试验
环球网资讯· 2025-12-06 09:50
项目概况与定位 - 我国信息通信领域首个国家重大科技基础设施——未来网络试验设施正式投入运行 [1] - 该设施总部位于江苏南京的紫金山实验室,已于2024年8月正式建成 [1] 技术能力与规模 - 设施覆盖全国40个城市,包括88个主干网络节点和133个边缘网络节点 [1] - 光传输总长度超过5.5万公里 [1] - 能支持4096个异构业务并行试验,并可实现与国内外现有网络互联互通 [1] - 网络数据传输具备高效、高速、低延迟、低抖动特性,丢包率仅百万分之一 [1] 应用领域与方向 - 为工业制造、能源电力、教育医疗、低空经济等领域提供开放试验支撑 [1] - 在AI大模型训练、算力调度、算网协同、光电融合等前沿方向开展示范应用 [1] 服务客户与成果 - 已累计服务国家级科研机构(如中国科学院国家天文台、中科院高能所)、四大运营商(中国电信、中国移动、中国联通、中国广电)、多所知名高校(如北京大学、南京大学、浙江大学、香港中文大学)以及龙头企业(如华为、新华三、百度) [1] - 已完成120项重大创新试验 [1] - 试验内容涵盖核心芯片、网络操作系统、路由控制、安全可信、大规模组网、新型AI业务等关键维度 [1]