开放计算
搜索文档
“暴力计算”模式触及极限,算力进入系统工程时代
每日经济新闻· 2025-12-22 20:12
行业共识转向:从全栈自研到系统协同 - 算力产业竞争焦点正从单点芯片性能转向整体系统效率,从全栈路线转向多方协同的系统工程[1] - 这一转向是大模型时代真实工程约束下的必然结果,万亿级参数模型使依赖单一芯片性能提升的“暴力计算”模式触及物理与效率极限[1] 单点性能突破失效与系统效率挑战 - 大模型对算力的要求已非单一芯片算力,而是整个系统能否长期、稳定、高效运行[2] - 随着模型规模向万亿级参数演进,挑战延伸至互连带宽、存储层级、供电制冷、系统稳定性等系统性指标[2] - 传统集群在节点规模扩大后,通信开销往往占用30%~50%的资源,导致算力无法被充分利用[3] - 即便芯片性能提升,若互连协议不统一、系统软件不兼容、运维可靠性不足,整体算力效率仍会被稀释[3] - 行业共识正转向通过超高速总线将不同GPU焊接形成高密度计算单元的超节点和超集群模式[3] 全栈自研模式的弊端与生态挑战 - 全栈自研模式导致厂商“内卷”加剧,各家想做全套却在每一层都难以做到极致,形成多个封闭的小生态[5] - 生态割裂给用户带来巨大困扰,面对众多芯片路线,用户需投入高额成本进行重复适配和优化,极大降低开发效率[5] - 算法和算子往往锚定特定生态,移植过程短则数月,浪费时间和人才资源[5] - 相比英伟达积累数年的生态,国产算力在硬件与软件的无缝衔接上仍有差距,生态丰富度是发展瓶颈[6] - 国产芯片种类的快速增加给用户带来新负担,每种芯片都需要单独适配、优化和维护,性能不能直接转化为用户实际收益[3] 开放计算成为新路径及其挑战 - 开放计算意味着从“一家通吃”转向多厂商各司其职、相互协作、共赢,核心在于分层解耦[7] - 开放要求厂商让渡一部分控制权和利润空间,并建立可执行的协调机制,难点在于组织和协作分配而非技术[7] - 执行层面需对产业链分层解耦,各环节由多家厂商并行推进,并通过统一标准重新紧耦合,这对平台方提出更高要求[8] - 需要有具备公信力的平台承担协调角色,确保制度与资源保障,在供需对接、标准制定和冲突调解中发挥作用[8] - 开放架构为AI产业进化提供了一种路径选择,若继续各自为战,开放架构之外的生态容易跟不上时代[8] - 由场景驱动的协同赋能正在降低不同行业适配AI的成本,例如垂直小模型在本地工作站部署的需求激增让硬件与应用实现咬合[8] 未来竞争格局 - 紧耦合的封闭体系与开放协同的体系,在国内丰富的应用场景中仍将长期并存[9] - 在大模型和超集群成为常态后,能否构建高效、可协同、可持续演进的系统,将成为决定厂商生存空间的关键变量[9]
AI下一程:从“单点突围”到“生态共进”
环球时报· 2025-12-19 14:13
中国AI产业发展路径与开放计算架构 - 单纯依靠堆规模的传统模式已不足以维持AI高速迭代,协同与融合成为推动中国AI技术进步与产业升级的关键路径[2] - 中国在国家战略层面推动“AI+”,是对构建新型生产关系和发展新质生产力的全方位谋划,但发展面临“性能墙”与“生态墙”双重制约,包括高端算力供给不足、软硬件适配不畅、技术标准不一、应用成本高昂等问题[2] - 光合组织选择打造AI计算开放架构,旨在结合产业链企业优势,从技术“单点突围”走向产业“生态共进”,该架构不排斥国外产品,以降低开发门槛、加速应用落地和提升系统性能[3] 中国智算产业面临的挑战与战略选择 - 中国智算产业面临两大挑战:突破算力瓶颈(如高端AI芯片禁运、先进制程工艺瓶颈、EDA设计软件禁售)和实现算力普惠(如封闭系统售价高昂、自主软硬件生态不成熟、算力资源供需错配)[3] - 针对挑战的解决路径分为封闭系统(如苹果操作系统)与开放系统(如安卓操作系统)两类,光合组织结合中国实际情况选择了由大量企业分工合作的开放系统路径[3] scaleX万卡超集群的技术突破与优势 - scaleX万卡超集群是面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案,在超节点架构、高速互联网络、存储性能优化、系统管理调度等方面实现多项创新突破[4] - 该集群单机柜算力密度提升20倍,部分技术与能力已超越海外同类产品,硬件上可支持多品牌AI加速卡,软件兼容主流计算生态,极大降低了智算集群的整体拥有成本[4] - AI超集群采用高速总线和统一内存,将千万个GPU连接在一起像一块芯片一样工作,统一进行内存存取,调度算力密度非常高,从而极大提升实际算力,克服了传统集群因通信瓶颈导致的运算效率下降问题[5] AI技术发展的未来方向 - 单纯依靠堆叠算力已逐步逼近AI的效率极限,未来发展需要底层技术创新[4] - 当前多模态模型普遍存在“缝合式融合”短板,难以形成对真实物理世界的系统性理解,制约了其在更复杂真实场景中的可靠应用[4] - 未来AI总体算力发展可概括为“两超”(超节点和超高密度)、“一开放”(开放生态)、“两融合”(“超算、智算、通算”融合以及“算、存、网、电、冷、管、软”融合)[5] 产业合作与“AI+”应用落地 - 商汤科技、大晓机器人与中科曙光达成战略合作,共同推进世界模型在国产算力平台上的高效训练与推理[5] - 大晓机器人发布的新一代“开悟”世界模型(Kairos 3.0)支持多视角、长时序、复杂动态环境下的场景建模与交互生成,并已与scaleX万卡超集群等产品完成深度适配[5] - “AI+”已渗透到众多行业,例如地理科学领域的多模态语言大模型“坤元”用于回答全球变化和区域可持续发展问题,国产新能源汽车的设计和测试也依赖大量AI算力[6] - HAIC2025大会展示了“AI+交通”、“AI+医卫”、“AI+安全”、“AI+工业”、“AI+能源”、“AI+软件服务”等成果展区,具体案例如甘肃省利用车纹识别大模型打造的“5G+智慧公路”,协助处理事故定责、道路流量预测等任务[6]
《环球时报》记者探访2025人工智能创新大会:AI下一程,从“单点突围”到“生态共进”
环球网· 2025-12-19 06:49
中国AI产业发展路径与挑战 - 人工智能正成为驱动新质生产力发展的核心引擎,但单纯依靠堆规模的传统模式已不足以维持高速迭代,协同与融合成为推动技术进步与产业升级的关键路径 [1] - 中国在国家战略层面推动“AI+”,大模型驱动的应用已渗透几乎所有行业,但发展面临“性能墙”与“生态墙”双重制约,包括高端算力供给不足、软硬件适配不畅、技术标准不一、应用成本高昂,成为中小企业发展的显著壁垒 [2] AI计算开放架构与生态建设 - 光合组织提出“开放计算”主题,旨在通过打造AI计算开放架构,整合产业链企业优势,从技术“单点突围”走向产业“生态共进” [2] - 中国智算产业面临两大挑战:突破算力瓶颈(涉及高端AI芯片禁运、先进制程工艺瓶颈、EDA软件禁售等)和实现算力普惠(封闭系统售价高昂、自主生态不成熟、算力资源供需错配等) [3] - 光合组织选择借鉴安卓模式,构建由大量企业分工合作的开放系统,其开放架构不排斥国外产品,旨在降低开发门槛、加速应用落地和提升系统性能 [3] 大规模智能计算系统创新 - 中科曙光在HAIC2025首次以真机形式展示了scaleX万卡超集群,这是面向万亿参数大模型、科学智能等复杂场景打造的大规模智能算力基础设施方案 [4] - scaleX万卡超集群在超节点架构、高速互联网络、存储性能优化、系统管理调度等方面实现多项创新突破,单机柜算力密度提升20倍,部分技术与能力已超越海外同类产品 [4] - 该系统极大降低了智算集群的整体拥有成本,硬件上支持多品牌AI加速卡,软件兼容主流计算生态 [4] - AI超集群通过高速总线和统一内存,将千万个GPU连接在一起像一块芯片一样工作,统一存取内存,调度算力密度非常高,从而极大提升实际算力,克服了传统集群因通信瓶颈导致的效率下降问题 [7] AI技术未来发展方向 - 单纯依靠堆叠算力已逐步逼近AI的效率极限,未来发展需要底层技术创新 [6] - 当前多模态模型普遍存在“缝合式融合”短板,难以形成对真实物理世界的系统性理解,制约了其在复杂真实场景中的可靠应用 [6] - 未来AI总体算力发展可概括为“两超”(超节点和超高密度)、“一开放”(开放生态)、“两融合”(“超算、智算、通算”融合以及“算、存、网、电、冷、管、软”融合) [6] - scaleX万卡超集群代表的AI超集群是未来非常被看好的方向 [6] 产业合作与“AI+”应用落地 - 商汤科技、大晓机器人与中科曙光达成战略合作,共同推进世界模型在国产算力平台上的高效训练与推理 [6] - 大晓机器人发布的新一代“开悟”世界模型(Kairos 3.0)支持多视角、长时序、复杂动态环境下的场景建模与交互生成,并已与scaleX万卡超集群等产品完成深度适配 [6] - “AI+”已有多领域落地成果,包括地理科学领域的多模态语言大模型“坤元”,以及AI在国产新能源汽车设计测试中的工业应用 [8] - HAIC2025大会展示了“AI+交通”、“AI+医卫”、“AI+安全”、“AI+工业”、“AI+能源”、“AI+软件服务”等成果展区,例如甘肃省利用车纹识别大模型打造的“5G+智慧公路” [8]
光合组织首届人工智能创新大会17日至19日举办
苏州日报· 2025-12-10 08:56
大会概况 - 光合组织首届人工智能创新大会将于12月17日至19日在江苏昆山举办 [1] - 大会旨在汇聚全产业链企业,通过研讨与展示打造中国AI计算开放架构的创新风向标 [1] - 大会将设1个主会场、超过30场分论坛及若干专题,并设有5000平方米的展区 [1] 大会核心目标 - 聚焦推动AI算力的开放与普惠,着力打破算力领域的“卡脖子”问题和高昂成本壁垒 [1] - 支持中小企业和开发者更好地利用AI技术 [1] - 打造展示开放计算阶段性成果的平台,促进产业、技术、应用层面的深度交流与协作 [1] 展示内容与生态 - 参展企业将展示覆盖芯片、服务器、存储、超节点、AIPC乃至大模型与行业应用的全栈解决方案矩阵 [1] - 大会将首次大规模公开展示AI创新技术与生态成果,全栈呈现国产AI加速计算技术栈 [2] - 将发布AI计算开放架构联合实验室行动计划,并分享前沿AI4S部署实践案例 [2] 关键技术发布 - 大会将发布全球领先的大规模智算超集群系统,该系统基于开放架构打造 [2] - 该系统搭载国内首发自研高速互联网络技术,打破了算力密度新纪录,实现了规模与性能双突破 [2] - 该系统的发布验证了开放路线在技术可行性与产业适配性上的核心竞争力 [2] 战略意义与选址考量 - 本次大会是对光合组织过去5年生态建设成果的集中检阅,也是对未来共建开放AI生态的战略擘画 [2] - 首届大会选址昆山的关键因素在于其完备的现代产业体系、丰富的应用场景以及优异的产业环境 [2] - 昆山及长三角的区位与交通优势,便于覆盖区域内密集的产业伙伴 [2] 后续影响与落地 - 大会相关成果将率先在苏州、昆山及长三角地区加速落地 [2] - 丰富的应用场景能为开放计算技术提供“用武之地”,有利于形成标杆示范 [2]
8点1氪|西贝称1岁孩子在西贝学会吃饭属实;马斯克回应出现在爱泼斯坦相关文件中;哪吒汽车重整,仅一家意向投资人符合报名要求
36氪· 2025-09-28 08:10
西贝营销事件 - 西贝官方号发布视频称1岁孩子在西贝学会吃饭 引发关注但视频已下架 [1] - 西贝客服表示故事真实发生 删除原因是顾客和员工遭受网络暴力 [1] - 西贝品味早读公众号为员工内部平台 截至2025年9月27日已发布1952篇原创内容 [1] 汽车行业动态 - 哪吒汽车重整仅一家意向投资人符合要求 需缴纳5000万元保证金并提交可行方案 [2] - 零跑汽车因合同纠纷被强制执行 已支付全部款项3618085.25元 正推动车辆过户事宜 [3] - 广汽菲克核心资产第六次拍卖 分两个资产包处置 土地建筑物起拍价6亿元 生产设备起拍价2亿元 [4][6] - 广汽菲克前五次整体资产拍卖均流拍 无汽车行业投资人报名 [7] 消费品定价策略 - 麦当劳矿泉水定价引发争议 单瓶售价7.5-8元 较电商平台1.46元溢价超400% [2] - 麦当劳回应称定价由可口可乐和公司共同决定 门店无法修改定价 [2][3] 金融产品调整 - 多家银行下调信用卡透支利率 光大银行调整至日利率0%-0.05% 年利率0%-18.25% [9] - 至少6家银行已优化信用卡透支利率标准 优质客户可获0%利率 [9] 科技与创新 - 优艾智合机器人递交港交所上市申请 为首家移动操作机器人港股上市公司 [12] - 谷歌推出Gemini Robotics-ER 1.5机器人模型 为首个开放给开发者的具身推理模型 [13] - 清华大学开发新型含氟聚醚电解质 推动高安全性固态锂电池技术发展 [13] - 北京智源研究院发布FlagOS 1.5大模型系统 解决AI硬件生态割裂问题 [12] 大宗商品市场 - 国际咖啡期货价格创50年新高 推动云南咖啡生豆价格从40元/公斤涨至66元/公斤 [9] - 云南咖啡种植面积超120万亩 出口量价齐升 [9] 企业法律事务 - 波音公司支付5万美元(约35.7万元)了结吹哨人非正常死亡诉讼 [10]
北京发布升级版“系统软件栈”,支持全球20多款主流AI芯片
新京报· 2025-09-26 17:51
产品发布 - 北京智源人工智能研究院发布升级版人工智能大模型操作系统“众智FlagOS”v1.5 [1][2] - 该系统的核心目标是为人工智能模型提供统一、开放、高效的计算支持,解决不同AI芯片难以兼容的问题 [1] - 新版本在覆盖全面性、自动化程度、性能和应用场景四个维度实现突破,全面支持机器人“大脑”与“小脑”模型的开发与部署 [2] 技术性能与兼容性 - 通过改进并行策略与调度算法,在典型大模型任务中实现最高36.8%的训练加速与20%的推理加速 [2] - 系统已支持全球20多款主流AI芯片,其通用算子库FlagGems核心算子数量超过200个 [2] - FlagGems成为唯一被纳入PyTorch官方生态的跨芯片算子库,并发展为全球体量最大的Triton语言算子库 [2] 行业意义与发展阶段 - 该发布标志着全球AI底层技术生态正迈入以“开放计算”为核心理念的协同创新新阶段 [1] - 智算基础设施被类比为电网之于电力、铁路之于工业,是智力服务体系的核心基石 [2] - 经过两年多发展,“众智FlagOS”已全面覆盖大模型统一生态技术需求,基本满足当前大模型训练推理需求 [2] 生态建设与人才培养 - 北京智源人工智能研究院发布“众智FlagOS”高校计划,联合北大、清华等首批10余家高校院所开设系列课程 [3] - 计划旨在从源头培养智算系统软件开源人才,推动AI系统技术人才培养 [3] - 同时发布《超节点智算应用“北京方案”》,构建集约化、普惠化的“人工智能+”算力底座 [3] 组织与标准建设 - 大会期间北京市人工智能标准化技术委员会正式成立 [3] - “北京市可重构算力软硬件协同技术创新中心”成立,创新联合体同步启动 [3]
2025开放计算技术大会举行,加速AIDC全球协作
中国新闻网· 2025-08-11 19:03
开放计算技术大会概况 - 2025开放计算技术大会在北京举行 聚焦MoE大模型与AI智能体技术发展趋势及开放计算对纵向扩展性能与横向扩展效率协同发展的促进作用 [1] - 大会由开放计算社区OCP及开放标准组织OCTC联合主办 吸引中国移动 字节跳动 阿里云 三星 浪潮信息 清华大学 立讯技术等超千位学者 专家及厂商代表参与 [1] 开源开放趋势与产业协作 - 模型算法开源和算力系统开放成为AI时代主流趋势 开源开放全球化协作平台通过提升单系统性能满足万亿参数大模型需求 并通过全球产业链协作解决GW级AI数据中心系统性工程挑战 [1] - 开源大模型与开放算力结合驱动海量长尾应用爆发 加速AI普惠实现 公共云平台和模块化AI基础设施普及为开源模型规模化落地提供开放算力基础 [2] - 产业协同创新需从应用和用户思维出发 坚持标准引领 制定落地规范标准 推动数据中心技术创新与成果普惠 [2] OCP战略重点与技术成果 - OCP工作重心转向AI主导 所有核心工作围绕AI开放系统战略计划展开 涵盖数据中心物理基础设施 IT基础设施和系统管理三大重点领域 [2] - OCP发布《可扩展基础设施的蓝图》 作为AI开放系统战略计划重要工作成果 [2] - OCTC推动服务器算力算效评估基准 通过系统评估服务器整机算力与能效表现 为行业提供科学可信评估体系 为用户服务器架构选型优化提供标准范式 [2] MoE大模型驱动算力架构变革 - MoE大模型参数量保持高速增长且迭代迅速 对单系统算力密度与互联速率提出极致要求 带动计算架构变革 [3] - 超节点架构成为核心发展路径 需为AI重构算力系统以解决超大规模MoE带来的算力 互联 能耗瓶颈及可靠性稳定性挑战 [3] - 超节点架构采用GPU发起式直连内存 通过GPU友好型介质与存储减少内存瓶颈 为大模型训练推理提供支持 [3] 开放计算生态与系统化创新 - 开放计算使数据中心产业链协同效应更紧密 融合创新能力更强 对AI产业至关重要 [3] - 产业链各方以开放心态共建标准 共享技术 共拓场景 使多样性算力从分散"孤岛"变为互联互通"大陆" [3] - 超节点架构是系统化思维产物 从系统层面打破芯片性能边界最大化用户价值 浪潮信息将向社区开放自研超节点架构设计及PD分离框架 [4][5] 跨社区合作与GW级数据中心发展 - GW级AI数据中心推动算力生态变革 加速跨社区合作进程 OCP筹备成立"GW级开放智算中心OCP中国社区小组" 结合中国能源 算力基础设施与供应链优势推动AI开放系统战略落地 [5] - OCP与OCTC合作探讨将OCP领先AI基础设施技术架构 参考方案及前沿研究成果在中国市场落地 建立GW级AI数据中心全球性标杆 [5]