Fluid
搜索文档
网易游戏 Tmax 平台实践:基于 Fluid 的云原生 AI 大模型推理加速架构
AI前线· 2026-03-03 12:05
文章核心观点 网易游戏为应对大模型推理业务带来的资源弹性、数据访问效率与多地域协同挑战,选择并落地了基于云原生数据编排平台Fluid的解决方案,成功构建了“计算-缓存-存储”三层解耦架构,实现了显著的性能加速、成本节约与运维简化,为游戏行业AI基础设施现代化提供了实践范例 [3][6][20][34] 行业背景与公司挑战 - 大模型正深刻改变游戏行业,在NPC智能化、自动化剧情生成等场景成为核心竞争力 [3] - 网易游戏业务数据与场景日益复杂,为支持生成式AI业务,公司打造了Tmax AI机器学习平台 [3] - 随着大模型推理业务规模爆发,平台在资源弹性、数据访问效率与多地域协同方面面临严峻挑战 [6] - 挑战具体表现为:GPU资源稀缺且异构、业务峰值差异导致资源浪费率高达60%以上、Serverless冷启动因模型加载耗时10-15分钟而失效、以及多地域存储管理与计算资源碎片化 [8][9][10][11] 技术方案选型 - 针对大模型推理的多地域缓存加速需求,评估了直接使用Alluxio与基于Fluid构建解决方案两种路径 [12][13] - Alluxio本质是分布式缓存引擎,提供内存级数据访问能力 [14] - Fluid是基于Kubernetes的云原生数据编排平台,以“数据集”为中心进行抽象,深度集成于Kubernetes生态 [15] - 选择Fluid的核心判断包括:其“数据集”抽象更贴近AI应用模式、能封装Alluxio的运维复杂性、针对AI/ML场景进行了专门优化、与云原生生态集成更好、以及多Runtime架构避免技术依赖 [19] 落地实践与架构设计 - 基于Fluid构建了“计算 - 缓存 - 存储”三层解耦架构:底层为CubeFS/OSS存储,中间为Fluid+AlluxioRuntime构建的分布式缓存加速层,上层为Kubernetes集群计算层 [20] - 实施了自动预热机制,针对DeepSeek-R1等超大模型启用预取功能以缩短冷启动时间 [22] - 结合CronHorizontalPodAutoscaler与Fluid DataLoad实现智能弹性,根据游戏业务早晚高峰特征进行“潮汐式”全自动化管理 [23] - 利用Fluid的跨Namespace共享能力,解决了公共模型仓库与多业务项目组并存场景下的资源冗余与管理混乱问题 [24][25] 实施收益与效果 - **性能加速**:大模型加载耗时从基线(跨地域直连存储)的36分钟,经传统Alluxio优化后缩短至14分钟,最终通过Fluid智能预读降至3分钟,实现12倍的性能提升,使Serverless算力具备生产可用性 [28][33] - **成本节约**:通过跨Namespace数据共享机制,缓存层内存占用降低60%-80%;通过“潮汐式”自动伸缩,整体GPU资源闲置率降低了约20% [27][29][33] - **稳定性提升**:Fluid缓存层充当流量“挡板”,消除了数百个Pod并发启动时对底层存储的“惊群效应”冲击,保障了高并发下的服务稳定性和P99延迟 [30][33] - **效率提升**:为算法团队提供了统一的数据访问接口和环境一致性体验,基础设施复杂度被透明化 [31][33]
Woodward Publishes Fiscal Year 2025 Annual Report
Globenewswire· 2025-12-23 05:30
财务业绩 - 2025财年净销售额达36亿美元,同比增长7% [1] - 2025财年净利润达4.42亿美元,同比增长19% [1] - 2025财年稀释后每股收益为7.19美元,同比增长20% [1] 战略里程碑 - 完成对一家行业领先的机电作动业务的收购 [2] - 获得空客A350飞机某些扰流板作动系统的订单,标志着公司首次在商用飞机应用中获得主飞行控制系统订单 [2] - 位于南卡罗来纳州斯帕坦堡县的新先进制造工厂取得进展 [2] 公司概况 - 公司是航空航天和工业设备市场能源转换与控制解决方案的全球领导者 [3] - 公司业务涵盖流体、燃烧、电气、推进和运动控制系统的设计、制造和服务 [3] - 公司总部位于美国科罗拉多州柯林斯堡 [3]
United Rentals(URI) - 2025 Q2 - Earnings Call Presentation
2025-07-24 20:30
业绩总结 - 2024年调整后的EBITDA为72亿美元,同比增长4.4%[11] - 2024年总收入为153亿美元,同比增长7.1%[11] - 2024年调整后的EBITDA利润率为46.7%[11] - 2024年净收入为6.22亿美元,净利率为15.8%[166] - 2024年自由现金流为12.01亿美元[166] - 2024年专业收入增长为24.4%,不包括收购的Yak地区收入时为16.6%[64] 用户数据 - 截至2025年6月30日,员工人数约为27,500人[26] - 截至2025年6月30日,全球分支机构数量为1,713个[37] - 截至2025年6月30日,设备租赁总规模约为220亿美元,平均设备年龄为49.9个月[12][33] 市场表现 - 公司在北美市场的市场份额为第一[11] - 2024年专业收入占总收入的33.4%[12] - 2024年专业业务的10年复合年增长率为20.1%[41] - 2014年至2024年专业收入的年复合增长率为20.1%[62] - 2023年专业收入增长为19.7%,而一般租赁收入增长为13.1%[64] 未来展望 - 2024年总收入预计增长10.4%[105] - 2024年调整后的EBITDA预计增长10.5%[105] - 2024年调整后的每股收益(EPS)年复合增长率为20.1%[105] - 2025年预计自由现金流为25亿美元,FCF利润率为15.7%[124] - 2025年总收入预计在158亿美元到161亿美元之间[171] 财务健康 - 当前流动性总额为29.96亿美元,长期债务到期日为2027年[135] - 目标全周期杠杆比率为1.5x-2.5x[133] - 自2012年以来,回购已向股东返还81亿美元的多余现金,减少了超过40%的流通股[145] - 最近10年累计自由现金流为924亿美元[124] 收购与扩张 - 公司执行了约250次收购,以增强北美市场的存在[21] 其他信息 - 2024年自由现金流表现强劲且具有韧性[123] - 10年平均现金转换率为142.2%[124] - 2025年每股季度分红为1.79美元,较2024年增长10%[145]
MIT终身教授何恺明,入职谷歌了
量子位· 2025-06-26 10:11
何恺明职业动向 - AI大牛何恺明在获得MIT终身教职后,宣布以兼职形式加盟谷歌DeepMind担任杰出科学家[1][5] - MIT官网显示其成为2025年工程学院11位新晋终身教职人员之一,距离正式入职MIT仅一年左右[2][3] - 在DeepMind的职位隶属基础研究组,直属领导职级为L8,距离CEO哈萨比斯相差三级管理层级[6] 学术成就与行业影响 - 何恺明是计算机视觉领域标杆人物,其2009年雾霾去除论文获CVPR最佳论文(亚洲学者首次)[9][10] - 2015年提出的ResNet获ILSVRC 2015分类任务冠军,论文引用量超28万次,成为其最高引研究[11][12] - ResNet框架被Transformer、AlphaGo Zero、AlphaFold及多数GenAI模型采用[13] - 在FAIR期间主导的Mask R-CNN获ICCV 2017最佳论文,解决实例级对象分割问题[15] - 谷歌学术总引用量达71万次,近期聚焦模型性能优化(如表示正则化、高压缩Tokenizer)[19][20] 与谷歌DeepMind的合作基础 - 2024年2月与DeepMind全华人团队合作提出分形生成模型,实现逐像素高分辨率图像生成并开源代码[23][24] - 2023年联合开发Fluid模型,突破视觉自回归模型扩展瓶颈,提升连续token生成质量[25][26][29] - 历史合作表明双方在生成模型领域有深度技术协同,此次加盟属强强联合[28]