Workflow
Acceleron
icon
搜索文档
Oracle (NYSE:ORCL) 2025 Conference Transcript
2025-10-16 01:17
涉及的行业或公司 * 公司为甲骨文公司及其云基础设施部门[1] * 涉及的行业包括云计算、人工智能基础设施、数据库、社交媒体平台和AI模型开发[26][78] 核心观点和论据 OCI的战略目标与设计理念 * 公司的使命是构建最高性能、最低成本和最安全的基础设施,目标是达到自身想象的绝对最佳水平,而非仅仅超越竞争对手[5][6] * 为实现目标,公司早期做出了关键架构选择,包括优先采用裸机服务器,主要基于安全原因,确保云提供商无法访问客户机器的内存和CPU,同时为虚拟机和可扩展平台提供基础[11][12][13] * 公司确保所有区域提供所有服务,避免出现服务可用性不一的复杂情况,并承诺在所有区域和区域类型中应用统一的性能SLA和一致的定价,简化客户体验[16][17][18] 性能、成本与安全的技术实现 * 在网络方面,公司实现了区域内数据中心间的免费数据传输,并将互联网出口费用优化至比其他提供商低10倍,并与微软和谷歌等合作实现多云互联的零出口费用[19] * 通过KSplice实现零停机内核升级和实时迁移等技术,优化单个虚拟机的可用性和性能,确保硬件维护无需客户重启干预[20] * 计算服务提供高达竞争对手7000倍的配置灵活性,但通过统一的每核心和每GB内存定价保持成本简单透明[21] * 基础设施设计为可上下扩展,运营设计为可横向扩展,这使得公司能够为单个客户提供专用区域,甚至将OCI部署到其他云环境中[22][23] 新一代架构Acceleron的发布 * 公司宣布了Acceleron项目,这是对其OCI基础架构的核心升级,结合了软件和架构,旨在安全地加速所有输入输出[58][59] * Acceleron的关键增强包括:可扩展的专用RDMA网络架构,以满足AI工作负载对集群规模和吞吐量的需求[61];通过消除中间盒实现网络功能解中介,以降低延迟和成本[62][63][64][66];与AMD合作开发的新型融合NIC,在单张智能网卡上实现客户与提供商NIC的硬分区,兼具安全性和性能提升,并提供NVMe接口和线路速率加密[67][68][69][70];零信任数据包路由,将网络架构与安全策略分离,提高安全性和易用性[71][72];多平面网络,在幕后实现多个网络平面,为主机呈现单一平面,从而提高可用性、降低成本和提升性能,同时保持易用性[75][76][77] AI数据平台与多云战略 * 公司宣布推出AI数据平台,整合了最佳AI模型、AI数据库和新的Gen AI代理平台,旨在安全地将AI模型与客户的私有数据结合[103][104][105][106][109] * AI数据库作为统一平台,可挂载外部目录,通过真实应用安全性实施细粒度访问控制,并维护最新向量索引[107][108] * 推出多云通用积分,允许客户一次签约,即可在任何云中以相同价格和功能部署其数据库服务[111] * 同时宣布专用区域25的正式上市,将专用区域的占地面积从最初的50多个机柜缩小到仅需3个机柜,使其更易于客户部署[112] 客户案例与合作伙伴验证 TikTok / ByteDance * TikTok是全球性平台,拥有超过10亿用户,仅在美国就有超过1.7亿用户,每天生成约2000万个视频,并支持75万家小企业[32][33] * 巨大的规模转化为数百万台服务器、泽字节规模的存储和数百Tbps的网络容量需求,最小的部署也需要数万台服务器[33] * 与OCI的集成深度在网络层,需要数百Tbps的互连流量和数千个高速连接,推动了100G和400G高速连接的发布[39] * 自2021年首次部署以来,月活跃用户增长了60%,基础设施需求随之激增[39][43] * TikTok Shop等新功能带来了独特挑战,例如直播数量在过去三年翻了一番,黑色星期五等购物活动的单日购物者数量甚至翻倍,这要求与OCI团队紧密合作,进行需求规划和灵活的容量调整[44][45] * 双方建立了联合稳定性目标,共享基础设施层的完全透明度,并共同编写操作流程,将稳定性置于首位[51][52][53] OpenAI * OpenAI面临的核心挑战是计算容量约束,需要工业化计算,从电力到硅片优化每一个环节[85] * 公司提供了200兆瓦的容量、智能集群设计以及对安全需求的深刻理解,解决了OpenAI研究人员计算资源不足的紧迫问题[81][82] * 合作范围广泛,包括与AMD和博通等合作伙伴共同设计下一代技术,以在未来两年内实现10倍的增长[86] * OpenAI的运营模式已从大规模预训练转变为需要可灵活调配的集群,以应对如Sora发布等突发需求,这要求基础设施具备多功能性[89][90][91] * 公司在11个月内完成了Abilene数据中心的建设,而类似规模的数据中心通常需要四年规划,其基础设施的可替代性使得OpenAI可以与其他客户使用相同的技术,降低了财务风险[96] * 在全球扩张中,公司成为OpenAI应对不同国家政策环境和安全标准的"一站式商店",支持其每年10倍的增长[99][100] 其他重要内容 * 公司强调其基础设施的可扩展性不仅支持了TikTok和OpenAI的巨大增长,也从服务这些客户的过程中获得了宝贵的经验和学习机会,推动了自身平台的进步[54][55][83] * 公司承诺持续改进,通过成千上万项细微的改进积累,使云服务日臻完善[113]