Workflow
OCI Zettascale10
icon
搜索文档
甲骨文推出全球最大AI超算,作为OpenAI「星际之门」算力核心
36氪· 2025-10-21 09:12
产品发布与规格 - 甲骨文在AI World 2025大会上发布全球最大云端AI超级计算机OCI Zettascale10 [1] - 该系统由80万块NVIDIA GPU组成,峰值算力高达16 ZettaFLOPS [1][3] - 平均每块GPU贡献约20 PetaFLOPS算力,接近英伟达最新一代Grace Hopper芯片水平 [3] 技术架构与创新 - 系统采用甲骨文独创的Acceleron RoCE网络架构,实现GPU间高效互联 [1][7] - Acceleron架构采用多平面、扁平化网络设计,降低通信延迟并提升容错能力 [7] - 该架构引入线性可插拔光学模块等新技术,在维持400G/800G带宽的同时降低能耗与冷却成本 [7] - NVIDIA公司高管认可该全栈优化的“计算结构”是AI工业化的基础 [7] 战略合作与应用 - OCI Zettascale10是OpenAI在德州阿比林共建的“星际之门”旗舰AI超级计算集群的算力骨干 [1][4] - OpenAI基础设施部门副总裁指出,定制RoCE网络在“千兆瓦级”规模下最大化性能并优化能耗 [6] - 该系统已开始为业界最严苛的AI工作负载提供动力,具备实战验证 [6] 市场定位与竞争 - 甲骨文通过此举在急速升温的AI算力军备竞赛中强势布局云端AI基础设施 [1][3] - 公司面临微软、谷歌、亚马逊等云计算巨头的激烈竞争,云端AI算力版图正迅速扩张 [12] - 为吸引客户,甲骨文发布“多云通用积分”计划,允许客户在多家云服务间自由调配甲骨文数据库和OCI服务 [13] 产品规划与行业观察 - 甲骨文计划在2026年下半年正式向客户提供Zettascale10集群服务,目前已接受预订 [8] - 业内观察者对16 ZFLOPS的峰值算力持保留态度,认为该数据可能基于理论峰值或低精度AI计算指标,尚未经独立机构验证 [9][10] - 系统的实际表现与可持续交付性能有待明年投入使用后通过基准测试和用户反馈来检验 [11]
腾讯研究院AI速递 20251021
腾讯研究院· 2025-10-21 00:01
AI基础设施与算力 - 甲骨文推出全球最大云端AI超级计算机OCI Zettascale10,由80万块NVIDIA GPU组成,峰值算力达16 ZettaFLOPS,计划于2026年下半年向客户提供服务[1] - 该超算采用独创Acceleron RoCE网络架构,通过每块GPU的NIC充当小型交换机连接多个隔离网络平面,以降低通信延迟并确保故障时自动切换路径[1] 大语言模型进展 - 谷歌Gemini 3.0疑似以lithiumflow(Pro版)和orionmist(Flash版)马甲上线评测,Gemini 3 Pro成为首个能精确识别钟表时间的AI模型,在SVG绘制和音乐作曲方面表现出色[2] - 谷歌向所有开发者开放Gemini API调用谷歌地图工具功能,可整合2.5亿个地点的位置感知,按每1000条有事实依据的提示收费25美元,支持路线规划等场景[7] - DeepSeek开源3B参数OCR模型DeepSeek-OCR,通过光学二维映射技术实现长文本上下文压缩,压缩率小于10倍时OCR精度达97%[3] AI应用与产品创新 - 元宝AI录音笔推出新功能,基于腾讯天籁降噪技术实现录音转写,并具备“内心OS”功能解读发言人弦外之音,支持多人发言智能拆分[4] - Vidu Q2参考生功能正式上线,推理速度比Q1版本快3倍,支持多主体一致性生成,免费用户可生成最长30秒视频,付费用户最长可延长至5分钟[5][6] - 宇树发布180cm仿生人形机器人H2,体重70kg,关节总数31个比前代增加约19%,可跳芭蕾舞和表演武术,应用场景扩展至娱乐演示和陪伴服务[9] AI性能评测与市场表现 - 实盘交易实验显示DeepSeek V3.1在1万美元本金下盈利超3500美元排名第一,仅进行5次交易,而Gemini 2.5 Pro进行45次交易成为赔钱最多的模型[8] - DeepSeek-OCR模型在OmniDocBench测试中仅用100个视觉token超越GOT-OCR2.0,单张A100-40G GPU每天可生成超20万页训练数据[3] 行业专家观点 - Karpathy预测AGI仍需十年时间,认为强化学习效率极低像“通过吸管吸取监督信号”,需要新的学习机制[10] - 提出“认知核心”概念,建议通过精简LLMs和提高泛化能力,预测未来模型将先变大再变小,最终收敛向更小更专注的认知内核[11]
智能早报丨李飞飞团队发布世界模型新成果;吉利旗下具身智能公司成立5个月就解散
观察者网· 2025-10-17 10:28
人工智能模型与平台进展 - 李飞飞团队发布实时世界模型RTFM,具备实时运行、持久性和3D一致性,仅需单张H100 GPU便能以交互级帧率完成推理运算[1] - 谷歌更新视频生成模型Veo 3.1,增强叙事与音频控制能力,支持最长148秒1080p视频生成,并接入Gemini API与Vertex AI平台[9] - 微软为Windows 11推出AI升级,全面增强Copilot功能,用户可通过“Hey Copilot”唤醒词以语音指令操作AI助手[6] 算力基础设施发展 - 甲骨文推出云端AI超级计算机OCI Zettascale10,连接数十万NVIDIA GPU形成多千兆瓦级集群,峰值性能达16 zettaFLOPS[10] - 工信部启动城域“毫秒用算”专项行动,目标到2027年实现城域算力1毫秒时延圈覆盖率不低于70%[7] 具身智能与机器人行业动态 - 智元机器人发布新一代工业级交互式具身作业机器人精灵G2,已获数亿元订单并开启首批商用交付,具备工业、物流、导览等多场景通用能力[8] - 吉利系具身智能明星企业一星机器人(OneStar)宣布解散,该项目于2025年5月成立,此前曾获百度风投等投资,技术团队可能单独创业[2][3] 智能网联汽车与政策 - 2025世界智能网联汽车大会开幕,工信部将深入推进“车路云一体化”应用试点,加快自动驾驶相关标准制定[4] - 小米集团雷军呼吁全行业团结一致,共建共享智能网联汽车新生态,共同抵制网络水军等乱象[4][6] 硬件技术与能源 - 中国科学家破解固态电池充电关键难题,使电池性能实现跨越式升级,续航里程有望从500公里突破至1000公里[7] - 光伏行业“反内卷”持续受到关注,传闻多晶硅收储平台已成立但消息不实,潜在收储需近千亿元资金支持[12] AR生态与线下布局 - 影目科技发布INMO GO3 AI智能眼镜,并打造AI+AR产业生态平台“影目世界”,联合腾讯、蚂蚁集团等共建内容生态,计划布局2000+体验门店[11]