Workflow
NVIDIA Hopper GPU
icon
搜索文档
HIVE Digital Technologies subsidiary BUZZ HPC launches Nvidia Hopper GPU cluster in Quebec
Proactiveinvestors NA· 2025-06-24 20:41
关于作者背景 - 作者Emily Jarvie曾担任澳大利亚社区媒体的政治记者 后专注于商业、法律及新兴迷幻剂领域的科学进展报道 [1] - 其作品发表于澳大利亚、欧洲和北美多家知名媒体 包括The Examiner、The Advocate等 [1] 关于出版商定位 - 出版商Proactive为全球投资者提供快速、可操作性的商业与金融新闻 内容由专业新闻团队独立制作 [2] - 团队覆盖全球主要金融中心 包括伦敦、纽约、多伦多等地的分支机构 [2] 内容覆盖领域 - 专注于中小市值公司 同时涵盖蓝筹股、大宗商品及广泛投资主题 [3] - 重点领域包括生物制药、矿产资源、电池金属、加密货币及电动汽车技术等 [3] 技术应用策略 - 采用前瞻性技术辅助内容生产 但核心创作仍依赖人类专业经验 [4] - 选择性使用自动化工具与生成式AI 所有内容最终由人工编辑审核发布 [5]
Nebius and Saturn Cloud Launch First-in-Class AI MLOps Cloud with Support for NVIDIA AI Enterprise
Newsfile· 2025-06-11 19:00
合作发布 - Nebius与Saturn Cloud合作推出首个支持NVIDIA AI Enterprise的AI MLOps云解决方案,整合了Nebius的AI云基础设施与Saturn Cloud的MLOps平台 [1] - 解决方案基于NVIDIA Hopper GPU,提供企业级AI/ML基础设施和MLOps平台,支持即时注册使用Jupyter笔记本等开发工具 [2] - 该服务成本显著低于传统云服务提供商,适用于各类用例 [2] 解决方案特点 - 企业用户可在Nebius虚拟私有云环境中部署Saturn Cloud,符合企业IT安全标准,并配备企业级SLA和单点登录(SSO)功能 [3] - 个人和团队用户可加入Saturn Cloud的托管层级,现有用户超过10万,支持即时注册和云资源部署,仅需提供信用卡即可使用 [4] - 提供NVIDIA加速的Nebius AI Cloud访问权限,无需长期投资加速计算系统,支持容量预留以进一步降低成本 [5] 技术优势 - 解决方案集成NVIDIA AI Enterprise软件栈,包括NVIDIA NIM微服务、NeMo和RAPIDS等,运行于Nebius高性能基础设施 [6] - 用户可通过Saturn Cloud Pro立即访问NVIDIA Hopper GPU资源,几分钟内开始开发 [7] - 企业团队可在其Nebius账户中使用Saturn Cloud进行部署 [8] 公司背景 - Nebius总部位于阿姆斯特丹,纳斯达克上市,全球拥有约400名硬件和软件工程师及内部AI研发团队 [9] - Nebius AI云平台为AI创新者提供超大规模云体验,涵盖计算、存储、托管服务和工具 [10] - Saturn Cloud是全球唯一提供多云端按需GPU的MLOps平台,简化大规模机器学习模型开发与部署 [10]
中金 | AI进化论(2):模型+工程创新持续唤醒算力,DeepSeek撬动推理需求蓝海
中金点睛· 2025-02-28 07:34
中金研究 在本系列报告的第一篇中,我们深度讨论了DeepSeek(以下简称DS)技术创新对训练硬件的需求变化。除了训练以外,DS团队在最新一系列的开源成 果发布中针对推理任务也做出了双重维度的创新:一方面通过模型优化降低硬件资源占用,另一方面通过硬件工程化优化以发挥硬件最大效能。 点击小程序查看报告原文 Abstract 摘要 传统的Transformer模型通常采用多头注意力机制(Multi-Head-Attention, MHA),但在生成过程中,随着前置序列的长度变长,需要读取的KV cache也将 越来越大,数据的传输成本增加,KV缓存会限制推理效率。减少KV缓存的策略包括MQA和GQA等,它们所需的KV缓存规模较小,但性能却无法与 MHA相比。 图表1:MHA、GQA、MQA、MLA 架构对比 模型创新:借助MLA、NSA等技术优化加速推理。 在上一篇聚焦训练任务的报告中,我们重点解读了DS大语言模型中前馈网络(FFN)架构部分由稠密 演化到稀疏(MoE,专家模型)产生的影响,同时,DS在注意力机制(Attention)部分也做出了创新。针对传统Attention部分需要计算所有词对之间关联 的特性 ...