Workflow
NVIDIA Nemotron
icon
搜索文档
BandM8 Debuts Its Music-to-Music AI Platform at NVIDIA GTC 2026
Globenewswire· 2026-03-19 03:00
公司产品与核心定位 - 公司推出了一款基于网络的音乐到音乐AI创意平台 该平台是一个实时创作代理 可将单个音乐人实时转变为一整支乐队 [1] - 平台的核心定位是“音乐与AI结合”而非“AI与音乐结合” 旨在作为创意工具助手帮助任何人创作音乐 无需录音工程师 无需等待 没有技术障碍 [3] - 与文本提示音乐工具不同 该平台让创作者保持控制权 通过自然的音乐互动来塑造编曲、配器和感觉 并保留对所创作内容的完全所有权 [5] - 该平台的目标是增强而非取代艺术家 当技术能够聆听并以音乐方式回应时 它就成为了合作者 [5] 技术架构与合作伙伴 - 平台的AI模型在NVIDIA A100 Tensor Core GPU上训练 并部署在NVIDIA RTX PRO 6000 Blackwell工作站版上进行推理 [2] - 平台使用TensorRT作为推理后端 并采用PyTorch与NVIDIA CUDA进行模型训练 [2] - 平台利用NVIDIA Nemotron开放模型系列作为对话前端 通过模型通信协议与平台模型通信 结合专有的低延迟引擎 实现实时对话式音乐生成 [2][3] - 整个技术栈基于NVIDIA AI堆栈 从加速计算到Nemotron等AI模型 以提供响应迅速、实时的体验 [4] 产品核心特点与优势 - 采用“音乐到音乐”而非“文本到音乐”的模式 用户通过控制输入来控制输出 [5] - 提供对话式音乐控制 用户可使用自然的音乐语言指导音乐 无需技术工程技能 每次生成都可以演进 如同真实的演奏会话 [5] - 设计上采用“MIDI优先” 每个音轨都是完全可编辑、灵活的 并可直接用于任何数字音频工作站流程 [1][5] - 能够瞬间将想法转化为完整的音轨 提供已混音的音频轨道供播放和分享 以及完全可编辑的多轨MIDI文件 并无缝集成到专业工作流程中 [5] - 平台架构为低能耗、注重环保的AI模型通信协议 由Nemotron驱动 证明了先进AI与可持续性可以共存 [5] 行业影响与市场定位 - 该平台由音乐和游戏领域的领导者构建 让音乐人和音乐爱好者能以灵感迸发的速度进行创作 [4] - 其智能MIDI伴奏能将即兴想法瞬间转化为精良的音轨 无需工程技能 [4] - 该平台在NVIDIA GTC上展示了先进基础设施如何能够释放而非自动化人类创造力 这被视为一种增强而非自动化 [6] - 平台被定位为下一代艺术家、制作人和合作伙伴的创意音乐到音乐副驾驶 [7]
Geely Expands Strategic Partnership with NVIDIA Across Physical, Enterprise, and Industrial AI
Globenewswire· 2026-03-18 21:19
核心观点 - 吉利汽车集团正与英伟达深化战略合作伙伴关系 合作范围超越传统硬件供应 扩展至物理AI 企业AI和工业AI三大核心维度 旨在构建全链条智能出行生态系统[1][5] 合作维度与具体内容 物理AI (智能汽车与自动驾驶) - 吉利与法雷奥的G-ASD系统将集成英伟达Alpamayo Cosmos和NuRec技术 以提升开发 仿真和验证效率[2] - 公司将与生态系统合作伙伴共同开发并商业化Robotaxi 采用英伟达DRIVE AGX Hyperion自动驾驶架构 以增强复杂驾驶场景下的泛化能力和安全冗余[4] - 公司将率先在行业内部署由英伟达与联发科联合开发的Dimensity Auto Cockpit C-X1座舱平台 该平台采用英伟达Blackwell GPU及第二代Transformer引擎 专为LLM和VLM推理性能优化 具有领先的令牌处理吞吐量和内存带宽效率[7] - 公司将利用英伟达DRIVE AGX平台及一系列优化的AI模型 为AI Box差异化车载应用提供支持 持续推动车内创新[7] 企业AI (云计算与基础设施) - 公司将利用英伟达AI超级计算平台 结合英伟达Nemotron开源模型 NeMo软件和英伟达AI Enterprise套件 旨在加速企业级AI演进 从研发数据处理升级至智能业务决策 推动公司运营向“AI组织”转型[5] 工业AI (制造与研发数字化) - 合作涵盖视觉AI代理 基于英伟达Omniverse库的工厂自动化以及AI驱动的工业设计与CAE工作流程 旨在通过AI干预显著缩短研发周期 实现高度柔性化和自动化的制造流程[5][8] 战略目标与行业影响 - 此次合作旨在构建全链条智能出行生态系统[5] - 随着极氪8X等全新车型的推出 公司正加速将AI能力从实验室推向真实场景 开启智能出行新时代[9]
Schneider Electric teams with NVIDIA to develop validated blueprints to design, simulate, build, operate and maintain gigawatt-scale AI Factories
Globenewswire· 2026-03-17 05:00
文章核心观点 施耐德电气与英伟达及AVEVA深化合作 共同发布多项关键技术进展 旨在为千兆瓦级AI工厂提供从设计、模拟、建造到运维的全生命周期基础设施解决方案[1][2][8] 关键技术合作与产品发布 - 发布全新的英伟达Vera Rubin参考设计 该设计针对英伟达Vera Rubin NVL72机柜系统 验证了供电与冷却方案 并与施耐德电气的控制参考设计集成 设计采用ETAP模型进行电气系统设计 采用ITD CFD模型进行布局与气流模拟[1][3] - AVEVA与英伟达联合发布新的生命周期数字孪生架构 旨在最大化GPU效率并加速千兆瓦级AI工厂的部署 AVEVA的工程和运营软件现已嵌入英伟达Omniverse DSX蓝图及生态系统 预计将通过特定领域模拟、数字可视化和协同设计工具加速“time-to-token”并推动显著的工程优化[1][4] - 在英伟达Omniverse环境中组装系统架构后 AVEVA执行多领域模拟以验证实际工况下的运行行为 包括配电、热动力学、气流性能及控制的计算模型 从而实现迭代设计优化、多种负载与环境场景的快速评估 以及在物理环境建造前的最终系统验证[5] - 施耐德电气成功测试了英伟达Nemotron模型 以驱动新型智能体AI告警管理功能 该服务利用跨多个系统的实时流式物联网数据 自主分析、诊断并推荐行动方案 旨在更快、更一致地解决问题 减少不必要的调度并增强运营韧性[1][7] 参考设计的具体优势与特性 - 支持新的配电方案 将供电电压提升至480 VAC[11] - 允许更高的TCS回路供水温度至45°C 以提升效率[11] - 支持新的IT机房架构 即AI机柜集群共享集中式网络、存储、CPU和支持机柜 这使得每个英伟达机柜级系统能保持物理紧邻 同时为GPU机柜提供独立的更高电压 以支持更大集群并优化电力输送[11] - 通过设计数据中心以适应GPU机柜的不同工作点(MaxP和MaxQ)来最大化token性能 在MaxQ模式下运行可实现每瓦特更多token 以克服电力限制并通过冗余优化计算性能 总体而言 该参考设计在结合英伟达MaxQ工作点时能实现更高的每瓦特token数[11] 合作背景与过往成果 - 此次发布基于施耐德电气与英伟达长期的创新合作基础[8] - 施耐德电气与Switch和英伟达合作 将其专业知识应用于Switch的LDC EVO™操作系统 结合英伟达Omniverse库和OpenUSD 该平台可实现Switch数据中心设施内所有系统的实时自动化 用于查看和监控热建模、电气模拟、实景捕捉、建设生命周期管理等[12] - ETAP将其行业领先的电气建模集成到英伟达Omniverse中 创建了统一的数字孪生环境 用于复杂电力系统的快速设计与验证[12] - 2025年11月 施耐德电气与ETAP、AVEVA宣布加入OpenUSD联盟 致力于与英伟达Omniverse协同塑造可互操作数字孪生和SimReady 3D资产的未来[12] - 2025年10月 施耐德电气宣布支持英伟达主导的向800 VDC电源架构的行业转型 这是下一代数据中心采用的新兴高密度机柜系统的关键要求[12] - 2025年9月 施耐德电气宣布了支持英伟达Mission Control和英伟达GB300 NVL72的新参考设计 该设计包含施耐德电气行业领先的ETAP和EcoStruxure IT Design CFD模型 允许用户利用数字孪生模拟特定供电和冷却场景以优化独特应用的设计[12][13] 行业影响与高管观点 - 随着AI工作负载规模和复杂性增加 数据中心设计的容错空间变得极小 大规模交付AI需要紧密集成的电气、冷却和数字架构 以支持前所未有的性能需求同时保持峰值能效[6] - 千兆瓦级AI工厂需要一类全新的高能效且高度可预测的基础设施 施耐德电气与英伟达的合作正为客户提供加速全球“time-to-token”所需的电力、冷却和数字孪生架构[6] - 通过结合先进软件、数字孪生和经过验证的参考设计 运营商可以在部署单个机柜前模拟和优化基础设施 这种方法降低了风险 加速了部署 并确保了为下一代AI工厂供电所需的效率和韧性[6]
IBM Announces Expanded Collaboration with NVIDIA to Advance AI for the Enterprise
Prnewswire· 2026-03-17 04:30
合作概览 - IBM与NVIDIA宣布扩大合作,旨在帮助企业大规模实现AI从试点到生产的运营化[1] - 合作涵盖GPU原生数据分析、智能文档处理、本地与受监管基础设施部署、云以及咨询服务等多个领域[1] - 合作旨在解决企业AI规模化应用面临的共同障碍:数据碎片化与难以访问、基础设施不适用于高级AI工作负载、部署不符合受监管行业的合规与数据驻留要求、以及缺乏实施部署的专业指导[2] 技术整合与解决方案 - 双方合作开发开源集成,通过IBM watsonx.data的SQL引擎Presto与NVIDIA cuDF加速,提升企业从海量数据集中提取智能的性能并降低成本[3] - 针对非结构化数据,结合IBM的Docling与NVIDIA Nemotron开放模型,实现企业级的智能文档提取,Docling负责将文档标准化并转换为AI就绪格式,Nemotron模型加速多模态内容摄取[7] - 在基础设施层,NVIDIA选择IBM Storage Scale System 6000为其GPU原生高级分析引擎提供10PB高性能存储,该系统已在NVIDIA DGX平台获得认证[9] - 对于有数据驻留和监管要求的企业与政府,双方正探索整合IBM Sovereign Core与NVIDIA基础设施及Nemotron模型,以支持完全在区域边界内运行的GPU密集型AI工作负载[9] 性能验证与客户案例 - 在雀巢(Nestlé)的“订单到现金”数据集市进行了生产环境验证,该数据集市覆盖186个国家,处理44张表中的数TB数据[4] - 使用NVIDIA软件和GPU加速的IBM watsonx.data Presto引擎,将查询运行时间从原先CPU上的15分钟缩短至3分钟,实现了83%的成本节约和整体30倍的性价比提升[5] - 雀巢表示,该概念验证展示了以更低成本在几分钟内刷新全球运营数据的能力,目标是将此能力转化为切实的业务影响,例如提升制造和仓储等领域的决策速度[6] 市场拓展与产品规划 - IBM计划在2026年第二季度初于IBM Cloud上提供NVIDIA Blackwell Ultra GPU,用于大规模训练、高吞吐量推理和AI推理[10] - 该技术也将整合到与NVIDIA合作的Red Hat AI Factory中,以及具备企业级合规与数据驻留控制的VPC服务器中[10] - IBM咨询计划通过其企业AI平台“IBM Consulting Advantage”,向客户提供整合了NVIDIA的Red Hat AI Factory,旨在简化企业准备数据、构建模型和部署AI的流程[11]
NVIDIA Ignites the Next Industrial Revolution in Knowledge Work With Open Agent Development Platform
Globenewswire· 2026-03-17 04:22
公司战略与产品发布 - 英伟达宣布与合作伙伴共同推出用于自主、自我演进企业AI智能体的开源软件,旨在开启AI新时代,加速软件和知识工作的代际变革 [2] - 公司发布NVIDIA Agent Toolkit,为企业和开发者提供开源模型和软件,用于构建可自主决定如何完成任务以提升生产力的工具 [3] - 该工具包包含NVIDIA OpenShell™,这是一个开源运行时,通过强制执行基于策略的安全、网络和隐私护栏,使自主智能体(或“claws”)的部署更安全 [3] - NVIDIA Agent Toolkit包含开放模型(如Nemotron)、开放智能体(如AI-Q)、开放技能(如cuOpt)和开放运行时(如OpenShell),开发者可用其创建能够自主行动的专业AI智能体 [4] 核心技术优势 - 基于NVIDIA AI-Q开放智能体蓝图,开发者可创建能够感知、推理并基于企业知识采取行动的定制AI智能体,自动选择正确的数据源和分析深度以提供精准、上下文感知的答案 [5] - AI-Q的混合架构使用前沿模型进行编排,使用NVIDIA Nemotron开放模型进行研究,可将查询成本降低50%以上,同时提供世界级的准确性 [6] - NVIDIA利用AI-Q蓝图开发了在DeepResearch Bench和DeepResearch Bench II排行榜上排名第一的AI智能体 [6] - NVIDIA OpenShell为自主智能体提供所需的生产力访问权限,同时强制执行基于策略的安全、网络和隐私护栏 [7] - 公司正与包括思科、CrowdStrike、Google、Microsoft Security和TrendAI在内的安全提供商合作,构建OpenShell与其网络安全和AI安全工具的兼容性 [7] 生态合作与集成 - 智能体工程公司LangChain(其开源框架下载量已超过10亿次)正与英伟达合作,将Agent Toolkit(包括AI-Q、OpenShell和Nemotron开放模型、数据集和工具)集成到其LangChain深度智能体库中,用于开发高级、准确的企业AI智能体并进行大规模运行 [8] - 包括Adobe、Atlassian、Amdocs、Box、Cadence、Cisco、Cohesity、CrowdStrike、Dassault Systèmes、IQVIA、Red Hat、SAP、Salesforce、Siemens、ServiceNow和Synopsys在内的领先软件平台正利用NVIDIA Agent Toolkit软件推进企业和实体AI智能体 [10] - Adobe将采用Agent Toolkit软件作为基础,在个性化、更安全和更具成本效益的环境中运行混合、长期运行的Adobe创意、生产力和营销智能体 [9] - IQVIA已将NVIDIA Nemotron和其他Agent Toolkit软件与IQVIA.ai(一个统一的智能体AI平台)集成,已在内部团队和客户环境中部署超过150个智能体,包括前20大制药公司中的19家 [13] - Salesforce正与英伟达合作,使客户能够使用Agentforce为服务、销售和营销任务构建、定制和部署AI智能体,并引入了一个参考架构,员工可使用Slack作为Agentforce智能体的主要对话界面和编排层 [13] 开发者与部署支持 - 开发者可在build.nvidia.com上探索NVIDIA Agent Toolkit和OpenShell,它们可在包括Baseten、Bitdeer AI、CoreWeave、DeepInfra、DigitalOcean、GMI Cloud、Fireworks、Lightning、Together AI和Vultr在内的推理提供商和NVIDIA云合作伙伴上运行 [11] - 开发者也可将OpenShell与LangChain一起使用,并从GitHub下载以在专用的NVIDIA GeForce RTX PC和笔记本电脑或NVIDIA RTX工作站,以及来自Altos Computing、ASUS、Dell Technologies、GIGABYTE、HP、Lenovo、MSI和Supermicro的NVIDIA DGX Station和NVIDIA DGX Spark超级计算机上本地运行 [12] - 企业也可在包括亚马逊AWS、Google Cloud、Microsoft Azure、Microsoft Security和Oracle Cloud在内的云服务提供商的AI工厂基础设施上构建和运行AI智能体 [13]
NVIDIA Expands Open Model Families to Power the Next Wave of Agentic, Physical and Healthcare AI
Globenewswire· 2026-03-17 04:15
文章核心观点 英伟达宣布扩展其开源模型家族,以推动下一代智能体、物理世界及医疗保健AI的发展 公司推出了多个新模型,旨在赋能开发者和科学家构建能够在数字和现实世界中推理与行动的智能系统[2][13] 开源模型组合与战略意义 - 开源AI已成为全球创新驱动力 英伟达扩展的开源模型组合,包括用于智能体系统的Nemotron、用于物理AI的Cosmos、用于自动驾驶汽车的Alpamayo、用于机器人的Isaac GR00T以及用于生物医学研究的BioNeMo,为各行业解锁新能力提供了先进的模型和框架[3] - 公司认为,开源模型对于在全球范围内推进创新至关重要 其模型家族将智能扩展到语言之外,使全球开发者能够构建智能体,并推动数字和物理行业的突破[4] 智能体AI模型:Nemotron系列 - **Nemotron 3全能理解多模态模型**:为AI智能体提供支持,实现自然对话、复杂推理和先进的视觉能力[5][16] - **Nemotron 3 Ultra模型**:在NVIDIA Blackwell平台上使用NVFP4格式,提供前沿智能,吞吐效率提升5倍,适用于代码助手、搜索和复杂工作流自动化等AI原生应用[17] - **Nemotron 3 Omni模型**:集成音频、视觉和语言理解,使AI智能体能高效、准确地从视频和文档中提取见解[17] - **Nemotron 3 VoiceChat模型**:支持实时对话,AI可同时聆听和响应,在一个系统中结合了自动语音识别、大语言模型处理和文本转语音功能[17] - **Nemotron安全模型与检索流程**:通过检测文本和图像中的不安全内容来增强可信的多模态系统,智能体检索流程则提高输出的相关性和准确性[17] - **Nemotron-Personas数据集**:发布了基于本地人口普查和人口数据的、保护隐私的完全合成数据集 法国数据集现已推出,加入了美国、日本、印度、巴西和新加坡的现有数据集[9] 物理AI模型:机器人及自动驾驶 - **Isaac GR00T N1.7模型**:专为人形机器人打造的开放式推理视觉语言行动模型,现已具备商业可行性,可用于实际部署[16][18] - **GR00T N2模型预览**:基于DreamZero研究的下一代机器人基础模型,采用新的世界行动模型架构,帮助机器人在新环境中完成新任务的成功率是领先VLA模型的两倍以上 该模型目前在MolmoSpaces和RoboArena的通用机器人策略排名中位列第一[10] - **Cosmos 3模型**:首个统一合成世界生成、物理AI推理和行动模拟的世界基础模型,预计即将推出,将帮助物理AI在复杂环境中运行[18] - **Alpamayo 1.5模型**:一个推理VLA模型,通过导航引导、提示条件、灵活的多摄像头支持和可配置的摄像头参数,增强了自动驾驶汽车的推理能力[18] 医疗保健与生命科学AI模型 - **BioNeMo平台扩展**:作为一个开放的医疗保健和生命科学AI开发平台,使研究人员能够大规模建模、设计和模拟生物系统[19] - **Proteina-Complexa模型**:用于蛋白质结合剂设计的生成模型,加速基于结构的药物发现和治疗开发[16][19] - **AlphaFold数据库扩展**:公司与EMBL欧洲生物信息学研究所、Google DeepMind和首尔国立大学合作,大规模扩展了AlphaFold蛋白质结构数据库,计算了约3000万个蛋白质复合物预测,并向AlphaFold数据库新增了170万个高置信度预测,以加速新药物靶点和疾病生物学的发现[20] - **nvQSP模拟引擎**:一种GPU加速的模拟引擎,使药物研究人员能够在临床试验开始前在计算机模型中探索更多的治疗方案 基准测试显示,与传统的单线程CPU模拟相比,nvQSP性能提升高达77倍,使科学家能在以前仅能模拟几个场景的时间内,分析数百个剂量水平和患者亚群[21] 合作伙伴与客户应用案例 - **智能体AI应用**:包括Automation Anywhere、CodeRabbit、CrowdStrike、Cursor、Factory、Distyl、Genspark、Perplexity和ServiceNow在内的领先公司正在部署Nemotron模型以支持高级智能体应用[7] Edison Scientific将Nemotron作为Kosmos的核心组件,该自主AI科学家被超过50,000名研究人员使用,可并行执行数百项研究任务,将数月的研究压缩至一天[7] - **全球开发者应用**:全球AI开发者正在使用Nemotron模型的数据和框架构建主权模型,以母语服务数十亿人,并符合当地文化和价值观 这些开发者包括AI Singapore、Bielik.ai、Indosat Ooredoo Hutchison、LINAGORA、SOOFI、Stockmark、Trillion Labs、Viettel和YTL AI Labs[8] - **物理AI应用**:HCLTech、Johnson & Johnson MedTech、Milestone Systems、mimic robotics、Skild AI、Tulip和丰田研究所正在使用NVIDIA Cosmos加速物理AI训练和视频分析[11] Humanoid、LG Electronics、NEURA和Noble Machines正在采用NVIDIA Isaac GR00T N1.7来扩展人形机器人的部署[11] - **医疗AI应用**:Novo Nordisk、Viva Biotech和Manifold Bio正在使用Proteina-Complexa模型设计能与靶蛋白结合的蛋白质,并对生成的设计进行了实验测试[16][19] - **平台集成**:LangChain已将NVIDIA Nemotron模型和其他NVIDIA Agent Toolkit软件集成到其智能体开发平台中,使企业能够构建、部署和监控智能AI助手,以企业级规模自动化复杂任务[6] 产品发布与获取渠道 - 公司宣布了新的开源模型,包括Nemotron 3 Ultra、Omni和VoiceChat、Cosmos 3、Isaac GR00T N1.7、Alpamayo 1.5和Proteina Complexa,以推进智能体、物理和医疗AI[14][15] - 部分NVIDIA开源模型、数据和框架可在GitHub、Hugging Face、一系列云、推理和AI基础设施平台以及build.nvidia.com上获取[22] - 许多模型也作为NVIDIA NIM微服务提供,可在从边缘到云的任何NVIDIA加速基础设施上进行安全、可扩展的部署[22]
NVIDIA Announces NemoClaw for the OpenClaw Community
Globenewswire· 2026-03-17 04:13
产品发布与核心定位 - 英伟达于2026年3月16日GTC大会上宣布推出NemoClaw™软件栈,用于OpenClaw智能体平台 [1] - NemoClaw允许用户通过单一命令安装Nemotron™模型和新发布的OpenShell™运行时,旨在为自我进化、自主的AI智能体(或称“claws”)增加隐私与安全控制,使其更可信、可扩展且易于获取 [1][12] - 公司CEO黄仁勋将OpenClaw定位为“个人AI的操作系统”,并称其开启了AI的新前沿,成为史上增长最快的开源项目 [2] 技术架构与功能特性 - NemoClaw利用英伟达Agent Toolkit软件优化OpenClaw,通过安装OpenShell提供开放模型和一个隔离的沙箱环境,以增强数据隐私和安全性 [2] - 该技术栈为智能体提供了底层缺失的基础设施层,使其在获得必要访问权限以提升生产力的同时,能执行基于策略的安全、网络和隐私护栏 [2] - NemoClaw兼容任何编码智能体,并能调用包括Nemotron在内的开放模型在用户专用系统上本地运行,同时通过隐私路由器,智能体也能使用云端的前沿模型,这种本地与云端模型的结合为智能体在既定隐私安全护栏下发展新技能、完成任务奠定了基础 [3] 硬件支持与部署场景 - NemoClaw for OpenClaw可在多种专用平台上运行,为持续运行的自主智能体提供本地计算能力,支持平台包括搭载NVIDIA GeForce RTX™的PC和笔记本电脑、NVIDIA RTX™ PRO工作站,以及NVIDIA DGX Station™和NVIDIA DGX Spark™ AI超级计算机 [4] - 该方案旨在为全天候运行的自主智能体提供本地计算支持 [4] 市场活动与行业影响 - 在GTC大会期间(3月16日至19日)设有“构建智能体”活动,参会者可亲身体验使用NemoClaw for OpenClaw定制和部署主动式、持续在线的AI助手 [5] - 公司通过与OpenClaw创建者及更广泛的生态系统合作,共同构建智能体及其安全护栏,目标是让任何人都能创建强大且安全的AI助手 [2] - 公司认为,此次发布是行业期待已久的时刻,标志着软件新复兴的开始 [2]
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 09:01
公司战略与核心主题 - 公司在CES 2026上明确展示全力投入AI领域的战略,五年来首次未发布游戏显卡[2] - 核心主题直指物理AI,旨在将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动更多GPU与基础设施投入并增强用户与生态锁定[7][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,预计2026年下半年启动规模化量产[14][38] - 架构由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6,将单GPU互连带宽提升至3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,与GPU连接的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出采用共封装光学(CPO)的Spectrum-X以太网交换机用于扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU构建新的“推理上下文内存存储平台”,旨在高效共享与复用键值缓存数据,提升系统响应和吞吐能力[32][34] - 每个Vera Rubin NVL72机架整体可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] 自动驾驶领域发布 - 推出面向安全推理自动驾驶的全新开源模型系列Alpamayo[39] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能理解环境并解释决策行为[41][42] - 配套推出开源仿真框架AlpacaSim,并发布包含1700小时驾驶数据的开源数据集,涵盖广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送高级自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖全产业链[47] AI模型与平台更新 - 推出面向Agentic AI的NVIDIA Nemotron模型家族,并持续向社区开源训练框架及多模态数据集[6] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[6] - Nemotron进一步推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,在实时低延迟场景中速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型以提升文档搜索效率,Nemotron Safety系列模型专注于增强AI应用安全性与可信度[53] - 公司在演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen[11][12] 物理AI与机器人 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2视觉-语言推理模型、Cosmos Transfer 2.5与Cosmos Predict 2.5合成视频生成模型[56][59] - 发布专为类人机器人打造的开源视觉-语言-行动推理模型Isaac GR00T N1.6,支持全身控制并集成Cosmos Reason模型[60] - 推出NVIDIA AI Blueprint for Video Search and Summarization参考工作流,用于构建分析视频的视觉AI智能体[60] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 生物医学领域 - 推出专门针对医疗健康与生命科学领域的AI技术工具NVIDIA Clara,旨在降低行业成本、加速治疗方案落地[61][62] - 该系列包含多款专项模型:La-Proteina能设计原子级精度的大型蛋白质;ReaSyn v2在药物发现阶段考虑生产问题;KERMT预测潜在药物人体反应;RNAPro预测RNA分子3D结构[68] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[65]
Zoom launches AI Companion 3.0 with agentic workflows, transforming conversations into action
Globenewswire· 2025-12-15 22:00
产品发布与核心定位 - Zoom Communications Inc 于2025年12月15日发布了其智能AI解决方案的下一代产品 Zoom AI Companion 3.0 [1] - 此次发布被公司定位为一个转折点 标志着公司从一家会议公司转型为AI优先的智能工作编排先驱 [3] - 新产品旨在通过帮助用户发现洞察、优化日程并提升工作水平 来推动工作向前发展 [1] 技术架构与核心能力 - AI Companion 3.0 采用独特的联邦式AI方法 结合了Zoom自有的大语言模型和轻量级模型 以及来自OpenAI和Anthropic的领先第三方大语言模型 [2] - 用户还可利用领先的开源模型 如NVIDIA Nemotron 该模型在Zoom的联邦AI堆栈中实现了先进的推理和检索增强生成能力 [2][4] - 新功能通过更准确的转录、隐藏字幕和翻译字幕 提供更高质量的结果 从而实现更相关的信息检索和任务完成 [2] - 新的对话式工作界面与工作互动连接 将分散的会议对话和资料转化为洞察、进度跟踪和文档 无需用户上传会议记录或额外文档 [5][6] 新增功能与特性 - 新增个人工作流功能(测试版)以及面向Zoom Docs的智能AI功能(即将推出) [1][5] - 智能检索能力可跨Zoom Workplace的会议摘要、转录和笔记 以及连接的第三方应用(包括Google Drive和Microsoft OneDrive Gmail和Outlook支持即将推出)定位信息 [10] - “会后跟进”提示模板可根据会议和待办事项生成跟进任务并起草电子邮件 [10] - “每日反思报告”提示可总结会议、任务和更新 为工作日带来清晰度 [10] - 智能写作模式可基于特定会议或资源起草、编辑和完善商业文档 并在画布界面中与AI协同编辑 [10] - 新增“我的笔记”功能(即将推出)可转录面对面会议、Zoom会议或其他平台会议 帮助用户在一个地方跟踪关键细节 [10] - 个人工作流(测试版)可自动执行跟进任务 例如从会议和文档中汇编洞察以生成每日反思报告 或自动总结用户的团队聊天线程并在每天早上发送关键要点 [10] 商业模式与市场策略 - AI Companion的最新功能既可作为独立选项提供 也包含在付费的Zoom方案中 这体现了公司普及AI访问的核心信念 [3] - Zoom Workplace Basic用户可以试用部分AI Companion功能 也可以以每月10美元的价格单独购买AI Companion 而无需付费的Zoom Workplace许可 [4] - 公司致力于安全、隐私和负责任的AI 对传输中和静态的客户数据进行加密 且不使用类似通信的客户内容来训练其自身或第三方模型 [3] 客户反馈与合作伙伴评价 - 行业分析师认为AI Companion 3.0是用户完成工作所需的那种解决方案 采用此类解决方案将帮助组织提高效率和协作性 最终提升整个组织的生产力 [3] - Oracle公司表示AI Companion正在改变其团队的工作方式 帮助将对话转化为清晰的后续步骤和可操作的洞察 [4] - NVIDIA表示 通过双方在AI Companion 3.0上的合作 NVIDIA Nemotron开放模型正在助力未来的工作 [4] - 客户G42表示 新的基于网络的工作界面让其部分部门能够亲身体验Zoom的智能AI能力 [6] 产品访问与集成 - AI Companion现在可通过桌面网络浏览器在 ai.zoom.us 访问 使用户更容易将丰富的会议讨论转化为计划、简报和洞察 [4] - 用户可以在网络上开始工作 并无缝将内容转移到Zoom Docs 或直接在Zoom Docs中开始 利用相同的对话式、情境感知体验来创建内容并与新的智能写作和数据表功能(即将推出)协作进行项目 [10] - 内容可轻松导出为多种文件类型 包括MD、PDF、Microsoft Word和Zoom Docs [10] - 用户可以在Zoom Docs中与团队成员继续编辑和协作 使用共享评论、版本历史和共同创作工具 [10]
Zoom pioneers the next era of custom enterprise AI with NVIDIA
Globenewswire· 2025-10-29 02:30
合作核心与战略意义 - Zoom与NVIDIA合作,旨在为企业提供更快、更高质量且可定制的AI技术[1] - 合作将Zoom的联邦架构扩展到包含NVIDIA Nemotron开放技术,以支持AI Companion 30跨行业应用[1] - 该合作旨在加速企业生产力和协作体验,并优化成本效率、质量和延迟[1] 技术架构与创新 - Zoom的AI框架采用联邦架构,智能选择每个任务的最佳AI模型[2] - 框架扩展至下一代混合语言模型方法,可智能地在Zoom专有的小型语言模型和微调的大型语言模型之间路由查询[1] - Zoom新的490亿参数LLM基于NVIDIA Nemotron,并使用NVIDIA NeMo工具开发,以实现速度、成本和准确性的最佳平衡[2] - 该架构允许企业客户受益于开放和封闭模型的创新,带来更高的成本效率、更快的AI工作流程和更深入的推理能力[2] - Zoom专利待决的联邦AI方法已证明其在实时转录、翻译和摘要方面提供高质量性能的能力[3] 产品能力与集成 - 通过NVIDIA技术,Zoom加速了企业检索增强生成能力的开发,使AI Companion能与Microsoft 365、Microsoft Teams、Google Workspace、Slack、Salesforce和ServiceNow无缝协作[4] - Zoom计划利用NVIDIA Nemotron推理模型来增强决策能力,并管理跨会议、聊天、文档等的多步骤任务[5] - AI Companion通过模型定制和由NVIDIA技术驱动的检索增强生成来适应用户的个人工作习惯[6] 市场定位与行业应用 - 合作重点行业包括金融、医疗保健和政府,这些领域的数据隐私至关重要[1][6] - Zoom的使命是提供一个以AI为先的工作平台,重新构想团队协作[8] - Zoom Workplace是公司的开放协作平台,配有AI Companion,旨在提高团队生产力[8]