NVIDIA Nemotron
搜索文档
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 09:01
公司战略与核心主题 - 公司在CES 2026上明确展示全力投入AI领域的战略,五年来首次未发布游戏显卡[2] - 核心主题直指物理AI,旨在将技术护城河从芯片层拓展至全栈平台层(模型+数据+工具),以拉动更多GPU与基础设施投入并增强用户与生态锁定[7][10] 下一代数据中心架构:Vera Rubin - 正式推出下一代AI数据中心机柜架构Vera Rubin NVL72,预计2026年下半年启动规模化量产[14][38] - 架构由六大核心组件构成:Vera CPU、Rubin GPU、NVLink 6 switch、ConnectX-9 SuperNIC、BlueField-4 DPU、Spectrum-6 Ethernet switch[15] - 在NVFP4数据类型下,Rubin GPU推理性能达50 PFLOPS,是Blackwell GB200的5倍;训练性能达35 PFLOPS,是Blackwell的3.5倍[4][17] - 每颗Rubin GPU封装8组HBM4内存,提供288GB容量和22 TB/s带宽[18] - 引入NVLink 6,将单GPU互连带宽提升至3.6 TB/s(双向),每个机架配备9颗交换芯片,总规模内带宽达260 TB/s[20][21] - Vera CPU集成88个定制Olympus Arm核心,最多可同时运行176个线程,与GPU连接的NVLink C2C互连带宽达1.8 TB/s,可寻址最多1.5 TB的LPDDR5X内存[22] - 推出采用共封装光学(CPO)的Spectrum-X以太网交换机用于扩展,其中SN688提供409.6 Tb/s总带宽,SN6810提供102.4 Tb/s总带宽[24][25][26][27] - 推出BlueField-4 DPU构建新的“推理上下文内存存储平台”,旨在高效共享与复用键值缓存数据,提升系统响应和吞吐能力[32][34] - 每个Vera Rubin NVL72机架整体可提供3.6 exaFLOPS的NVFP4推理性能、2.5 exaFLOPS的NVFP4训练性能、54 TB的LPDDR5X内存以及20.7 TB带宽达1.6 PB/s的HBM4内存[36][37] - 与Blackwell相比,训练MoE模型所需GPU数量仅为四分之一,在MoE推理场景下每token成本最高可降低10倍[36] 自动驾驶领域发布 - 推出面向安全推理自动驾驶的全新开源模型系列Alpamayo[39] - 发布全球首款开源、大规模的自动驾驶视觉-语言-行动推理模型Alpamayo 1,参数100亿,能理解环境并解释决策行为[41][42] - 配套推出开源仿真框架AlpacaSim,并发布包含1700小时驾驶数据的开源数据集,涵盖广泛地理区域与复杂边缘场景[44][45] - Alpamayo将率先搭载于2025年第二季度欧洲上市的梅赛德斯-奔驰CLA车型,后续通过OTA升级推送高级自动驾驶功能[45] - 展示了基于自身技术构建的全球L4级自动驾驶与Robotaxi生态系统全景,覆盖全产业链[47] AI模型与平台更新 - 推出面向Agentic AI的NVIDIA Nemotron模型家族,并持续向社区开源训练框架及多模态数据集[6] - 开源数据集包括10万亿语言训练token、50万条机器人轨迹数据、45.5万个蛋白质结构、100TB车辆传感器数据[6] - Nemotron进一步推出针对语音、RAG以及安全三大场景的专项模型[49] - Nemotron Speech包含新的自动语音识别模型,在实时低延迟场景中速度比同类模型快10倍,已被博世采用[51][52] - Nemotron RAG搭载新的视觉语言模型以提升文档搜索效率,Nemotron Safety系列模型专注于增强AI应用安全性与可信度[53] - 公司在演讲中提及国产开源模型DeepSeek、Kimi K2、Qwen[11][12] 物理AI与机器人 - 为机器人推出的“大脑”Cosmos平台升级,全新发布Cosmos Reason 2视觉-语言推理模型、Cosmos Transfer 2.5与Cosmos Predict 2.5合成视频生成模型[56][59] - 发布专为类人机器人打造的开源视觉-语言-行动推理模型Isaac GR00T N1.6,支持全身控制并集成Cosmos Reason模型[60] - 推出NVIDIA AI Blueprint for Video Search and Summarization参考工作流,用于构建分析视频的视觉AI智能体[60] - Cosmos平台已被Figure、Agility Robotics、通用汽车等公司采用,其模型正被Salesforce、Uber等企业用于开发AI智能体[54][58] 生物医学领域 - 推出专门针对医疗健康与生命科学领域的AI技术工具NVIDIA Clara,旨在降低行业成本、加速治疗方案落地[61][62] - 该系列包含多款专项模型:La-Proteina能设计原子级精度的大型蛋白质;ReaSyn v2在药物发现阶段考虑生产问题;KERMT预测潜在药物人体反应;RNAPro预测RNA分子3D结构[68] - 将为研究者提供包含45.5万个合成蛋白质结构的数据集[65]
Zoom launches AI Companion 3.0 with agentic workflows, transforming conversations into action
Globenewswire· 2025-12-15 22:00
产品发布与核心定位 - Zoom Communications Inc 于2025年12月15日发布了其智能AI解决方案的下一代产品 Zoom AI Companion 3.0 [1] - 此次发布被公司定位为一个转折点 标志着公司从一家会议公司转型为AI优先的智能工作编排先驱 [3] - 新产品旨在通过帮助用户发现洞察、优化日程并提升工作水平 来推动工作向前发展 [1] 技术架构与核心能力 - AI Companion 3.0 采用独特的联邦式AI方法 结合了Zoom自有的大语言模型和轻量级模型 以及来自OpenAI和Anthropic的领先第三方大语言模型 [2] - 用户还可利用领先的开源模型 如NVIDIA Nemotron 该模型在Zoom的联邦AI堆栈中实现了先进的推理和检索增强生成能力 [2][4] - 新功能通过更准确的转录、隐藏字幕和翻译字幕 提供更高质量的结果 从而实现更相关的信息检索和任务完成 [2] - 新的对话式工作界面与工作互动连接 将分散的会议对话和资料转化为洞察、进度跟踪和文档 无需用户上传会议记录或额外文档 [5][6] 新增功能与特性 - 新增个人工作流功能(测试版)以及面向Zoom Docs的智能AI功能(即将推出) [1][5] - 智能检索能力可跨Zoom Workplace的会议摘要、转录和笔记 以及连接的第三方应用(包括Google Drive和Microsoft OneDrive Gmail和Outlook支持即将推出)定位信息 [10] - “会后跟进”提示模板可根据会议和待办事项生成跟进任务并起草电子邮件 [10] - “每日反思报告”提示可总结会议、任务和更新 为工作日带来清晰度 [10] - 智能写作模式可基于特定会议或资源起草、编辑和完善商业文档 并在画布界面中与AI协同编辑 [10] - 新增“我的笔记”功能(即将推出)可转录面对面会议、Zoom会议或其他平台会议 帮助用户在一个地方跟踪关键细节 [10] - 个人工作流(测试版)可自动执行跟进任务 例如从会议和文档中汇编洞察以生成每日反思报告 或自动总结用户的团队聊天线程并在每天早上发送关键要点 [10] 商业模式与市场策略 - AI Companion的最新功能既可作为独立选项提供 也包含在付费的Zoom方案中 这体现了公司普及AI访问的核心信念 [3] - Zoom Workplace Basic用户可以试用部分AI Companion功能 也可以以每月10美元的价格单独购买AI Companion 而无需付费的Zoom Workplace许可 [4] - 公司致力于安全、隐私和负责任的AI 对传输中和静态的客户数据进行加密 且不使用类似通信的客户内容来训练其自身或第三方模型 [3] 客户反馈与合作伙伴评价 - 行业分析师认为AI Companion 3.0是用户完成工作所需的那种解决方案 采用此类解决方案将帮助组织提高效率和协作性 最终提升整个组织的生产力 [3] - Oracle公司表示AI Companion正在改变其团队的工作方式 帮助将对话转化为清晰的后续步骤和可操作的洞察 [4] - NVIDIA表示 通过双方在AI Companion 3.0上的合作 NVIDIA Nemotron开放模型正在助力未来的工作 [4] - 客户G42表示 新的基于网络的工作界面让其部分部门能够亲身体验Zoom的智能AI能力 [6] 产品访问与集成 - AI Companion现在可通过桌面网络浏览器在 ai.zoom.us 访问 使用户更容易将丰富的会议讨论转化为计划、简报和洞察 [4] - 用户可以在网络上开始工作 并无缝将内容转移到Zoom Docs 或直接在Zoom Docs中开始 利用相同的对话式、情境感知体验来创建内容并与新的智能写作和数据表功能(即将推出)协作进行项目 [10] - 内容可轻松导出为多种文件类型 包括MD、PDF、Microsoft Word和Zoom Docs [10] - 用户可以在Zoom Docs中与团队成员继续编辑和协作 使用共享评论、版本历史和共同创作工具 [10]
Zoom pioneers the next era of custom enterprise AI with NVIDIA
Globenewswire· 2025-10-29 02:30
合作核心与战略意义 - Zoom与NVIDIA合作,旨在为企业提供更快、更高质量且可定制的AI技术[1] - 合作将Zoom的联邦架构扩展到包含NVIDIA Nemotron开放技术,以支持AI Companion 30跨行业应用[1] - 该合作旨在加速企业生产力和协作体验,并优化成本效率、质量和延迟[1] 技术架构与创新 - Zoom的AI框架采用联邦架构,智能选择每个任务的最佳AI模型[2] - 框架扩展至下一代混合语言模型方法,可智能地在Zoom专有的小型语言模型和微调的大型语言模型之间路由查询[1] - Zoom新的490亿参数LLM基于NVIDIA Nemotron,并使用NVIDIA NeMo工具开发,以实现速度、成本和准确性的最佳平衡[2] - 该架构允许企业客户受益于开放和封闭模型的创新,带来更高的成本效率、更快的AI工作流程和更深入的推理能力[2] - Zoom专利待决的联邦AI方法已证明其在实时转录、翻译和摘要方面提供高质量性能的能力[3] 产品能力与集成 - 通过NVIDIA技术,Zoom加速了企业检索增强生成能力的开发,使AI Companion能与Microsoft 365、Microsoft Teams、Google Workspace、Slack、Salesforce和ServiceNow无缝协作[4] - Zoom计划利用NVIDIA Nemotron推理模型来增强决策能力,并管理跨会议、聊天、文档等的多步骤任务[5] - AI Companion通过模型定制和由NVIDIA技术驱动的检索增强生成来适应用户的个人工作习惯[6] 市场定位与行业应用 - 合作重点行业包括金融、医疗保健和政府,这些领域的数据隐私至关重要[1][6] - Zoom的使命是提供一个以AI为先的工作平台,重新构想团队协作[8] - Zoom Workplace是公司的开放协作平台,配有AI Companion,旨在提高团队生产力[8]
Palantir and NVIDIA Team Up to Operationalize AI — Turning Enterprise Data Into Dynamic Decision Intelligence
Globenewswire· 2025-10-29 01:36
合作核心内容 - NVIDIA与Palantir Technologies Inc 合作构建首个用于运营AI的集成技术栈 [1] - 该技术栈旨在加速和优化复杂的企业和政府系统 [1] - 合作愿景是将AI付诸行动 将企业数据转化为决策智能 [4] 技术整合细节 - Palantir Ontology将集成NVIDIA GPU加速的数据处理和路由优化库、开放模型及加速计算 [2] - NVIDIA数据处理、AI软件、开放模型和加速计算现已原生集成并通过Ontology和AIP提供 [9] - 双方正致力于将NVIDIA Blackwell架构引入Palantir AIP 以加速端到端AI流程 [11] 产品与服务功能 - 技术栈包含分析能力、参考工作流、自动化功能及可定制的专业AI代理 [1] - 企业可使用NVIDIA CUDA-X数据科学库通过Ontology驱动业务关键工作流的实时AI决策 [9] - NVIDIA AI Enterprise平台(包括cuOpt决策优化软件)将支持企业进行动态供应链管理 [10] 目标市场与应用领域 - 该技术栈服务于零售商、医疗保健提供商、金融服务和公共部门等复杂运营环境 [3] - 企业能够利用其数据为特定领域的自动化和AI代理提供支持 [3] - Palantir AIP将在新的NVIDIA政府AI工厂参考设计中得到支持 [11] 客户案例 - Lowe's作为首批采用该技术栈的企业 正创建其全球供应链网络的数字副本 [5] - 该技术旨在支持供应链敏捷性 同时提升成本节约和客户满意度 [5] - Lowe's通过结合Palantir技术与NVIDIA AI 重新构想零售物流 [6]