Workflow
NVIDIA NeMo
icon
搜索文档
Geely Expands Strategic Partnership with NVIDIA Across Physical, Enterprise, and Industrial AI
Globenewswire· 2026-03-18 21:19
核心观点 - 吉利汽车集团正与英伟达深化战略合作伙伴关系 合作范围超越传统硬件供应 扩展至物理AI 企业AI和工业AI三大核心维度 旨在构建全链条智能出行生态系统[1][5] 合作维度与具体内容 物理AI (智能汽车与自动驾驶) - 吉利与法雷奥的G-ASD系统将集成英伟达Alpamayo Cosmos和NuRec技术 以提升开发 仿真和验证效率[2] - 公司将与生态系统合作伙伴共同开发并商业化Robotaxi 采用英伟达DRIVE AGX Hyperion自动驾驶架构 以增强复杂驾驶场景下的泛化能力和安全冗余[4] - 公司将率先在行业内部署由英伟达与联发科联合开发的Dimensity Auto Cockpit C-X1座舱平台 该平台采用英伟达Blackwell GPU及第二代Transformer引擎 专为LLM和VLM推理性能优化 具有领先的令牌处理吞吐量和内存带宽效率[7] - 公司将利用英伟达DRIVE AGX平台及一系列优化的AI模型 为AI Box差异化车载应用提供支持 持续推动车内创新[7] 企业AI (云计算与基础设施) - 公司将利用英伟达AI超级计算平台 结合英伟达Nemotron开源模型 NeMo软件和英伟达AI Enterprise套件 旨在加速企业级AI演进 从研发数据处理升级至智能业务决策 推动公司运营向“AI组织”转型[5] 工业AI (制造与研发数字化) - 合作涵盖视觉AI代理 基于英伟达Omniverse库的工厂自动化以及AI驱动的工业设计与CAE工作流程 旨在通过AI干预显著缩短研发周期 实现高度柔性化和自动化的制造流程[5][8] 战略目标与行业影响 - 此次合作旨在构建全链条智能出行生态系统[5] - 随着极氪8X等全新车型的推出 公司正加速将AI能力从实验室推向真实场景 开启智能出行新时代[9]
Fractal Introduces LLM Studio to Bring Enterprise-Grade GenAI Customization with NVIDIA NeMo and NVIDIA NIM Microservices
Prnewswire· 2026-03-17 15:31
公司新产品发布 - 公司于2026年3月17日发布名为LLM Studio的企业级平台,旨在帮助企业构建和运行定制化的语言模型 [2] - LLM Studio是一个企业级生成式AI定制工作台,可帮助企业利用开源模型和英伟达AI基础设施来设计、构建、评估和运营领域特定语言模型 [1][4] - 该平台将在2026年3月16日至19日于加州圣何塞会议中心举行的英伟达GTC 2026大会上展示 [2] 产品核心功能与设计 - LLM Studio由两个模块组成:LLMOps用于管理模型创建后的全生命周期,支持部署、监控和治理;AutoLLM用于为特定任务或行业创建更小、更专业的模型,支持开源模型选择、合成数据生成、模型定制、评估和性能基准测试 [9] - 该平台基于英伟达参考架构构建,使用英伟达NeMo实现关键模型开发工作流能力,并使用英伟达NIM微服务进行模型托管 [5] - 该设计有助于企业在主要云环境中标准化模型的部署和管理方式,减少在每个设置中进行定制构建的需求 [5] - 公司计划使用英伟达Nemotron开源模型进行开发 [5] 产品价值主张 - LLM Studio旨在使模型响应与组织认可的数据和上下文绑定,从而减少幻觉并提高推理质量,最终模型归组织专有 [4] - 企业可以使用这些模型在智能体或其他生成式AI应用中,以通常远低于运行大型基础模型的成本,提供更可靠的性能 [4] - 该平台面向企业用户构建,包括编码经验有限或没有编码经验的团队,企业可根据自身内容定制模型,并训练其遵循特定指令,或构建专为需要更强推理能力的任务而设计的模型 [7] 行业趋势与市场需求 - 企业正在超越“一刀切”、仅限API的大型语言模型,以应对高价值用例 [3] - 当前,业务和技术领导者需要更清晰的治理护栏、可预测的成本和可靠的性能 [3] - 行业研究指出,越来越多企业采用更小、专为特定目的构建的模型,这些模型可以针对特定功能和领域进行微调 [3] - 企业已度过生成式AI的实验阶段,需要受治理、成本可预测且在生产中可靠的解决方案 [6] 公司背景与业务构成 - 公司是一家公开上市的全球企业级AI公司,为《财富》500强组织提供服务 [2] - 公司业务组合包括Asper.ai(为收入增长实现互联决策)和Analytics Vidhya(全球最大的数据科学社区之一) [8] - 公司分拆了Qure.ai,这是一家全球医疗保健AI领导者,致力于加强结核病、肺癌和中风的快速识别与管理 [8] - 公司专门的AI研究团队专注于基础AI进步,包括基于知识的基础模型、基于推理的系统和智能体系统,该团队已成功推出包括MarshallGoldsmith.ai, Vaidya.ai, Kalaido.ai,以及开源推理模型Fathom-R1-14B和基于工具的推理模型Fathom-DeepResearch在内的产品 [8][10] 公司规模与荣誉 - 公司在全球(包括美国、加拿大、英国、荷兰、乌克兰、印度、新加坡、南非、阿联酋和澳大利亚)拥有超过5,000名专业人员 [11] - 公司持续获得认可,包括被评为2025年印度最佳工作公司(前100名)、连续八年被评为“卓越职场”、以及连续五年被卓越职场研究所评为“印度女性最佳职场” [11] - 公司还被2025年Forrester Wave™评为客户分析服务提供商领导者,在Everest Group 2025年AI与分析服务峰值矩阵评估中获得领导地位,并在ISG 2024年数据工程和数据科学服务评估中获得领导地位 [11]
EXL advances EXLerate.ai agentic AI platform to support enterprise-scale adoption with NVIDIA technologies
Globenewswire· 2026-03-17 07:15
文章核心观点 全球数据与人工智能公司EXL宣布其智能体AI平台EXLerate.ai™现已获得NVIDIA AI Enterprise支持,双方深化合作旨在为受严格监管的行业提供安全、合规的企业级AI解决方案,此举将加速AI部署并带来显著的效率提升[1][3] --- 平台能力与产品更新 - **EXLerate.ai平台功能增强**:该平台提供超过250个预构建AI智能体与加速器,并新增了10项专利,能帮助客户将开发成本降低约40%,并将从原型到生产的时间缩短高达约50%[2] - **推出Agent Studio**:作为EXLerate.ai平台的新功能,这是一个无代码、全自动的智能体构建平台,利用NVIDIA NeMo工具包,旨在以最小的技术复杂性加速企业级智能体的部署[4] - **推出AI Governance Hub**:该中心集成了NVIDIA的先进AI模型以及专有和前沿模型,提供超过40种前沿框架,内置治理、监控和成本管理控制,以管理风险并确保合规[5] - **EXLdata.ai平台加速数据处理**:该平台利用NVIDIA CUDA-X Data Science进行GPU加速处理,可将模型准备时间缩短30-50%,同时提高准确性、文档化和合规性[6] 合作与市场影响 - **与NVIDIA技术栈深度融合**:通过整合NVIDIA NeMo框架、NeMo Agent工具包和NIM Agent蓝图,EXLerate.ai构建了一个安全、高性能的平台,用于在NVIDIA加速计算上部署企业级AI解决方案[3][4] - **目标行业明确**:平台主要服务于受严格监管的行业,包括保险、医疗保健、银行和金融服务,通过集成企业护栏、审计和成本控制来确保负责任且合规的AI规模化应用[3] - **广泛的客户基础与工作流**:该平台已为全球超过800家客户支持超过2000个AI驱动的工作流[7] 公司背景与战略 - **公司定位**:EXL是一家全球数据与AI公司,致力于利用数据、AI和深厚的行业知识重塑客户商业模式、驱动更好结果并实现快速增长[8] - **行业覆盖**:服务领域包括保险、医疗保健、银行与资本市场、零售、通信与媒体、能源与基础设施等行业的全球领先企业[8] - **公司规模**:公司成立于1999年,总部位于纽约,在全球六大洲拥有约65,000名员工[9]
Supermicro Launches Seven AI Data Platform Solutions with NVIDIA and Leading Ecosystem Partners to Accelerate Enterprise AI Innovation
Prnewswire· 2026-03-17 04:35
产品发布核心信息 - Supermicro于2026年3月16日宣布推出七款完全集成的AI数据平台解决方案,旨在加速企业AI的采用 [1] - 这些解决方案是与NVIDIA及领先的生态系统合作伙伴共同开发,将计算、网络、存储和AI软件统一为交钥匙平台 [2] 技术架构与核心组件 - 平台基于NVIDIA参考架构,并采用Supermicro的高性能GPU和存储系统构建 [1] - 平台核心硬件包括NVIDIA RTX PRO 6000 Blackwell Server Edition GPU和新的NVIDIA RTX PRO 4500 Blackwell Server Edition GPU [1] - 平台集成了NVIDIA Spectrum-X以太网网络,以及包括NVIDIA NIM微服务和NVIDIA NeMo在内的企业AI软件,以支持高级AI智能体 [1] 合作伙伴生态系统 - 解决方案是与Cloudian、DDN、Everpure(前身为Pure Storage)、IBM、Nutanix、VAST Data和WEKA等数据平台创新者合作开发 [2][6] - Cloudian表示,其HyperScale AIDP将基于GPU的计算直接带到企业数据旁,利用Supermicro等合作伙伴的最佳计算、网络和存储节点,提供紧密集成的解决方案 [3] - DDN、Supermicro和NVIDIA联合推出“Driving AI Breakthroughs”移动AI工厂,展示从试点到可扩展、ROI驱动的AI的成熟路径 [4] - IBM指出,其运行在Supermicro Petascale存储服务器上的IBM Storage Scale可提供高吞吐、低延迟的并行数据访问,并自动从非结构化数据中提取语义,实时检测变化,无需昂贵的数据复制即可更新NVIDIA AI数据平台内的数据 [7] - Nutanix表示,其Agentic AI解决方案集成了Nutanix AHV、Nutanix Kubernetes平台、统一存储和AI网关等技术,运行在Supermicro设计和构建的多种专用服务器上 [8] - VAST Data强调,其CNode-X AI数据平台由VAST AI操作系统驱动,基于大规模EBox部署的成功经验,提供企业所需的性能、弹性和操作简便性 [9] - WEKA表示,通过将其NeuralMesh与Supermicro先进的GPU和机架级系统结合,为企业提供了一个不仅能支持当前AI工作负载,且能随工作负载扩展而变得更强大的基础 [10] 产品价值主张与市场定位 - 这些解决方案旨在加速企业从数据到智能行动的规模化转化,帮助企业更快地从试点阶段进入生产阶段 [2][7] - 公司CEO表示,通过结合数据中心构建块解决方案、机架级集成专业知识和先进的冷却创新,Supermicro正使AI部署更快、更高效、更交钥匙化 [2] - 平台旨在满足高级AI工作负载的推理需求,需要统一计算、网络和存储的全栈基础设施 [3] - 公司定位为面向AI、云、存储和5G/边缘的全栈IT解决方案提供商,致力于为全球客户提供从云到边缘的下一代创新 [11] 市场活动 - 这些解决方案将于3月16日至19日在NVIDIA GPU技术大会(GTC)的Supermicro第1113号展位进行展示 [10]
英伟达统治AI时代:下游产业的算力革命与万亿机会
QYResearch· 2026-02-19 10:03
文章核心观点 - 英伟达已成为全球科技产业的核心驱动力,其数据中心业务的爆发式增长主要由AI计算需求驱动,并正在重塑下游产业的架构、投资与商业模式,创造长期、确定性的增长机会 [1][2][12] 英伟达营收与算力扩张的下游拉动机制 - 2025财年,英伟达全年营收突破约1300亿美元,数据中心业务占比接近90%,毛利率维持在70%–75%区间 [1] - 2025财年数据中心营收约1152亿美元,同比增长142%,在多个季度中收入占比一度超过88%~90% [4] - Blackwell架构单季曾贡献约110亿美元营收,是公司历史上最快的产品销售增长纪录,并贡献了数据中心业务约70%的计算收入 [4] - 下游需求爆发源于三大趋势:算力成为生产力基础设施、CUDA等软件生态的锁定效应加剧、企业IT架构从CPU向GPU的转型 [5] 英伟达推动的下游产业扩张与新格局 - 云服务商正在加速构建专用AI数据中心,多家大型云服务提供商每周部署数万张Blackwell GPU [5] - 预计全球数据中心AI计算投入的资本开支在2025–2030年间将以约40%的年复合增长率持续扩张,到2030年可能达到约3–4万亿美元 [6] - 数百万开发者依赖CUDA和模型优化工具,推动下游软件服务收入增长空间巨大 [7] - 传统行业(金融、医疗、制造、能源等)的AI需求正转向核心业务支撑,需要在本地或边缘部署与英伟达深度集成的专用AI服务器 [8] 产业链下游的确定性增长机会 - 软件与开发平台方面,开发者社区规模达百万级,企业级AI开发平台服务增长加速 [9] - 云与企业数据中心扩张方面,预计到2030年全球AI数据中心资本开支或接近4万亿美元 [9] - 企业级AI服务与解决方案市场方面,AI在企业中的应用渗透率每年以30%+速度增长,整体AI软件及服务市场预计到2030年规模可达数万亿美元 [10] 长周期重构:英伟达如何“定义未来” - 企业IT投资周期从2–3年延长到5–10年,AI基础设施部署涉及长期架构投入 [11] - 以CUDA为核心的软件生态锁定和AI工厂概念的推广,使市场标准趋于集中 [11] - 下游企业的业务模式正从销售产品转向“AI在线服务”和“智能自动化平台”,以增强客户粘性和持续收入能力 [11] 长期确定性仍在增长 - 英伟达正在形成一个技术驱动的长期产业增长引擎 [12] - 对下游企业而言,算力采购成为持续战略投资,生态协同比单一产品更重要,核心竞争力正转向技术和架构参与 [12] - 未来十年,围绕数据中心、AI软件与平台、行业AI应用及运营服务三个层面的增长机会将成为产业经济的重要驱动力 [13]
英伟达在韩国部署超26万块GPU 三星、现代猛建AI工厂
21世纪经济报道· 2025-10-31 18:05
英伟达在韩国的AI基础设施合作计划 - 英伟达宣布与韩国政府及三星电子、现代汽车集团、SK集团等产业巨头合作,在韩国部署并使用超过26万块GPU,建设国家级AI基础设施与“AI工厂”集群 [1] - 该项目旨在推动韩国制造业与数字经济全面进入智能化阶段,英伟达的AI平台将深入韩国的汽车、半导体、通信、云计算等领域,形成从模型训练到产业应用的完整生态 [1] - 除英伟达外,亚马逊云科技(AWS)等七家企业宣布将在韩国进行共计约90亿美元的投资 [1] 韩国AI项目的具体部署与参与方 - 韩国预计投入多达5万片最新英伟达GPU以推动主权AI发展,首批部署由云厂商NAVER Cloud、NHN Cloud与Kakao Corp执行,初期部署1.3万片英伟达Blackwell及其他GPU [2] - 项目将引入NVIDIA NeMo与Nemotron数据集,利用本地数据开发推理模型,LG AI研究院、NAVER Cloud、NC AI、SK电信与Upstage均参与其中 [2] - 这些体系将为科研机构、初创公司与制造企业提供大模型训练与推理算力,成为韩国AI战略的一部分 [2] 英伟达与韩国在6G及科研领域的合作 - 英伟达将与韩国科研机构、通信运营商及大学合作,推动AI-RAN与6G技术发展,联合项目包括三星、SK Telecom、ETRI、KT、LGU+和延世大学 [2] - 合作旨在研发低功耗、智能化的AI-RAN网络技术,以降低计算成本并延长终端设备续航 [2] - 韩国科学技术信息研究院(KISTI)将与英伟达共建“卓越中心”,利用韩国第六代国家超级计算机HANGANG开展科研合作,并支持英伟达的NVQLink开放架构 [7] 韩国主要财团的AI工厂建设规划 - 三星电子将建设拥有5万块GPU的半导体AI工厂,利用英伟达的Nemotron、CUDA-X、cuLitho和Omniverse技术平台打造数字孪生制造体系 [4] - SK集团正规划另一座同规模(5万块GPU)的AI工厂,用于半导体研发、AI代理训练及云端应用创新,旗下SK Telecom将推出亚洲首个工业AI云 [6] - 现代汽车集团与英伟达进入深度合作新阶段,将使用5万片Blackwell GPU进行AI模型训练与部署,并与韩国政府联合投资约30亿美元支持建立国家级物理AI集群 [6] 英伟达的全球化AI布局 - 过去一年,英伟达创始人黄仁勋频繁出访欧洲、日本、越南、沙特阿拉伯等地,与多国政府及科技巨头签署合作协议 [3] - 具体合作包括:在日本与软银合作构建AI超级计算机;在沙特部署数十万片GPU建设AI工厂;在越南联合建立AI研究中心和数据中心 [3] - 随着各区域加大AI投资,全球的算力版图正在重塑,AI竞争核心正从企业层面转向各经济体的科技基础设施建设 [3][7]
CrowdStrike Teams with NVIDIA to Build, Power, and Secure the Agentic Ecosystem
Businesswire· 2025-09-17 00:48
公司合作与产品整合 - CrowdStrike与NVIDIA宣布将Charlotte AI AgentWorks与NVIDIA Nemotron系列AI模型集成 [1] - 合作扩展Falcon平台功能 为基于NVIDIA NeMo开发工具构建的AI代理及第三方生态系统提供保护与治理 [1] - 合作基于CrowdStrike为NVIDIA企业级大语言模型提供的全生命周期保护能力 [1]
Profusa Adopts NVIDIA-Powered Technology to Build AI-Driven Insight Portal for Continuous Biomarker Monitoring
Globenewswire· 2025-09-11 20:30
核心观点 - 公司宣布采用NVIDIA技术,为其连续生化监测平台构建一个由人工智能驱动的临床洞察门户,该门户结合了公司的Lumee氧监测技术与NVIDIA NeMo,旨在提供可操作的临床工作流程,并计划于2026年初在欧洲经济区推出 [1][2][4] 技术合作与平台能力 - 公司计划将其Lumee平台与行业领先的NVIDIA NeMo硬件和软件堆栈相结合,构建一个由人工智能驱动的、可扩展的技术骨干,以提升个性化传感器数据的准确性,并实现传感器数据与电子病历的实时连接 [2] - 预期医生门户的功能包括:代理临床工作流程、评估与监控、内置防护栏、模型训练选项以及时间对齐的健康数据图谱,以支持预测和健康指导 [7] 产品定位与市场价值 - 公司认为其实时生化大数据是目前实现AI改善医疗承诺所缺失的关键数据集,公司凭借其专有数据,能够将治疗决策与实时生化变化联系起来,生成当前缺乏的宝贵洞察 [2] - 该前沿门户技术旨在将原始光学信号转化为可靠的生命体征数据,提供可操作的临床背景信息,以满足医生对可信赖、持续洞察的需求,而非更多仪表盘 [3] 产品整合与市场推广计划 - 该门户将与公司的Lumee氧光学水凝胶传感器和读取器系统结合使用,将其人工智能信号处理和护理团队工具从临床医生办公室扩展到远程患者监测场景 [4] - 公司预计于2026年初在欧洲经济区推出该门户,该区域认可CE标志 [4] 公司背景 - 公司是一家商业阶段的数字健康公司,致力于开发新一代组织集成传感器,以检测并持续传输用于个人和医疗用途的可操作、医疗级数据 [5] - 公司旨在通过其持久、可注射且价格合理的生物传感器及智能数据平台,为人们提供基于数据的、临床医生可信任和依赖的个性化生化特征 [5]