Workflow
Tokens化
icon
搜索文档
NVIDIA GTC 2025:GPU、Tokens、合作关系
Counterpoint Research· 2025-04-03 10:59
AI经济与Tokens化 - Tokens作为新型"货币"用于检索或生成信息 推动AI经济发展 但需要大量算力支持[2] - AI推理模型复杂度提升 对准确性要求更高 需遵循预训练 后训练和测试时扩展三条定律[2] - 进入Agentic时代 组织机构需在训练到推理全流程中遵循扩展流程以实现高效推理[2] NVIDIA技术栈创新 - 公司提供完整AI技术栈 涵盖芯片 系统和软件 以最高效率加速和扩展AI[4] - 技术栈覆盖Agentic AI和Physical AI领域 芯片路线图从计算到硅光子学均有重大发布[4] - 软件专业技术是最大优势 促使高性能芯片广泛应用 与竞争对手差距持续拉大[32] 芯片产品与技术 - 产品组合包括CPU GPU和网络设备 最新Blackwell平台GB300 NVL72性能提升1.5倍[6] - Rubin系列GPU采用FP4精度 性能达50-100 petaFLOPS 配备288GB-1TB HBM4存储器[6] - Vera CPU性能是Grace的两倍 功耗仅50W 更新节奏为每两年一次[6] - 光谱-X硅光子学产品可节省数兆瓦电力 解决横向扩展至数百万GPU的瓶颈问题[9] 系统解决方案 - Blackwell Ultra DGX SuperPOD配备36个Grace CPU和72个Blackwell GPU AI性能比Hopper高70倍[10] - DGX Spark个人超级计算机系统性能达1 petaFLOPS 适用于微调与推理[13] - 系统发布为Dell Lenovo等供应商提供强大AI解决方案基础 直接冲击苹果Mac Studio市场[13] 软件平台 - Dynamo开源框架提升AI推理效率 运行DeepSeek-R1模型Tokens生成能力可提升30倍[19] - Halos平台整合安全系统 覆盖从芯片到算法全流程 吸引众多汽车厂商采用[20][21] - CUDA-X拥有超百万开发者 成为最受欢迎的AI编程工具包 拓展至各行业应用[26] - Aerial平台开发原生AI 6G技术栈 涵盖从无线电设备到网络数字孪生的端到端方案[25][26] 新兴领域布局 - Isaac GR00T N1是全球首个人形机器人基础模型 采用双系统架构模拟人类决策与反射[29] - 与谷歌DeepMind和迪士尼合作开发开源牛顿物理引擎 提升机器人处理复杂任务能力[29] - Omniverse-Cosmos平台通过合成数据训练机器人 在不同场景中微调行为[29]