CUDA Toolkit 13.1
搜索文档
腾讯研究院AI每周关键词Top50
腾讯研究院· 2025-12-13 10:33
| 类别 | Top关键词 | 主体 | | --- | --- | --- | | 芯片 | H200出口 | 英伟达 | | 芯片 | 新GPU架构 | 摩尔线程 | | 算力 | CUDA Toolkit 13.1 | 英伟达 | | 算力 | 太空AI | Starcloud | | 模型 | Titans架构 | 谷歌 | | 模型 | 深度思考模式 | 谷歌 | | 模型 | GLM-4.6V | 智谱 | | 模型 | LongCat-Image | 美团 | | 模型 | 混元2.0 | 腾讯 | | 模型 | NVARC小模型 | 英伟达 | | 模型 | 新模型测试 | OpenAI | | 模型 | Devstral 2 | Mistral AI | | 模型 | 「牛油果」 | Meta | | 应用 | AI可穿戴设备 | Meta | | 应用 | AI面试官 | Anthropic | | 应用 | VibeVoice | 微软 | | | Realtime-0.5B | | | 应用 | 主体库功能 | 可灵 | | 应用 | Qwen3-TTS | 阿里 | | 应用 | A ...
AI产业跟踪:海外:HPE携手博通推出AMD"Helios"AI机架,搭载业界首创纵向扩展以太网
国泰海通证券· 2025-12-10 16:58
报告行业投资评级 - 报告未明确给出行业投资评级 [1] 报告的核心观点 - 报告跟踪了AI产业的最新动态,核心观点是AI产业正处在技术快速迭代、应用场景拓宽和基础设施创新的活跃期,硬件、软件、模型和应用层面均出现重要进展 [1] 根据相关目录分别进行总结 AI 行业动态 - **OpenAI** 在2025年进行了第四起收购,目标是其付费客户、提供AI模型训练跟踪工具的初创公司 **Neptune** [4] - **Meta** 组建全明星设计团队攻坚AI眼镜,由前苹果设计副总裁 **Alan Dye** 领导,旨在融合时尚与科技,打造非侵入式用户体验的设备 [5] - **Marvell** 宣布收购拥有光子互联技术的半导体初创公司 **Celestial AI**,旨在解决AI算力瓶颈,强化其在AI数据中心连接领域的竞争力,并获得主要客户 **亚马逊** 的支持 [6] - **HPE** 携手 **博通** 推出基于 **AMD Instinct MI455X** 显卡加速器的“Helios”机架级AI解决方案,搭载业界首创的纵向扩展以太网网络,可提供合计 **260TB/s** 的纵向扩展聚合带宽,AI FP4算力达到 **2.9 exaflops**,计划于2026年全球交付 [16] AI 应用资讯 - **苹果** 研究显示,AI可从 **Apple Watch** 光学传感器中挖掘更深入的心脏健康数据,其“高血压提醒”功能基于长达30天的数据趋势分析 [8] - **谷歌** 发布 **Workspace Studio**,支持用户通过自然语言描述创建、管理和分享AI智能体,该工具依托 **Gemini** 模型,可与 **Asana**、**Jira**、**Salesforce** 等第三方平台集成 [9] - **川崎重工** 宣布正式着手生产可载人移动的四足机器人“CORLEO”,计划与户外休闲服务结合,目标在2040年达成 **3000亿日元** 的业务规模 [10] - **XREAL** 发布 **AR** 眼镜新品 **XREAL 1S**,全球首发内容 **2D → 3D** 自动转换功能,重量为 **82g**,搭载自研 **X1** 空间计算芯片,延迟低至 **3ms** [10] AI 大模型资讯 - **亚马逊云科技** 发布 **Nova 2** 系列AI模型,并同步推出 **Nova Forge** 定制服务,使企业客户能够构建专属的定制化模型版本 [11] - **英伟达** 发布专注于自动驾驶的视觉语言动作模型 **Alpamayo-R1**,这是业界首个专注于该领域的开源推理型视觉语言模型 [12] - **Mistral AI** 推出 **Mistral 3** 系列模型,参数规模从 **3B** 到 **675B**,均以 **Apache 2.0** 许可证开源,其中 **Mistral Large** 总参数量为 **675B**,使用 **3000** 块英伟达 **H200 GPU** 训练 [13] - **Runway** 推出 **Gen 4.5** AI视频模型,在独立基准测试中表现超过谷歌和OpenAI的同类产品,登顶 **Video Arena** 榜单 [13] 科技前沿 - **亚马逊** 发布新一代自研AI芯片 **Trainium3**,其系统在训练和高负载推理场景下的速度相较第二代产品提升超过 **4** 倍,内存容量也增至 **4** 倍,可构建搭载最多 **100万** 颗 **Trainium3** 芯片的超大规模集群 [14][15] - **蓝色起源** 公布由AI设计的“月球吸尘器”,该设备能吸入月球尘埃并从中提取热量转化为能源 [16] - **英伟达** 发布 **CUDA Toolkit 13.1**,这是自2006年CUDA平台诞生以来规模最大、最全面的更新,引入了基于 **tile** 的编程模型等新特性 [16][18]
算力十年狂飙100000倍,他却每天担心破产!黄仁勋亲述:如何用“30天危机感”逆袭万亿AI市场
AI前线· 2025-12-08 15:18
英伟达最新技术发布:CUDA Toolkit 13.1 - 公司正式推出CUDA Toolkit 13.1,官方称这是自2006年推出CUDA平台以来“20年来最大、最全面的一次更新” [2] - 新版本的核心亮点是引入了全新的CUDA Tile编程模型,该模型允许开发者以数据块(tile)为单位编写算法,在比传统SIMT更高抽象层上构建GPU程序,底层细节由编译器与运行时管理 [4][7] - 新版本带来了多项重大变革,包括:1) 暴露绿色上下文(Green Context)的Runtime API,实现更灵活的GPU资源管理;2) 在数学库cuBLAS中增强了对双精度与单精度的仿真支持;3) 全面重写了编程指南并更新了工具链与库,显著提升平台稳定性与易用性 [7] 公司创始人的危机感与驱动力 - 创始人黄仁勋坦承,支撑其一路走下来的驱动力并非野心,而是长期笼罩的危机感,他每天醒来都感觉公司可能“距离破产,还剩30天”,这种紧迫感持续了三十多年 [6][8][82] - 这种持续的“不想失败”的紧绷感与危机感,被认为是公司得以不断突破的重要原因 [9][84] - 创始人回顾了公司最惊险的创业阶段,包括早期战略错误、濒临破产的现金流,以及押上公司未来的技术重构与一次性量产的豪赌 [1][8] 公司早期发展史与关键转折点 - 公司创立于1993年,最初目标是创造一种能解决传统计算机无法解决问题的新型计算架构,但当时相应的“杀手应用”并不存在,使命本身极具挑战 [66] - 早期通过说服日本世嘉公司,将街机3D游戏移植到PC以开启PC 3D游戏时代,并为其开发游戏主机芯片,以此获得启动资金 [67][68][69] - 公司第一代图形技术(NV1)在三个关键技术方向(曲面 vs 三角形、正向贴图 vs 逆向贴图、无Z-buffer)上全部选错,导致公司在竞争中处于劣势 [69][70] - 在资金即将耗尽、技术路线错误且与世嘉的合同可能无法交付的存亡之际,创始人前往日本,以极大的坦诚说服世嘉CEO将合同尾款500万美元改为对公司的投资,这笔投资拯救了公司 [72] - 公司上市后全面收缩战线,关闭错误方向,三位架构师基于从Silicon Graphics教科书学来的理念,重新发明3D图形技术,将百万美元工作站性能压缩进PC显卡,为电子游戏时代奠定技术基座 [8][73][74] - 在研发RIVA 128时,公司现金流极度紧张,为了一次成功,用仅剩的约50万美元现金购买了已倒闭公司的模拟器,以便在芯片流片前完成所有软件调试 [78] - 随后,公司说服当时规模仍小的台积电,在没有试产的情况下直接风险量产新品,一次失败就会让公司消失,最终成功并使其成为当时增长最快的科技公司之一 [8][79] 对人工智能(AI)发展的观点 - 认为过去两年里,AI技术的能力提升了100倍 [16] - 指出AI的发展将是渐进的,而非瞬间到达某个“事件视界” [13][15] - 认为最佳情景是AI融入我们所做的一切,让一切更高效,但同时网络安全等挑战将持续存在 [20] - 预测未来两三年后,世界上90%的知识很可能由AI生成 [35] - 相信未来5-10年有三大趋势:1) AI会大幅缩小技术鸿沟,因其是“最容易使用的技术”,例如ChatGPT几乎一夜之间就有十亿用户;2) 每个国家都将拥有优秀的AI,即便是“过去版本的AI”也依然惊人;3) AI的能耗会大幅下降,让更多国家享受红利 [50][51] - 强调加速计算使AI性能与能效大幅提升,过去十年将计算性能提升了100,000倍,使同样任务所需的能源减少了100,000倍,未来能耗将继续下降 [52] AI对就业与社会的影响 - 以放射科为例,指出AI并未取代放射科医生,反而因其能更高效处理影像而让医院雇佣了更多放射科医生,关键在于区分工作的“目的”(诊断疾病)与“任务”(阅读影像) [41][42] - 认为AI不会直接导致普遍失业,人的工作目的通常不变,变的是完成任务的方式,AI将取代部分以执行为核心的任务,但同时会创造大量前所未有的新工作 [44][45][46] - 提出工作的价值在于必须有“超越任务”的意义,人们需要寻找工作中更有意义的部分 [47] - 对“全民基本收入(UBI)”的看法是,“资源极大丰富”与“人人需要补贴”这两种极端情况不会同时发生,未来富裕更可能意味着“资源极大丰富” [48][49] 对AI安全与意识的看法 - 认为当前AI的力量大部分被导向了安全性,例如减少幻觉、提高答案的真实性,类似于汽车中ABS等技术让驾驶更安全 [16][17] - 在网络安全方面,指出存在一个由专家构成的共同体,进行协作、分享最佳实践,共同应对威胁,这种合作已持续约15年 [20][22] - 不相信AI会获得“意识”或“感知力”,认为意识是对自我存在的认知和情感体验的集合,而AI是由知识和智能定义的 [27][28] - 认为即便AI能完美模仿人类,也只是“模仿的版本”,而非真正的意识 [33] - 对于AI可能带来的威胁,认为防御性AI会保护人类,其逻辑类似于网络安全,即用AI来应对AI [26] GPU、深度学习与公司市场地位的奠定 - 公司从成立之初就研究并行计算,GPU本质上是图像生成超级计算机,为全球消费者提供了最大规模的超级计算平台 [58] - 2012年,Geoff Hinton实验室的AlexNet在图像识别上取得突破,其使用的硬件是两块英伟达GPU,这被视为现代AI的“大爆炸时刻” [57][59] - 公司意识到深度学习是一个“通用函数逼近器”,只要存在输入和输出,AI就能学会,其强大的前提是模型能扩大规模并能进行无监督学习 [60] - 2016年,公司研发了第一台DGX-1超级计算机,使用8个GPU,售价30万美元,研发成本达几十亿美元,最初无人问津,直到埃隆·马斯克为其初创的非营利机构OpenAI购买 [61][62][63] - 技术快速迭代,9年后,提供相同1 PetaFLOPS算力的DGX Spark体积大幅缩小,价格从30万美元降至约4000美元 [65][66]
英伟达发布20年来最大CUDA更新,AI算力板块大涨,人工智能AIETF(515070)涨2.05%
每日经济新闻· 2025-12-08 10:50
长江证券指出,CUDA Tile模型通过抽象化张量核心等专用硬件细节,使代码具备跨架构兼容性, 进一步巩固了其开发生态壁垒,使竞争对手难以通过硬件兼容层简单突围。市场观点普遍认为,此举旨 在降低大规模AI模型训练与部署的复杂度,推动算力基础设施向"AI工厂"范式演进。短期看,此举将利 好依赖CUDA生态的AI企业与开发者;中长期则强化了英伟达在AI算力基础软件层的主导权,为下一代 计算架构竞争奠定基础。 今日A股科技赛道集体大涨,盘面上,CPO、IT服务、软件开发、6G概念、通信设备等板块涨幅居 前,人工智能AIETF(515070)盘中大涨2.05%,其持仓股中际旭创涨5.12%,新易盛涨4.86%,复旦微 电、中科星图等股纷纷走强。 消息方面,英伟达正式发布CUDA Toolkit 13.1,这是自2006年CUDA平台问世以来规模最大、最全 面的一次更新。本次更新的核心是引入全新的CUDA Tile编程模型,该模型允许开发者在高于传统 SIMT的抽象层级上编写GPU程序,通过定义数据块及其计算逻辑,自动优化底层硬件调度,从而显著 降低GPU编程门槛。此次更新还深度优化了对Blackwell架构的支持,在 ...
腾讯研究院AI速递 20251208
腾讯研究院· 2025-12-08 00:01
2. 新增Green Context运行时支持、MPS内存局部性优化分区和静态SM分区,cuBLAS引入双精度单精度模拟提升 FP64矩阵乘法性能; 3. 开发者工具增强包括Tile核函数性能分析、编译时修补支持,数学库针对Blackwell架构带来显著性能提升。 https://mp.weixin.qq.com/s/lDlVLpFHWwd-HE3Muaa-kQ 生成式AI 二、谷歌Titans新架构亮相,RNN极速响应+Transformer性能 一、英伟达CUDA Toolkit 13.1 正式发布,20 年最大一次更新 1. 英伟达发布CUDA Toolkit 13.1,这是20年来最大更新,核心是基于tile的编程模型CUDA Tile,抽象化张量核心 等专用硬件; 3. DeepMind CEO Hassabis预测2030年AGI必至,强调需1-2个Transformer级突破,Titans被视为谷歌继 Transformer后的首个重大突破。 https://mp.weixin.qq.com/s/2RYtqVeyIIo5UNADWRyusg 三、Gemini 3 深度思考模式上线,推理能力再突破 ...