机密计算
搜索文档
震惊,英伟达GPU竟带定位器
半导体芯闻· 2025-12-10 16:14
文章核心观点 - 英伟达正在开发一项基于“机密计算”技术的位置验证软件服务,旨在帮助客户监控其AI GPU集群的健康状态和库存,并可能用于阻止其高端AI芯片被走私至受出口限制的国家 [1] 英伟达的位置验证技术 - 该技术是一项可由客户自行安装的软件选项,利用英伟达GPU的“机密计算”能力来实现 [1] - 软件通过测量与英伟达服务器通信的时间延迟来推断芯片的大致位置,精度与其他基于互联网的定位服务相当 [1] - 该功能最初是为了让客户能够追踪芯片的整体计算性能,这是大型数据中心运营商的常见需求 [1] - 该功能将首先在最新的“Blackwell”系列芯片上提供,因其在“证明”流程方面比Hopper和Ampere两代产品具备更强的安全功能 [1] - 公司也在研究让早期产品支持相关功能的可能性 [1] 机密计算技术详解 - 机密计算是一种保护使用中数据的技术,可防止任何人查看或篡改数据及运算过程 [3] - 其通过与处理器绑定的加密密钥,构建可信执行环境,生成经加密签名的“证明”以验证硬件和固件的安全配置 [3] - 该技术补齐了数据生命周期防护的最后一块短板,实现了数据在传输、静态存储和使用状态下的全流程无明文暴露 [4][5] - 在云与边缘计算场景下,机密计算将防护重心转向防范设备所有者获取用户数据,操作系统等软件无法读取或修改用户程序的内存数据 [5] - 机密计算的底层基础是每个处理器独有的安全密钥,通过“安全度量启动”和构建“安全飞地”来运行用户应用 [8] - 通过“远程证明”机制,用户可验证机密防护体系是否完好 [8] 英伟达GPU的机密计算实现 - 英伟达在2023年首次推出机密计算,旨在保护数据与代码在使用中的安全 [8] - H100是全球首款支持机密计算的GPU,可在传统虚拟机或基于Kata的Kubernetes机密容器中运行 [8] - H100在芯片上集成硬件可信根,并通过安全启动、SPDM会话及加密签名的“证明报告”构建可信执行环境 [9] - 自Volta、Turing、Ampere到Hopper架构,公司持续增强固件加密、回滚防护等,实现从硬件、固件到驱动的一体化安全栈 [9] - H100的机密计算模式分为CC-Off、CC-On和CC-DevTools三种,启用后CPU与GPU之间的数据、指令、内核均以加密形式传输 [9] - 实现GPU机密计算需配合CPU厂商的CVM能力,如AMD的SEV-SNP和Intel的TDX,并通过设备证书、英伟达远程证明服务等机制验证设备安全 [10] - 在性能上,机密计算模式下GPU原生算力与HBM带宽不受影响,主要开销来自CPU-GPU加密传输与跳板缓冲区带来的延迟 [10]
Gartner2026预测:这十大战略技术趋势,将决定企业未来竞争力
搜狐财经· 2025-11-09 02:56
文章核心观点 - 2026年对技术领导者而言是至关重要的一年,变革、创新与风险将以空前的速度发展[3] - 2026年的各项重要战略技术趋势将密切交织,折射出一个由人工智能(AI)驱动的高度互联化世界的现实图景[3] - 企业机构必须推动负责任的创新、卓越运营和数字信任,这些趋势是促进业务转型的催化剂[3] - 由于下一轮创新浪潮已近在眼前,只有当下采取行动的企业才能应对市场波动和决定未来数十年的行业走向[3] 2026年十大战略技术趋势 AI超级计算平台 - 整合CPU、GPU、AI ASIC、神经系统计算和替代性计算范式,使企业能够统筹复杂工作负载[6] - 系统融合强大的处理器、海量存储、专用硬件及编排软件,可处理机器学习、仿真模拟和分析等领域的数据密集型工作负载[6] - 到2028年,将混合计算范式架构应用于关键业务流程的领先企业将达到40%以上,较当前8%的水平大幅增长[8] - 该技术已在推动医疗、生物技术、金融服务和公共事业等行业的创新[8] 多智能体系统 - 多智能体系统是由多个AI智能体组成的集合,它们通过交互实现复杂的个体或共同目标[8] - 这些智能体既可在单一环境中交付,也可在分布式环境中独立开发部署[8] - 通过使用多智能体系统,企业可实现复杂业务流程的自动化、提升团队技能并开创人类与AI智能体的新协作方式[10] - 采用模块化设计的专业智能体可提升效率、加快交付速度和降低风险[10] 特定领域语言模型 - 特定领域语言模型凭借更高的准确性、更低的成本和更好的合规性填补通用大语言模型的空白[11] - 该模型是在针对特定行业、功能或流程的专用数据上训练或微调的语言模型,能更加精准、可靠且合规地满足特定业务需求[11] - 到2028年,企业使用的生成式AI模型中将有超过半数属于特定领域模型[13] - 基于DSLM的AI代理可解读特定行业的上下文,具有出色的准确性、可解释性和决策合理性[13] AI安全平台 - AI安全平台为第三方及定制AI应用提供统一防护机制,能够进行集中监测、强制执行使用策略并有效防范AI特有风险[13] - 此类平台可帮助CIO有力执行使用政策、监控AI活动并在全AI系统中建立统一防护边界[13] - 到2028年,使用AI安全平台保护AI投资的企业比例将达到50%以上[16] AI原生开发平台 - AI原生开发平台使用GenAI实现空前快速、便捷的软件开发,企业只需维持现有开发人员规模即可开发更多应用[17] - 领先的企业正在组建微型平台团队,在安全和治理框架范围内让非技术领域专家能够自主开发软件[17] - 到2030年,80%的企业将通过AI原生开发平台将大型软件工程团队转变为更小、更敏捷的团队并通过AI赋能这些团队[19] 机密计算 - 机密计算重塑了企业处理敏感数据的方式,工作负载被隔离在基于硬件的可信执行环境中以保持私密性[20] - 这对受监管行业、面临地缘政治与合规风险的跨国公司以及竞争对手间的合作尤为重要[20] - 到2029年,75%以上在非可信基础设施中处理的业务将通过机密计算保障使用安全[22] 物理AI - 物理AI通过赋能具有感知、决策和行动能力的机器与设备,将智能带入到现实世界[23] - 它能为自动化、适应性和安全性至关重要的行业带来可观的收益[23] - 企业需要融合IT、运营与工程知识的新型技术人才,这一转变带来了技能提升与协作机会[25] 前置式主动网络安全 - 随着企业面临的网络、数据及联网系统威胁成倍增长,前置式主动网络安全正成为趋势[26] - 到2030年,前置式主动防御解决方案将占到企业安全支出总额的一半[26] - 该技术的核心在于运用AI驱动的安全运营、程序化阻断与欺骗技术在攻击者行动前实施干预[28] 数字溯源 - 随着企业日益依赖第三方软件、开源代码及AI生成内容,数字溯源验证已成为一项重要的需求[28] - 数字溯源指对软件、数据、媒体及流程的来源、所有权和完整性进行验证的能力[28] - 到2029年,在数字溯源方面投入不足的企业将面临高达数十亿美元的制裁风险[30] 地缘回迁 - 地缘回迁指企业因考虑到地缘政治风险而将数据与应用从全球公有云迁出至主权云、区域云服务商或自有数据中心等本地平台[31] - 将工作负载转移至主权立场更强的服务提供商可帮助CIO加强对数据驻留、合规及治理的控制力[33] - 到2030年,欧洲和中东地区将有超过75%的企业把虚拟工作负载回迁至降低地缘政治风险的解决方案,而2025年的这一比例不足5%[33]
2025全球计算大会落地深圳,聚焦产业落地新机遇
南方都市报· 2025-11-03 17:38
大会基本信息 - 2025全球计算大会(CGC)定于11月7日在深圳会展中心举行 [1] 核心主题与论坛 - 大会围绕智能计算、具身智能、开放液冷、机密计算、AI云操作系统、CloudDevice等六大主题设立专业论坛 [1] - 智能计算论坛将探讨算力效率提升与AI模型优化路径 [3] - 具身智能论坛聚焦机器人、智能硬件在工业与消费场景中的实际应用 [3] - 开放液冷技术论坛针对高密度算力场景,分享绿色节能的散热解决方案 [3] - 机密计算论坛探讨金融、互联网等领域中隐私保护与AI安全的协同机制 [3] - AI云操作系统论坛将发布算力资源调度与异构融合相关技术标准 [3] - CloudDevice论坛将展示云终端在制造、零售等行业的融合创新案例 [3] 技术展示与互动 - 大会设置技术互动展示区,包括CloudDevice XR体验、具身智能机器人演示及智算迷你开发实验室 [3] 行业影响与目标 - 大会旨在推动计算技术在产业中的深度融合与落地应用 [1] - 在人工智能与算力需求持续攀升的背景下,大会为技术研发、产业应用与跨界合作搭建交流平台 [3] - 参会者可借此了解最新技术趋势,并与多家企业、科研机构代表进行现场对接 [3]
全球计算联盟GCC解码新机遇 锁定2025全球计算大会六大论坛
环球网资讯· 2025-10-30 14:37
大会概况 - 全球计算联盟(GCC)将于2025年举办全球计算大会(CGC),主题为“开放、创新、协作、共赢” [1] - 大会旨在搭建技术交流与产业对接平台,以“新型计算赋能数智社会”为愿景,集结产学研力量破解产业痛点 [1] - 大会将设置六大核心论坛,涵盖智能计算、具身智能、开放液冷、机密计算、AI云操作系统、CloudDevice等领域 [1][2] - 大会将于11月7日在深圳会展中心举行,提供与头部企业、科研机构面对面链接资源的机会 [3] 论坛内容 - 智能计算论坛聚焦算力生产力升级路径,展示AI模型优化与算力调度实践成果,探讨通过算法创新与硬件加速提升计算效率 [1] - 具身智能论坛直击产业落地难点,从工业机器人交互到消费级智能设备开发,通过典型案例解析技术商业化密码 [1] - 开放液冷技术论坛聚焦AI时代算力基础建设,发布液冷技术适配指南,解读不同场景部署方案,通过散热效率实测数据对比提供降本增效参考 [2] - 机密计算论坛围绕金融与互联网应用、大模型安全防护等议题,详解AI时代机密计算与隐私保护的协同路径 [2] - AI云操作系统论坛深度拆解算力调度核心技术,解读模型训推一体解决方案,发布联盟最新技术标准成果以解决异构算力编排难题 [2] - CloudDevice论坛聚焦云终端与千行百业的融合创新,邀请零售、制造等领域企业分享智能终端落地案例 [2] 展览与体验 - 大会同期打造“GCC年度主题展区”,以“有AI一起玩”为主题,设置多个AI与交互体验专区 [2] - 展区包括CloudDeviceXR互动体验区、具身智能机器人互动区及智算迷你开发实验室等,参会者可零距离体验前沿技术 [2] - 展区内配备AI智能按摩椅休闲区与3000份打卡礼品,结合专业交流与趣味体验 [2]
Gartner《2026年重点关注的十大战略技术趋势》(下载)
欧米伽未来研究所2025· 2025-10-21 17:14
AI超级计算平台 - AI超级计算平台整合CPU、GPU、AI ASIC、神经系统计算和替代性计算范式,以统筹复杂工作负载并释放更大的性能、效率与创新潜力[5] - 这些系统融合强大处理器、海量存储、专用硬件及编排软件,可处理机器学习、仿真模拟和分析等领域的数据密集型工作负载[5] - 到2028年,将混合计算范式架构应用于关键业务流程的领先企业将达到40%以上,较当前8%的水平大幅增长[6] - 该技术已在推动各行业创新,例如医疗和生物技术企业将新药建模时间从数年缩短至数周,金融服务机构通过模拟全球市场降低投资组合风险[7] 多智能体系统 - 多智能体系统是由多个AI智能体组成的集合,它们通过交互实现复杂的个体或共同目标,可在单一或分布式环境中独立开发部署[7] - 通过使用多智能体系统,企业可实现复杂业务流程自动化、提升团队技能并开创人类与AI智能体的新协作方式[9] - 采用模块化设计的专业智能体通过在各工作流中重复使用成熟解决方案提升效率、加快交付速度和降低风险,便于扩展运营规模和快速适应需求变化[9] 特定领域语言模型 - 特定领域语言模型是在针对特定行业、功能或流程的专用数据上训练或微调的语言模型,凭借更高准确性、更低成本和更好合规性填补通用大语言模型的空白[11] - 到2028年,企业使用的生成式AI模型中将有超过半数属于特定领域模型[12] - 基于DSLM的AI代理可解读特定行业上下文,即使在陌生场景中也能做出合理决策,具有出色准确性、可解释性和决策合理性[13] AI安全平台 - AI安全平台为第三方及定制AI应用提供统一防护机制,能够进行集中监测、强制执行使用策略并有效防范AI特有风险,如提示注入、数据泄露、恶意代理行为等[13] - 到2028年,使用AI安全平台保护AI投资的企业比例将达到50%以上[15] AI原生开发平台 - AI原生开发平台使用GenAI实现快速、便捷的软件开发,使软件工程师作为"前沿部署工程师"协同领域专家开发应用[15] - 到2030年,80%的企业将通过AI原生开发平台将大型软件工程团队转变为更小、更敏捷的团队并通过AI赋能这些团队[17] - 领先企业正在组建微型平台团队,在安全和治理框架范围内让非技术领域专家能够自主开发软件[15] 机密计算 - 机密计算重塑企业处理敏感数据的方式,工作负载被隔离在基于硬件的可信执行环境中,即使面对基础设施所有者、云提供商或任何拥有硬件物理访问权限的实体也能保持内容与工作负载私密性[18] - 到2029年,75%以上在非可信基础设施中处理的业务将通过机密计算保障使用安全[18] 物理AI - 物理AI通过赋能具有感知、决策和行动能力的机器与设备,将智能带入到现实世界,为自动化、适应性和安全性至关重要的行业带来可观收益[19] - 随着技术日益普及,企业需要融合IT、运营与工程知识的新型技术人才,这一转变带来技能提升与协作机会,但也可能引发就业担忧[21] 前置式主动网络安全 - 前置式主动网络安全运用AI驱动的安全运营、程序化阻断与欺骗技术在攻击者行动前实施干预,通过预测实现防护[23] - 到2030年,随着企业从被动防御转向主动防护,前置式主动防御解决方案将占到企业安全支出总额的一半[23] 数字溯源验证 - 数字溯源指对软件、数据、媒体及流程的来源、所有权和完整性进行验证的能力,企业可使用软件物料清单、认证数据库、数字水印等工具验证和追踪供应链中的数字资产[23] - 到2029年,在数字溯源方面投入不足的企业将面临高达数十亿美元的制裁风险[23] 地缘回迁 - 地缘回迁指企业因考虑地缘政治风险而将数据与应用从全球公有云迁出至主权云、区域云服务商或自有数据中心等本地平台[24] - 到2030年,欧洲和中东地区将有超过75%的企业把虚拟工作负载回迁至降低地缘政治风险的解决方案,而2025年的这一比例不足5%[26] - 将工作负载转移至主权立场更强的服务提供商可帮助加强对数据驻留、合规及治理的控制力,提高对本地法规遵从性并获得关注数据隐私或国家利益客户的信任[26]
日本最强2nm芯片,深度拆解
半导体行业观察· 2025-05-03 10:05
富士通Monaka处理器战略转型 - 公司从超级计算机专用处理器转向可扩展数据中心基础设施部署 标志着重大战略转变 [1] - 目标市场为超大规模计算、能源限制及Arm架构主导的云基础设施领域 [1] - 采用2纳米核心芯片与3D多核布局 专为风冷服务器设计 优化机密计算与超低电压运行 [1] 技术架构与设计 - 核心采用2nm工艺 SRAM/IO采用5nm工艺 通过硅通孔垂直集成 双插槽配置提供288个Armv9-A核心 [3] - 设计强调实用性 使用DDR5(12通道/插槽)和PCIe Gen6 平衡性能与成本 功耗低于500W [6] - 3D芯片组集成逻辑/内存/IO 采用硅中介层 类似AMD 3D V-Cache和Intel Foveros技术 [9] 性能与效率目标 - 预计2027年上市 承诺应用性能和每瓦性能逐代提升 目标两倍于未透露的竞争对手 [10][38] - 超低电压运行策略通过内部EDA工具实现 效率提升相当于全工艺节点推进 [15] - 专注可预测功耗与工作负载隔离 而非峰值浮点性能 差异化定位为通用服务器级Arm芯片 [6][18] 安全与可靠性特性 - 硬件级全内存加密 唯一密钥保护虚拟机 集成硬件信任根与可信启动机制 [19][22] - 继承大型机经验 融入错误检测/热控制/故障恢复机制 满足政府/金融等高可信需求 [22] - 支持CXL 3.0可组合基础设施与PCIe Gen6 兼容下一代存储和网络设备 [30] 软件生态与行业定位 - 支持标准Linux堆栈与Arm SystemReady SR认证 无需定制工具链 兼容上游发行版 [24][27] - 开发工具链涵盖LLVM/GCC/Python 延续A64FX生态 支持AMD ROCm GPU异构计算 [27] - 定位"大型机级"处理器 瞄准主权云/电信/国防市场 强调可靠性而非绝对性能 [31][34] 公司技术传承与市场策略 - 延续SPARC64到A64FX的技术路线 30年处理器设计经验支撑Monaka开发 [35][37] - 获日本绿色创新基金支持 符合国家节能政策 参与全球自主计算基础设施竞争 [2] - 采用低调推广策略 2023年超级计算大会首次公开展示硅片模型 [2][38]