Workflow
H100显卡
icon
搜索文档
电力与算力成为新的硬通货,中国将迎来电力超级周期
搜狐财经· 2025-11-11 22:02
华尔街估值模型转变 - 华尔街对科技公司的估值标准从关注用户增长和人才储备转向关注算力基础设施和稳定电力供应 [1] - 公司的市值评估重点变为布局的算力规模和建设的电站数量,“电力+算力”成为企业新的核心竞争力 [1] - 投资者关注点从“博士人头”转向机房里的“显卡集群”,电力与算力被视为新的硬通货 [5] 亚马逊的战略调整与市场反应 - 亚马逊宣布裁减3万个工作岗位,这是其自2022年底裁员约2.7万人以来规模最大的一次裁员 [1] - 公司宣布2025年全年资本支出将达到约1250亿美元,并在2026年进一步增加,绝大部分投资将流向AI所需的数据中心、电力和芯片 [2] - 亚马逊坚信巨额的AI投资将获得丰厚回报,并强调新增产能正被快速变现,消息宣布后公司股价迎来飙升 [2] AI发展带来的能源挑战 - AI发展焦点从“缺芯”转向“缺电”,AI消耗的电力惊人,例如ChatGPT每个请求的耗电量是传统谷歌搜索的10倍,其日耗电量超过50万度,相当于美国家庭用电量的1.7万倍 [7] - 全球主要云厂商一年耗电超过400太瓦时,相当于一个中型国家的年用电量,电费成本在许多AI项目中占比超过30% [7] - 科技巨头如黄仁勋、马斯克、奥特曼均警告能源是AI发展的关键瓶颈,美国、日本、欧洲等地出现数据中心排队等待电网接入的情况 [8] 电力相关资产的市场表现 - 美国股市中,除了AI概念股和芯片公司(如英伟达)上涨最快外,电力公司股价也大幅上涨,例如核裂变初创企业OKLO近5个月涨幅接近900% [5] - NRG能源公司今年以来股价上涨75% [5] 中国在AI时代的电力优势与前景 - 中国的电力体系是全球规模最大、成本最低、发展最快的,在电力供应上能做到“供得上,用得稳”,掌握了从发电、电网到特高压、新能源、储能的完整产业链 [8] - 截至2025年8月,中国年发电量预计突破10.2万亿千瓦时,占全球总发电量的32%,相当于美国、欧盟和日本的总和 [9] - 瑞银预测中国电力需求将在2028-2030年达到8%的年增长率,几乎是此前预测4%的两倍,主要由三大因素驱动:AI数据中心(贡献2.3个百分点)、出口拉动(贡献1.4个百分点)和电气化提速(贡献1.2个百分点)[12][13][14] - 瑞银将中国“十五五”规划期间的年新增装机容量预测上调14%至438GW,年新增核电审批容量上调33%至16GW,年新增风电装机容量上调22%至128GW [13] - 电动汽车的普及推动电力需求,预计2025-2030年间其生产和充电的电力需求复合年增长率将分别达到33%和39% [14]
2张4090竟能本地微调万亿参数Kimi K2!趋境联合清华北航把算力门槛击穿了
量子位· 2025-11-05 15:56
技术突破核心观点 - 微调超大参数模型的硬件门槛和成本出现革命性下降,仅需2-4张消费级显卡(如4090)即可在本地对DeepSeek 671B乃至Kimi K2 1TB级别的模型进行微调 [1] - 成本降低的关键在于两个国产开源项目KTransformers与LLaMA-Factory的联动,将微调千亿/万亿参数模型的显存需求从理论上的1400GB-2000GB大幅降低至70GB-90GB [5][7] 技术方案与性能对比 - KTransformers项目由趋境科技与清华KVCache.AI共同开发,GitHub已获15.3K星,通过GPU+CPU异构计算创新路径实现高性能推理和微调 [6][7] - LLaMA-Factory作为训练与微调平台,GitHub星标超6万,提供无需编码的图形化界面,支持上百种预训练模型微调 [7] - 性能对比显示,KTransformers在14B-DeepSeekV2-Lite模型上实现530.38 token/s的吞吐量,显存占用仅6.08GB,远低于HuggingFace的32.12GB和Unsloth的9.64GB [13] - 对于671B-DeepSeekV3模型,KTransformers是唯一可行方案,提供40.35 token/s的吞吐量,显存占用仅70GB,而其他方案均不支持或无法运行 [13] 微调效果验证 - 在风格化对话任务中,使用NekoQA-10K数据集微调DeepSeek 671B模型后,模型回答从专业建议转变为"喵娘"风格,显示出明显的个性化效果提升 [17][18][19][20] - 在专业领域测试中,使用非洲医疗数据集AfriMed-QA微调后,DeepSeek-V3模型的BLEU-1指标从12.75提升至42.42,ROUGE-1从20.33提升至41.97,各项评测指标均获得大幅提升 [23] 行业应用前景 - 技术突破使大模型从少数机构专属技术转变为高校、团队乃至个人都能驾驭的创意工具,显著降低了算力门槛 [26] - 企业可快速在多个业务方向测试,用私有数据训练专属AI专家,在客服、营销、内部知识管理等场景提升迭代效率和投资回报率 [27] - 创新边界被拓宽,支持打造个性化写作助手、私有知识库助手、角色扮演聊天机器人及垂直领域专业模型等多样化应用 [35] 技术实现原理 - 采用三拳组合策略:将MoE模型最耗显存的专家层任务分配给CPU内存处理,GPU专注于计算;实现LoRA与高性能算子的无缝集成;利用Intel AMX指令集充分挖掘CPU处理AI运算的潜力 [36] - 操作简便性高,用户只需安装KTransformers和LLaMA-Factory环境,通过简单配置即可启动训练,框架自动处理数据处理、训练调度等复杂流程 [30][31]
微软将在阿联酋投资79亿美元大幅扩展AI数据中心容量
搜狐财经· 2025-11-04 14:53
微软在阿联酋的数据中心投资 - 公司计划通过与当地公司Group42的合作伙伴关系大幅扩展其在阿联酋的数据中心足迹 [2] - 到2024年底,与Group42合作伙伴关系的投资将超过73亿美元,其中一半以上资金分配给了资本支出和数据中心基础设施 [2] - 公司宣布将在阿联酋再投资79亿美元,使当地数据中心基础设施的计算能力提升近四倍,达到相当于81900张H100芯片的水平 [2] 人工智能芯片与技术部署 - 两个投资项目都将使用英伟达公司最先进的GB300人工智能芯片 [2] - 与Group42的项目使公司部署了计算能力相当于21500张H100显卡的英伟达芯片 [2] - 每个GB300包含一个中央处理器和两张Blackwell Ultra显卡,每张Blackwell Ultra显卡的性能比标准Blackwell B200提高50% [3] - 新型Blackwell芯片相比之前的H100旗舰AI加速器,在大语言模型推理方面提供约30倍的性能提升 [2][3] 与其他云计算公司的合作 - 公司向风险投资支持的云计算初创公司Lambda Labs委托了价值数十亿美元的数据中心容量 [2] - 新合作伙伴关系将使Lambda为公司建设价值数十亿美元的AI基础设施,项目将涉及数万张显卡,部分部署在GB300 NVL72设备中 [3] - 公司此前与CoreWeave公司签署了AI基础设施合作协议,预计到本世纪末将在CoreWeave平台上花费100亿美元 [4] 监管批准与未来计划 - 公司已获得美国商务部将新GPU运往阿联酋所需的批准 [3] - 公司预计将在未来12个月内获得额外的GPU出口许可证 [3] - 公司估计在阿联酋的基础设施投资将伴随24亿美元的当地运营费用和销售成本 [3]
GPU会成为新的石油吗?
伍治坚证据主义· 2025-10-01 14:22
文章核心观点 - GPU作为人工智能算力的核心资源,其重要性正迅速提升,未来十年全球在GPU上的花费可能超过石油 [2] - GPU正走在金融化的道路上,可能像石油、铜等大宗商品一样开发指数和期货合约 [2] - 算力金融化标志着人类社会资源观的根本转变,从物质资源转向数据、算法和算力等新型资源 [5] GPU需求与供给动态 - 美国AI数据中心的电力需求预计到2035年将达到1.23亿千瓦,相当于2024年水平的30倍 [3] - 当前H100显卡单价已高达2万美元以上,企业需要通过抢货才能获得 [2] - GPU供给受制于台积电的产能、美国出口管制以及英伟达的产品节奏,存在不确定性 [3] GPU金融化的潜在路径与影响 - 金融市场可能为GPU建立指数并开发期货合约,使算力成本可被锁定和对冲 [2][3] - 算力期货可帮助AI创业公司锁定未来三年算力成本,云计算公司可对冲价格波动 [3] - 可能出现算力指数期货、AI芯片ETF及GPU波动率指数等金融产品 [4] GPU作为大宗商品的特殊性 - GPU技术迭代速度快,一代显卡生命周期往往只有几年,存在快速贬值的风险 [4] - 与可长期储存的石油不同,GPU更像会贬值的生鲜产品,新旧更替速度过快 [4] - 历史上金融化的大宗商品如石油、铜、黄金均经历过泡沫和暴跌的周期 [4] 算力资本主义时代的投资视角 - 长期受益者可能是产业链中占据优势的企业,如制造商台积电、设计商英伟达、掌握云算力的微软和亚马逊 [5] - 人类社会资源观正从煤炭、钢铁、石油等物质资源转向数据、算法和算力等新型资源 [5] - 20世纪是石油资本主义,21世纪可能是算力资本主义,但市场的周期律不会改变 [5]
硅谷改朝换代
虎嗅· 2025-08-05 09:40
中国科技行业变迁 - 2000年代初北京中关村创业氛围浓厚,风投与创业者频繁互动,互联网泡沫破灭后移动互联网重新点燃行业热情 [3][6] - 当前科技圈更封闭谨慎,企业创始人采访需经PR层层协调,媒体角色从记录者变为被公关引导的对象 [8][9][10] - 创业者仍保持深夜工作习惯但不再热衷讲述故事,信息流动路径复杂化 [11][12] 硅谷技术转型 - 硅谷从Web 2.0时代的音乐流媒体、社交平台转向神经网络、GPU和大模型架构的硬科技时代 [14][16] - 科技工作文化从"rest and vest"休闲模式转变为高强度AI研发氛围,OpenAI等工作环境类似修道院 [15][18] - 技术讨论焦点从HTML5转向H100显卡获取、神经网络等硬核话题,旧金山南部形成AI初创公司聚集区"角斗场" [19] 行业人才需求变化 - 招聘要求从"讲故事能力"转变为"分布式训练经验"等技术指标,PhD工程师取代愿景演讲者成为核心人才 [23] - 谷歌等科技巨头缩减招聘规模,现有员工面临管理层优化压力 [20] - AI工程师在Hayes Valley("脑谷")形成交流社区,讨论主题转向多模态训练等技术话题 [21] 投资方向演变 - 投资热点从消费互联网转向军事、能源、航空航天领域,防务科技与无人机公司受追捧 [22] - Meta向Scale AI投入140亿美元,Uber办公楼分租给OpenAI,旧金山金融区重新活跃 [26] - 创业者目标从"创造美好生活方式"转向"建构超越人类的智能存在" [28] 硅谷秩序重构 - 硅谷从"消费互联网乌托邦"秩序转向"冷硬技术军备经济体",价值核心从用户增长转向智能重构 [32][36][39] - 技术共享使硅谷担忧领导地位被中国超越,行业呈现"技术民族国家"特征 [22][37] - Stability AI等公司仍保持派对文化,科技乐观主义与硬核技术形成奇特混合 [25]
英伟达被约谈,这事可能比大家想的更严重
36氪· 2025-08-01 10:23
事件背景 - 英伟达首席执行官高调宣布可向中国市场销售H20显卡,准备了价值几十亿美元的库存 [1] - 随后英伟达因H20显卡的后门安全风险被中国有关部门约谈 [1] - 该约谈事件得到各大中国官方媒体转发,显示事件重要性 [1] 美国立法动向 - 美国议员呼吁为出口的先进芯片配备"追踪定位"功能,并将此要求写入《芯片安全法案》 [6] - 美国政府通过立法手段将芯片内置后门行为公开化属首次 [6] - 法案提出背景与今年初中国AI公司DeepSeek的爆火有关,冲击了美国官员认知 [7] - 4月份美国议员提出《停止窃取我们的芯片法案》,通过举报人激励机制打击芯片走私行为 [9] - 5月份民主党议员比尔·福斯特提出《芯片安全法案》,核心要求是在芯片中植入位置验证技术,一旦发现芯片流入限制区域(如中国)可远程锁死 [11] - 该法案已得到美国国会两院的两党支持,立法过程中的阻碍极小 [16] 技术原理分析 - 法案要求的技术并非内置GPS或地理围栏,而是基于Ping的定位技术 [19][21] - 通过测量设备与地标服务器之间的信号往返延迟时间来计算距离,利用三角定位法锁定芯片位置 [24] - 法案要求AI芯片必须凭自带密钥向可信地标服务器发送信息验证身份,断网后芯片可能无法使用 [26] - 该技术可通过软件更新实现,并能应用于老款显卡,已有工程师团队在H100显卡上实现初级版本的位置验证 [27] 对英伟达的影响 - 遵守法案要求需进行固件和软件更新,使AI芯片可快速进行位置验证,成本约100万美元 [30] - 需在所有可能发生走私活动的国家及地区附近建设可信地标服务器网络,年成本在250万美元至1250万美元之间 [30] - 位置验证系统的新增成本,仅需英伟达多销售500块AI芯片即可收回 [31] - 英伟达中国特供版H20显卡面临销售困境,美国政府的举措使其生意更难开展 [31][32] 行业影响与展望 - 事件凸显在国防安全核心技术领域坚持国产自研的重要性 [34] - 以华为昇腾为代表的国产算力卡已展现出突破迹象,有望使《芯片安全法案》等技术限制措施失效 [34]