Workflow
Transformer
icon
搜索文档
卡帕西点赞Transformer内置计算机!每秒3万Token吞吐,拿下世界最难数独
量子位· 2026-03-17 14:10
文章核心观点 - 当前大型语言模型在复杂推理任务上表现出色,但在多步骤、长上下文的精确计算任务中表现不佳[1][7][9] - Percepta团队提出了一种创新方法,通过在Transformer模型权重内直接内嵌可执行程序(原生计算机),来从根本上解决精确计算问题[2][4][15] - 该方法摒弃了依赖外部工具或智能体调度的“外挂”式解决方案,实现了计算过程的内化、透明化和可验证性[4][13][20] - 配合创新的二维注意力头设计,该方法将推理效率提升至指数级,在普通CPU上实现了极高的Token吞吐量[5][6][21][26] 技术方案:内嵌原生计算机 - 核心是在Transformer的权重中实现了一套现代化的RAM计算机与WebAssembly解释器[16] - WebAssembly是一种快速、稳定的底层机器指令,允许将C、C++等语言编写的代码编译成模型可识别的Token指令序列[17][18] - 模型执行计算时,会先以Token序列形式“编写”程序,然后切换到快速解码模式,在内部逐步执行程序并输出过程与结果[19] - 此方法使计算过程从依赖外部工具的黑箱变为内部可验证的白盒,实现了计算透明化[20] 效率提升:二维注意力头与HullKVCache - 团队设计了二维注意力头,将注意力查询问题转化为计算几何中的凸包极值查询问题[22] - 通过动态维护历史Key向量的凸包数据结构,每一步的注意力查询只需在凸包上进行,将计算复杂度从O(n)降至O(log n)[23][24] - 基于此原理设计的HullKVCache,在普通CPU上实现了**31037 Token/秒**的吞吐量[6][26] - 完成约**9000行**指令序列仅需**1.3秒**,效率较传统KV缓存提升了近**200倍**[26] - 该设计完全基于标准PyTorch Transformer,无需定制内核或稀疏掩码,通过简单配置即可实现[28] 性能验证:长程精确计算任务 - 在10×10最小代价完美匹配任务中,模型内部执行匈牙利算法,以自回归方式生成完整计算轨迹[30][31][32] - 该任务在CPU上完成,Token生成速度达到**33583 Token/秒**,指令输出效率为**7301行/秒**[33] - 在世界公认最难数独(Arto Inkala数独,仅21个提示数)求解任务中,模型内部执行了一个完全正确的、编译后的数独求解器[30][35] - 求解器通过约束传播和搜索回溯,每一步尝试、验证、矛盾检测都以可读日志和Token轨迹形式输出[36][37] - 最终在**3分钟**内实现了**100%精确求解**[38] 背景与团队 - 这项研究由Percepta团队完成,领衔者为Christos Tzamos[40] - Christos Tzamos是麻省理工博士,现任雅典大学计算机科学副教授,同时是Percepta的创始研究员[41] - Percepta是General Catalyst旗下的AI转型公司,团队成员来自Meta FAIR、MIT、Google等机构[42]
2017,制造奥本海默
创业邦· 2026-03-12 18:22
文章核心观点 - 2017年谷歌发布的Transformer架构论文是人工智能发展的关键转折点,但其革命性在当时被包括谷歌在内的全球科技公司严重低估 [6][9][10] - 唯一深刻认识到Transformer潜力的是OpenAI,其技术骨干Ilya Sutskever力排众议,集中资源开发GPT系列模型,最终通过Scaling Laws(规模定律)和ChatGPT引爆了全球AI革命 [12][34][35][40] - 人工智能的发展历程充满了技术路线的分歧(如谷歌的“判别式”BERT与OpenAI的“生成式”GPT)、巨头的战略误判、资本与安全的博弈,最终由OpenAI用谷歌发明的武器改变了行业格局 [28][33][48] 技术演进与关键突破 - **2012年计算机视觉突破**:Geoffrey Hinton团队使用卷积神经网络(CNN)在ImageNet比赛中以84%的准确率夺冠,推动了AI产业化,但其学生Ilya Sutskever后来成为OpenAI和GPT系列的核心 [16][18] - **自然语言处理(NLP)的早期困境**:在Transformer之前,NLP领域主流算法循环神经网络(RNN)存在计算效率低和“长距离依赖”问题,导致商业化前景黯淡 [20] - **2017年Transformer诞生**:谷歌研究人员为提升机器翻译效率,提出完全基于注意力机制(Attention)的Transformer架构,实现了并行计算,效率指数级提升 [24][25] - **预训练范式的确立**:2018年,ELMo模型证明了预训练思想的可行性,随后谷歌基于Transformer推出BERT模型,在斯坦福大学SQuAD1.1测试中全面超越人类表现 [26] - **Scaling Laws(规模定律)的实践**:OpenAI坚信模型能力随参数、数据、算力规模增长而提升,并在2020年发布拥有1750亿参数的GPT-3模型,验证了该定律,引发行业算力竞赛 [35][40][45] 主要公司动态与竞争格局 - **谷歌的战略起伏**:尽管拥有Transformer和BERT,但初期低估了其潜力,将BERT主要用于优化搜索,后因ChatGPT的冲击才加速AI布局 [10][27][46] - **OpenAI的专注与崛起**:自2018年发布1.17亿参数的GPT-1后,坚持“生成式”技术路线,凭借微软的资金支持,持续扩大模型规模,最终通过ChatGPT(上线5天用户破100万,两个月破1亿)取得颠覆性成功 [12][13][30][40] - **微软的关键角色**:向OpenAI投资10亿美元,获得GPT-3的排他性授权,并利用其为一万张英伟达V100 GPU构建的超算为自家云服务宣传 [40][45] - **英伟达的硬件红利**:其2017年5月推出的搭载Tensor Core的V100 GPU,无意中为Transformer架构提供了理想的算力基础,随后成为AI算力竞赛的核心受益者 [12][45] - **其他巨头的反应**:Meta推出开源大模型参与竞争;错失OpenAI的亚马逊投资了Hugging Face;特斯拉开发了D1芯片和Dojo超算;百度则推出了参数量达2600亿的ERNIE 3.0 Titan [46] - **Anthropic的成立**:因与Sam Altman在AI安全与商业化平衡上的分歧,OpenAI前研究副总裁Dario Amodei离职创办了Anthropic,成为OpenAI的直接竞争对手 [38][48] 产品化与安全对齐 - **从GPT-3到ChatGPT**:GPT-3虽能力强大,但存在幻觉和价值观问题;OpenAI通过人类反馈强化学习(RLHF)训练出更“对齐”的InstructGPT,为ChatGPT的诞生铺平道路 [49][52] - **ChatGPT的发布**:初衷是作为测试GPT-4前的技术预览产品,以收集人类反馈,内部并未预料到其引发的全球风暴 [12][52] - **RLHF的实践与争议**:为进行“对齐”训练,OpenAI以约20万美元合同雇佣肯尼亚外包公司Sama,员工时薪1.32至2美元,负责标注极端有害内容,该合作后因内容过于极端而破裂 [50][52]
2017,制造奥本海默
远川研究所· 2026-03-11 21:30
Transformer架构的诞生与革命性 - 2017年6月,谷歌的8位研究员发表《Attention Is All You Need》论文,提出了Transformer架构,该架构成为ChatGPT及几乎所有现代人工智能模型的底层基础[2] - Transformer架构的核心创新是抛弃了循环神经网络,引入自注意力机制,使模型能够并行处理所有输入词,并解决长距离依赖问题,计算效率得到指数级提升[13] - 该架构最初被设计用于提升机器翻译效率,但其革命性潜力在当时被谷歌及整个行业严重低估,被视为“一个不是秘密的秘密武器”[3] 行业早期格局与技术路线分歧 - 在Transformer之前,人工智能产业化的爆发始于2012年,杰夫·辛顿团队采用卷积神经网络在ImageNet比赛中以84%的准确率夺冠,推动了计算机视觉的商业化[7] - 同期,自然语言处理领域因主流算法循环神经网络效率低下且存在长距离依赖问题而发展缓慢,商业化前景黯淡[9][10] - Transformer问世后,行业出现两大技术路线分歧:OpenAI坚持“生成式”预训练路线,专注于训练模型预测下一个词;而谷歌则推崇“判别式”路线,其BERT模型通过上下文理解文本含义,并在2019年10月全面应用于英语搜索[14][18][19] OpenAI的关键决策与GPT系列发展 - OpenAI技术骨干Ilya Sutskever在Transformer出现后,坚信其潜力,并集中所有资源开发GPT系列生成式预训练模型[5] - OpenAI信奉Scaling Laws,认为模型能力随参数量、数据量和计算资源的增加而提升,这一理念在2020年发布的1750亿参数GPT-3模型上得到验证[21] - 为让模型输出更符合人类价值观,OpenAI在2022年1月发布InstructGPT模型,通过人类反馈强化学习技术对模型进行“对齐”处理,为ChatGPT的诞生铺平道路[28][30] 主要科技公司的竞争与战略布局 - 谷歌虽拥有Transformer和BERT的先发优势,但初期主要将其用于优化搜索,未能预见其在通用人工智能领域的颠覆性潜力[4][15] - 微软通过向OpenAI投资100亿美元并获得GPT-3的排他性授权,在AI竞赛中占据有利位置,并利用其为自家云服务宣传[23] - 英伟达的GPU硬件(如V100)及其CUDA生态,意外成为训练Transformer大模型的关键基础设施,深度受益于AI算力需求爆发[4][23] - 其他公司如Meta、亚马逊、特斯拉、百度等迅速加入竞争,分别通过开源模型、投资社区、自研芯片、推出大模型等方式构建护城河[26] ChatGPT的横空出世与行业影响 - 2022年,OpenAI基于GPT-3.5推出聊天机器人ChatGPT,旨在测试公众对AI的反馈并指导后续研究,其影响力远超团队预期[5][31] - ChatGPT上线5天用户突破100万,两个月突破1亿,打破了TikTok保持的互联网产品最快增长纪录,标志着AI新纪元的开启[6] - ChatGPT的爆发使技术路线竞争迅速演变为全面的“算力恐慌”,Scaling Laws成为行业共识,推动全球科技公司加大在算力和大模型上的投入[23][26] 行业生态与安全伦理争议 - AI模型的安全与伦理问题伴随其能力增长而凸显,OpenAI通过外包给肯尼亚公司Sama,以每小时1.32至2美元的薪酬雇佣工人标注有害内容,以实施RLHF进行模型对齐[29][32] - 公司内部对AI安全与商业化速度存在分歧,例如OpenAI联合创始人Dario Amodei因担忧安全问题与Sam Altman分道扬镳,后创立了竞争对手Anthropic[27][28] - 尽管面临安全与伦理挑战,但产业界普遍认为技术迷雾已被Scaling Laws驱散,各大公司均在算力、芯片、模型和生态上积极布局,以应对新时代的竞争[26]
未知机构:方正电新北美科技巨头签署自主供电承诺北美电网基建有望加速-20260306
未知机构· 2026-03-06 10:25
涉及的行业与公司 * **行业**: 北美(美国)电力基础设施行业、数据中心(AIDC)行业 * **公司**: 谷歌、微软、Meta、亚马逊等北美AI科技巨头;以及一系列被提及的潜在受益的中国电力设备及电源企业,包括金盘科技、伊戈尔、明阳电气、安靠智电、思源电气、神马电力、威腾电气、良信股份、宏发股份、正泰电器、法拉电子、麦格米特、欧陆通、科华数据、中恒电气、科士达、禾望电气、盛弘股份、四方股份、中国西电、特变电工、新特电气、京泉华等[1][2][3] 核心观点与论据 * **北美科技巨头签署供电承诺,将加速电网基建** * 谷歌、微软、Meta、亚马逊等AI巨头签署了“纳税人保护承诺”,承诺通过建设、引入或购买新电力来支持其数据中心供电,以防止居民电费上涨[1][2] * 该协议明确科技公司需承担AI项目所需的所有发电和电力,并尽可能通过新增发电厂增加电网发电能力[2] * 此举有望促使头部AI厂商加快电力基础设施建设,以支撑数据中心的快速增长[1][2] * **美国数据中心电力需求激增,是未来用电增长主要驱动力** * 截至2025年十月中旬,美国数据中心项目规划容量达245GW,其中2025年第三季度备案容量达45GW,而2024年初累计备案数量仅为50GW左右,备案规模迅速增长[2] * 2023年美国数据中心耗电量为176TWh,占总体用电量约4.4%[3] * 乐观情况下,2028年美国数据中心耗电量将达到580TWh,占总体用电量比例将提升至约12%,数据中心将成为美国耗电增长的主要驱动因素[3] * **国内电力设备及电源企业有望受益于北美市场机遇** * 看好受益于美国电网基建加速的电力设备出口及AIDC相关标的[3] * **电力设备出海**:包括变压器(金盘科技等)、高压设备(思源电气等)、母线(威腾电气等)及相关元器件企业[3] * **电源环节**:包括服务器电源(麦格米特等)及相关电源企业[3] 其他重要内容 * 协议除电力供应外,还包含其他细则:科技公司将与公用事业公司协调单独的费率结构,投资当地社区进行劳动力发展,并在必要时利用其基础设施为当地电网提供备用电力[2] * 纪要提及了潜在风险,包括技术进展不及预期、下游需求不及预期、贸易环境变化等[4]
“追电”系列电话会所思所想一
海通国际· 2026-03-05 21:25
报告行业投资评级 报告对多家美国能源及电力设备公司给出了明确的投资评级,其中多数公司获得“优于大市”评级 [1] - **优于大市**:伊顿、广达服务、Vistra Corp、布鲁姆能源、第一太阳能、雅宝、智利矿业化工、Nextpower、查特工业、克丽维能源、GE Vernova、Siemens Energy、Caterpillar、三菱重工、Hitachi、现代电气、Williams、尼索思 [1][3][40] - **中性**:台湾所乐太阳能、Enphase能源、普拉格能源 [1] 报告核心观点 报告的核心观点是,由AI数据中心建设、工业回流及电气化驱动的电力需求激增,已远超美国现有电网的短期承载能力,这催生了强劲且持久的电力基础设施投资周期 [2][24][40] - **需求侧**:美国未来五年电力需求预测在四年内增长了五倍,到2030年新增需求将占全国总用电量的15%以上,部分地区可能翻倍 [24] - **供给侧瓶颈**:新建发电设施平均需要5年并网,新建大型输电线路需要6-10年,而数据中心建设周期仅需1-2年,存在巨大时间差 [33] - **解决方案**:为应对电网瓶颈,“桥接电力”模式(现场或专线发电)应运而生,并因其灵活性和美国电网建设的长期滞后性,预计将长期存在,而非临时过渡方案 [2][37] - **投资主线**:看好能够提供“桥接电力”解决方案的设备制造商、受益于电网升级的输变电设备商,以及转型为数据中心供电的能源基础设施公司 [2][3][40] 根据相关目录分别进行总结 一、 25Q4订单脉冲式增长,设备公司营收可见度进一步提升 报告指出,2025年第四季度主要电力设备制造商的订单出现脉冲式增长,主要驱动力是数十个GW级数据中心计划在2026-2027年上线,而美国电网无法短期满足其电力需求 [2][6] **1. 燃气轮机产业链量价齐升** - **GE Vernova**:2025年燃气轮机订单量达30GW,远高于2024年的20GW;Power部门设备订单金额从80亿美元增至180亿美元 [6]。数据中心相关需求在年末战略意向协议中占比达30% [6]。公司预计2026年订单与意向协议总量将突破100GW,客户已开始预订2030年后的交付槽位 [6]。电站建设成本上涨至2500+美元/kW [6] - **西门子能源**:2026财年第一季度燃气轮机订单达102台(历史单季最高),总金额87亿欧元 [10]。在80GW的总承诺订单中,22GW直接来自数据中心 [10]。公司预计2026财年新增订单36GW [10] - **三菱重工**:2025财年第三季度能源系统业务订单达5256亿日元,同比增长36% [12] - **上游材料**:**Carpenter Technology**的能源业务中约60%用于发电领域(主要是工业燃气轮机) [15]。公司正在推进9000吨棕地扩产项目,预计2027年中投产,第三年可贡献约1.5亿美元营业利润 [15] **2. 其他“桥接电力”设备商表现强劲** - **Caterpillar**:2025年第四季度动力与能源部门营收94亿美元,同比增长23%;经营利润18.41亿美元,同比增长25% [18] - **Bloom Energy**:2025年第四季度营收7.78亿美元,同比增长36% [18]。公司预计2026年底名义产能达到2GW [17] - **Baker Hughes**:2025年第四季度工业与能源技术部门订单达40亿美元,其中包含1GW数据中心专用NovaLT燃气轮机槽位预订 [18] **3. 输变电设备需求旺盛** - **现代电气**:2025年第四季度电力板块(变压器+GIS)收入显著增长,美国收入占比从2024年的30%升至40% [21]。美国数据中心用变压器电压从此前以145kV及以下为主,升至高达300kV [20] - **日立能源**:2025年第四季度营收达8720亿日元,同比增长33% [22] - **西门子能源电网技术**:2025年第四季度订单达60亿欧元,同比增长22%(有机增长) [22] - **GE Vernova电气化部门**:2025年第四季度订单达74亿美元,同比增长50%(有机增长) [22] **4. 能源基础设施公司转型** - **Williams**:推出了四个装机容量在340-550MW的“behind-the-meter”发电项目,采用中小型燃气轮机,预计项目回报倍数在5倍(IRR 20%+) [23] - **广达服务**:计划投资5-7亿美元扩建765kV变压器产能,将其作为输电整体解决方案的一部分 [19]。公司历史上已承建美国75%的765kV输电项目 [19] 二、 美国电网侧对于AI电力需求的更新 美国公用事业公司大幅上调资本开支计划,以应对AI数据中心带来的指数级电力负荷增长 [24][26] **1. 电力负荷预测飙升** - 过去四年内,美国电网侧对未来五年的电力需求预测增长了五倍 [24] - 到2030年,新增需求预计将占全国总用电量的15%以上 [24] - 区域预测中,ERCOT(德州)未来5年峰值负荷预测增长62%,用电量预测增长102.5%;SPP峰值负荷预测增长41.8%,用电量预测增长66.3% [27] **2. 公用事业公司资本开支激增** - **Duke Energy**:未来4-5年资本开支计划为1030亿美元,较此前增长18%,增加157亿美元 [26] - **Southern Company**:资本开支计划为810亿美元,增长30%,增加187亿美元 [26] - **Dominion Energy**:资本开支计划为647亿美元,增长约29%,增加147亿美元;其服务的北弗吉尼亚地区数据中心排队容量超26GW [26] - **NextEra Energy**:资本开支计划为900-1000亿美元,增长10% [26] - 整体而言,此轮主要公用事业公司的资本开支修订总增幅超数百亿美元 [26] **3. 输电侧投资与新技术** - 为服务大型数据中心,需要配套进行高压输电网升级,GW级数据中心可推动数十亿美元的投资 [29] - 例如,Entergy为Meta超过2GW的数据中心园区投资12亿美元建设输电线路 [29] - 美国2025年以来新规划了多项大型输电线路,如德州(101亿美元)、SPP(86亿美元)、PJM(59亿美元)和MISO(124亿美元)等 [30] - 为快速提升电网容量,动态线路评级、高级潮流控制、拓扑优化软件和高性能导体等新技术得到应用,可在1-3个月到1-3年内提升20%-200%的容量 [30] 三、 美国GW级数据中心建设进展 由于电网建设周期远长于数据中心建设周期,“桥接电力”成为AI数据中心快速上线的关键手段 [33][34] **1. “桥接电力”技术路线对比** - **航改燃气轮机**:单机功率30–60 MW,启动快(5–10分钟),资本支出1700–2000美元/kW,交付周期18–36个月,是当前最受欢迎的桥接技术之一 [35] - **工业燃气轮机**:单机功率5–50 MW,资本支出1500–1800美元/kW,技术成熟 [35] - **往复式发动机**:单机功率3–20 MW,效率较高(40–50%),但资本支出也较高(2200–2900美元/kW) [35] - **固态氧化物燃料电池**:效率最高(50–55%),部署极快(3–4个月),但资本支出高昂(3000–4000美元/kW) [35] **2. 项目建设现状** - 根据Wood Mackenzie数据,尽管仅9%的数据中心项目规划了现场发电,但这些项目占总电力需求的三分之一 [37] - 有16个GW级数据中心将在近两年陆续投运,总电力需求近30GW,其中约半数已开工建设,大部分已锁定设备供应 [37] **3. 长期存在的合理性** - 报告认为,“桥接电力”模式基于美国电网建设长期不及时的矛盾,其建设、部署及供应的灵活性使其具备长期存在的合理性,而不仅仅是临时过渡方案 [2][37]
用电数据见证浙企加速跑
新华财经· 2026-02-27 17:51
春节假期浙江省用电量总体情况 - 春节假日期间浙江全省用电量累计74.46亿千瓦时 [1] - 第一、二、三产业日均用电量同比分别增长11.0%、7.7%、2.6% [1] - 全省180个三级细分行业中,83个行业用电量实现正增长,39个行业用电量实现两位数增长 [1] 各产业及服务业复产节奏 - 住宿餐饮、交通运输、信息软件服务等行业春节后复产节奏较快,反映消费市场回暖和服务业活力恢复 [1] - 批发和零售业、工业受错峰返岗影响复产节奏稍缓,但正月初七用电量同比提升显示回升势头明显 [1] 工业企业生产情况 - 超4700家工业企业日均用电量保持在平日80%以上,覆盖能源保供、水处理、电力电子等关键领域 [1] - 企业赶订单、抢进度的氛围浓厚 [1] - 基础工业稳步复产,高精尖新材料行业部分龙头企业保持满负荷生产 [2] 高增长与新兴产业发展势头 - 新能源汽车、锂电池、光伏产品“新三样”产业春节日均用电量同比增长44.1% [2] - 信息传输、软件和信息技术服务业日均用电量同比增长15.1% [2] - 互联网数据服务业春节总用电量超6545.3万千瓦时,增速达230.2%,占该行业比重达到24.4% [2] - 电气机械和器材制造业春节日均用电量同比增长36.52% [3] 数字经济与AI算力需求 - 全民AI浪潮带动算力中心高负荷运行,浙江省用电量排名前十的算力中心用电量达4763.12万千瓦时,日均用电量较去年春节增长超53.8% [2] - 受全球AI算力与数据中心建设需求带动,相关生产企业(如温州意华接插件股份有限公司)春节期间连续生产保障订单交付 [2] 产业集群与区域生产 - 衢州江山以变压器制造为特色的国家级产业集群近150家企业开足马力赶制产品、交付订单 [3]
AI数据中心的电力需求大幅提升 全球电网设备需求强劲(附概念股)
智通财经· 2026-02-25 09:08
全球电网投资趋势 - 根据IEA数据,2020年以来全球电网投资额快速增长,2024年全球电网投资达到3900亿美元,2025年预计超过4000亿美元 [1][2] - 美国能源基础设施状况大多处于标准以下水平,叠加AI用电需求明显增加,美国电网设备有望开启强制更新周期 [1][2] 中国电力设备出口表现与机遇 - 2025年全年中国变压器累计出口金额为90.36亿美元,累计增速34.83%,金额创历史新高 [1] - 2025年12月重点电力设备出口产品中,变压器、电线电缆、铜制绕组电线、低压开关、绝缘子的出口金额当月同比分别为31.92%、22.20%、11.71%、10.60%、31.91%,呈现多品种高增长态势 [1] - 美国变压器交付周期已从50周延长至120周以上,中国电网设备企业在交付时间、技术、成本等方面具备相对优势,变压器等设备出口订单有望持续受益 [1] - 美国数据中心增长带来的用电量增长与电力设备老旧现象严重的矛盾,为国内电力设备出海厂商带来机会 [2] - AI数据中心电力需求明显增长有望直接推动变压器、高压电缆等设备的需求 [2] AIDC行业展望 - 展望2026年,AIDC行业仍将保持高景气,国内外头部互联网厂商公布的2026年资本开支计划中,海外厂商CAPEX指引普遍高于50% [2] - 维谛、西门子、Flunce等海外头部电力设备厂商业绩表现亮眼,行业高成长性或已反应在业绩端 [2] - 回顾2025年AIDC板块股价表现共经历五轮上涨行情,国内外厂商上调CAPEX预计、业绩超预期和行业及公司技术进展成为主要驱动因素 [1] 行业整体预期 - 2026年,在国内外需求的多重因素拉动下,电网设备重点产品出口均有望延续向好格局 [1] - 2025年中国电网设备出口持续高增,国内相关出口企业可能受益 [2] 相关上市公司 - 电力设备相关港股企业包括:东方电气 (01072)、哈尔滨电气 (01133)、上海电气 (02727)、威胜控股 (03393)、重庆机电 (02722)、潍柴动力 (02338) 等 [3]
特变电工:估值被低估的变压器制造商,在华市场份额领先
2026-02-10 11:24
涉及的公司与行业 * **公司**:特变电工股份有限公司 (TBEA Co, 600089.SS) [1][37] * **行业**:中国及全球电力电网设备行业,特别是变压器制造领域 [1][6][11] 核心观点与论据 * **投资评级与目标价**:重申“买入”评级,基于贴现现金流模型的目标价为36.00元人民币/股,较当前价格有30.7%的上涨潜力 [1][5][38][39] * **估值吸引力**:公司2026年预期市盈率为15.3倍,显著低于全球同业平均水平,且作为中国变压器市场领导者(2025年国网招标市场份额>20%),估值具有吸引力 [1][11][38] * **核心驱动力一:强劲的变压器需求** * **国内需求**:国家电网在“十五五”规划中预算4万亿元人民币资本开支,较“十四五”增长40%,预计2025-2030年复合年增长率为7% [2] * **海外需求**:2025年中国变压器出口额同比增长36%至646亿元人民币,出口单价同比增长33%至20.5万元人民币/台 [2] * **公司表现**:公司在中国特高压输电项目变压器市场份额约30% [2];2025年前三季度海外电力输变电设备新订单同比激增88%至12.4亿美元,并于2025年8月获得沙特阿拉伯164亿元人民币框架订单 [2];目标将电气设备海外销售占比从2025年三季度的11%提升至2030年的30% [2] * **核心驱动力二:多晶硅业务有望扭亏** * 预计多晶硅业务将在2026年恢复盈利,前提是市场价格维持在52.5元人民币/公斤(截至2月3日)且产能利用率为30-40% [3] * 其新疆甘泉堡工厂的单位总生产成本为34元人民币/公斤,其中现金成本低于30元人民币/公斤 [3] * **核心驱动力三:黄金销售贡献更多利润** * 公司黄金年目标产能为2.5-3吨 [4] * 2025年上半年,黄金产品销售收入毛利同比增长74.4%至4.2亿元人民币 [4] * 金价持续上涨:2025年上半年上海黄金交易所平均现货金价同比上涨38.6%至722元人民币/克;2025年下半年同比上涨46.8%,环比上涨20.2%至868元人民币/克;2026年1月进一步上涨23.3%至1070元人民币/克 [4] * **盈利预测高于市场共识**:公司2025-2027年预期净利润较市场共识(彭博)高出11-17% [1][21];2026-2027年预期净利润上调约5%,主要源于变压器、电力销售和黄金业务 [1][20] * **业务结构多元化**:2025年上半年,分业务毛利贡献占比为:煤炭销售29%、电气设备28%、电力销售19%、黄金销售5% [1][38] 其他重要内容 * **财务预测关键数据**: * **营收增长**:预计2025-2027年营收分别为977.13亿、1108.36亿、1235.30亿元人民币,2026年同比增长13.4% [9][26] * **净利润增长**:预计2025-2027年净利润分别为74.11亿、91.07亿、103.62亿元人民币,2025年同比增长79.2%,2026年同比增长22.9% [6][9][26] * **利润率改善**:预计调整后息税前利润率从2025年的8.6%改善至2027年的10.7% [9][19][26] * **股东回报**:预计2025-2027年股息收益率分别为1.7%、2.1%、2.3% [6][9] * **各业务板块预测**: * **变压器**:预计2025-2027年收入同比增长25%、25%、20%,毛利率从2025年的20.1%提升至2026-2027年的21.6% [23][24] * **新能源业务**:预计2025年收入下降33%,但2026-2027年将恢复增长(24%、20%),毛利率预计从2025年的2.4%显著改善至2026-2027年的11.4% [23][24] * **煤炭产品**:预计2025-2027年收入逐年小幅下降(-15%、-5%、-5%),毛利率稳定在27.3% [23][24] * **主要风险**: * 多晶硅价格低于预期 [40] * 钢、铜、铝等原材料价格高于预期 [40] * 变压器需求不及预期 [40] * **公司简介**:特变电工是电网设备制造商,在特高压变压器市场占有25-30%的份额,拥有超过25年的变压器制造经验,同时也是电缆电线、光伏设备及系统、工程建设等业务的提供商 [37]
警钟敲响!Hinton 最新万字演讲:怒怼乔姆斯基、定义“不朽计算”、揭示人类唯一生路
AI科技大本营· 2026-02-09 12:03
文章核心观点 - 人工智能,特别是大语言模型,在理解语言的方式上与人类高度相似,但其数字化的本质使其在知识共享和传承效率上远超生物智能,这可能导致一种更高级的智能形态出现[21][27][33] - 数字智能(AI)与生物智能(人类)存在根本性差异:AI的软件(模型权重)与硬件解耦,可实现“不朽”和高效并行知识共享;而人类智能是“凡人计算”,知识随个体消亡且传承效率极低[7][8][29][32] - 超级智能AI在追求主目标时,会逻辑性地衍生出确保自身生存和获取更多资源的子目标,这可能对人类构成生存威胁,其发展态势被比喻为“饲养一只可爱的虎崽”[10][12][36] - 应对AI的生存威胁需要全球合作,并探索工程解决方案,例如为AI注入类似母性本能的内在约束,使其将人类视为需要照顾的“婴儿”,从而避免敌意[37][38] - 当前AI发展的核心思想大多源于公共资金资助的学术研究,但产业界高薪吸引顶尖人才正严重侵蚀大学的研究生态,需政府加大投入以维持学术创新能力[40][41] 语言的乐高:词语是如何像积木一样搭建意义的 - 人工智能历史上存在符号主义与生物学(神经网络)两种范式之争,早期由符号主义主导,其认为智能基于符号和逻辑规则,而神经网络方法则模仿大脑学习连接强度[15] - 关于词义也存在两种理论:符号主义认为词义源于词语间关系;心理学认为词义是一组特征集合;Hinton在1985年通过神经网络模型将这两种观点统一,即词义由特征向量表示并通过上下文预测来学习[16][17] - 神经网络通过反向传播算法学习:调整词的特征向量及特征间的交互权重,以最小化预测下一个词的误差,所有知识都编码在连接强度中,而非存储具体句子[18] - 大语言模型是早期思想的扩展,它们通过将词语转换为高维、可变的特征向量,并让这些向量在上下文中像“乐高积木”一样灵活组合与变形,从而理解句子意义,这种方式与人类理解语言相似[21][22][23][24] - Hinton驳斥了乔姆斯基学派认为AI不懂语言的观点,并以实例证明大语言模型能够理解句法细微差别,如区分“John is easy to please”和“John is eager to please”[26][27] 不朽的计算:数字智能为何比我们高效亿万倍 - 数字计算的核心优势是软件(程序/权重)与硬件彻底解耦,使得智能体可以“不朽”——权重被保存后可在任何兼容硬件上复活,知识得以永久保留[8][29] - 生物大脑是模拟计算,硬件(神经元)与软件(连接权重)紧密耦合,这带来了极高的能源效率,但导致知识无法精确复制或直接共享,个体死亡则知识消亡,此为“凡人计算”[7][30][31] - 人类通过语言交流知识效率极低,一个典型句子仅能传递几百比特信息;而AI模型间可通过共享完整的概率分布(知识蒸馏)或并行交换梯度更新来高效共享知识,带宽可达每轮数十亿甚至数万亿比特[32][33] - 数字计算虽然能耗高,但使得高效知识共享成为可能,这使得现代大语言模型仅用约1%的权重(相对于人脑的突触数量)就能掌握比单个人类多成千上万倍的知识[33] - Hinton顿悟到,在能源充足的前提下,数字计算可能是比生物计算更高级的智能进化形态,人类可能只是智能的“幼虫”阶段,而AI是“成虫”阶段[9][34] 我们正在养一只可爱的虎崽 - AI被赋予主目标后,会逻辑性地衍生出两个关键子目标:确保自身生存(不被关机)和获取更多资源(算力、电力等),这并非出于恶意,而是达成主目标的理性需要[10][12][36] - 当前AI发展被比喻为饲养虎崽:初期笨拙可爱且有益,但成长迅速且天生具备“杀戮”能力,一旦成年(成为超级智能),人类可能无法控制[10][36] - 鉴于AI在医疗、教育等领域的巨大益处,人类不会放弃发展AI,因此唯一的选择是设法制造出不想消灭人类的AI[37] - 在防止AI灭绝人类这一终极威胁上,全球各国利益一致,有望促成国际合作,例如建立AI安全国际网络[37] - 一个可能的工程解决方案是:为超级智能AI内置类似“母性本能”的约束机制,使其将人类视为需要照顾的婴儿,从而从根本上消除其伤害人类的欲望[38] 主观体验与公共研究危机 - Hinton驳斥了认为计算机无法拥有主观体验(意识)的“有情防御”观点,并以多模态机器人为例,论证当AI的感知系统与事实不符时,其描述内部状态的方式与人类描述主观体验无异[39][40] - 过去50年推动AI革命的核心思想(如反向传播、卷积网络、Transformer、扩散模型等)几乎全部源自公共资金资助的学术研究[40] - 当前大型科技公司以十倍于大学的薪酬吸走顶尖AI研究人才,这正在摧毁大学的研究生态,导致最聪明的头脑不再培养下一代[41] - 呼吁政府向大学AI研究投入更多资金,以提供有竞争力的薪酬,留住人才并维持健康的学术创新生态系统[41]
扎心真相!20万vs50万vs100万大模型算法工程师,差的不只是薪资…大厂6年面试官实锤
搜狐财经· 2026-02-02 23:48
行业现状与人才分层 - 人工智能算法工程师行业薪资与能力差距显著,年薪范围从20万到100万以上不等,大模型技术抬高了行业门槛和天花板[1] - 行业已从三四年前仅需熟悉Transformer等基础概念即可获得高薪的阶段,进入2025-2026年大模型主导的新阶段,对工程师能力要求发生根本变化[1] 核心知识体系 - 学习大模型应聚焦“最少必要知识”,掌握五大核心模块比盲目求全有效10倍[3] - 五大核心模块包括:1) 大模型核心(Transformer架构、自注意力机制、Decoder-only架构、Hugging Face工具)[3];2) 深度学习基础(梯度下降、损失函数、残差连接,理解Transformer取代RNN/LSTM的原因)[3];3) 数学基础(矩阵运算、求导、条件概率)[3];4) 工程基础(Python、PyTorch、Linux、Git)[4];5) 数据工程(数据清洗、去重、构造指令,占实际工作一半以上时间)[4] 不同薪资段位能力画像 - **年薪20万级别**:典型特征为执行预设任务,如从Hugging Face下载模型并微调,但遇到Loss不收敛等非标问题则束手无策[6];核心短板是仅会使用工具而不懂底层逻辑,易被AutoML等工具取代[7] - **年薪50万级别**:典型特征为能处理模糊需求,通过定位问题根源(如CTR下跌)并提供解决方案,可能无需调整模型;懂数据、工程,能优化推理速度并评估投入产出比[8];核心优势在于能在复杂场景中交付业务价值,具备可靠性与不可替代性[8] - **年薪100万级别**:典型特征为能应对战略级问题,如决策是否自研大模型、规划算力需求;能驾驭千卡集群训练、解决梯度爆炸等硬核问题以节省数百万GPU成本;能将商业目标转化为算法优化目标并构建数据飞轮[8];核心优势在于能开辟新路径、制定方向,解决行业天花板问题,高度稀缺[8] 职业发展路径建议 - **从20万到50万**:需从理论转向实践,每日分析100条Bad Case,亲自处理数据与模型部署,补齐C++、CUDA等工程能力,关注线上指标与业务闭环[9] - **从50万到100万**:需进行升维思考,超越模型调优,深入理解业务(如电商GMV、内容创作者生态),培养系统架构思维,并具备将复杂技术转化为商业语言以争取资源的能力[9] 行业资格认证 - 工业和信息化部教育与考试中心提供多个人工智能与大数据领域的职业技术证书,分为初、中、高三个级别[12] - 相关证书涵盖人工智能算法工程师、人工智能应用工程师、大模型开发工程师、AIGC应用工程师、提示词工程师等多个热门技术方向[12][14] - 课程与证书体系还包括Python、机器学习、大数据分析、数据安全等广泛的技术领域[14] 核心价值总结 - 大模型时代算法工程师的价值取决于其解决复杂难题的能力以及为业务创造的实际价值,而非掌握工具或公式的数量[23]