SVG
搜索文档
舍弃 VAE,预训练语义编码器能让 Diffusion 走得更远吗?
机器之心· 2025-11-02 09:30
舍弃VAE的扩散模型新范式 - 当前主流的隐扩散模型依赖预训练的变分自编码器将图像压缩至紧凑的潜空间,该范式包含VAE编码和潜空间扩散两个核心阶段[8] - VAE已成为下一代生成模型能力提升的主要瓶颈,其计算成本高昂,例如Stable Diffusion 2.1的VAE编码器处理高分辨率图像需要135.59 GFLOPs,超过其扩散U-Net网络的86.37 GFLOPs[8] - VAE的训练目标导致其潜空间存在语义纠缠问题,即不同类别对象特征混乱混合,缺乏清晰边界和聚类结构,这构成生成质量的保真度瓶颈并导致训练低效不稳定[9] - 纽约大学谢赛宁团队的RAE和清华&快手团队的SVG工作均选择弃用VAE,改用预训练语义编码器来构建新范式,以解决语义纠缠、计算效率低及生成与感知任务割裂等问题[9] - RAE提供了一个通用框架,通过将任意冻结的预训练语义编码器与轻量级解码器配对,将扩散模型引入高维但语义丰富的潜空间[9] - SVG提出一种完全无VAE的架构,通过融合冻结的DINOv3语义主干和专用于捕捉细节的残差分支,构建兼具语义判别性与重构保真度的统一表征空间[10] - RAE和SVG的核心思路是将扩散模型从压缩优先转为语义优先,通过继承预训练基础模型的语义丰富表征空间,以解锁更优的效率、生成质量和任务通用性[10] - RAE和SVG均利用海量数据预训练的视觉基础模型所提供的强大先验知识,RAE的核心思想是表征优先,直接继承预训练语义编码器的能力以填补自编码器的语义鸿沟[11] 多模态大语言模型的视觉衰减问题 - 文本主导性跨越图像、视频、音频等不同模态,已成为多模态大语言模型的普遍缺陷[2] - 当推理链延长时,模型的注意力会从视觉Token迁移至语言Token[2] - 跨模态连接值的指数衰减定律影响了视觉信息在深层架构中的有效性[2] - 双通道注意力对齐机制可用于消除模态间的不一致性[2] - VAR方法旨在确保所有推理都基于可追溯的视觉事实[2] AI时代的商业法则与投资趋势 - LinkedIn创始人Reid Hoffman提出AI时代黄金商业法则为懒惰且富有[3] - Hoffman断言万物皆可软件化是硅谷的致命盲区[3] - AI时代的贪婪与懒惰法则可能终结Web 2.0时代先烧钱、后盈利的传统路径[3] - 顶尖大语言模型只能给出B-级共识,这种现象意味着人类专家的价值可能从知识储存库转移到了反共识思维[3] - Hoffman押宝原子世界,显示出对物理世界和数字世界结合领域的投资兴趣[3]
四方股份(601126):网内外业务景气共振,固态变压器有望打开新空间
国信证券· 2025-10-31 21:15
投资评级 - 报告对四方股份的投资评级为“优于大市” [1][5][24] 核心观点 - 报告认为公司网内外业务景气共振,固态变压器有望打开新增长空间 [1] - 公司前三季度经营业绩稳健,减值影响利润增速 [1][8] - 三季度以来网内交付修复,网外业务保持较快增长 [2][19] - 公司海外布局加速,多国实现标志性突破 [2][20] - 公司在固态变压器技术领域领先,已有多个重点项目交付业绩 [2][22] 经营业绩分析 - 2025年前三季度公司实现营收61.32亿元,同比增长20.39%;实现归母净利润7.04亿元,同比增长15.57% [1][8] - 2025年前三季度公司毛利率为30.77%,同比下降2.93个百分点;净利率为11.47%,同比下降0.51个百分点 [1][8] - 2025年第三季度公司实现营收21.11亿元,同比增长30.65%;实现归母净利润2.28亿元,同比增长22.78% [1][19] - 2025年第三季度公司毛利率为31.24%,环比上升1.83个百分点;净利率为10.77%,环比上升0.07个百分点 [1][19] - 2025年上半年电网自动化业务营收17.26亿元,同比增长2.21%,毛利率40.83%;电厂及工业自动化业务营收20.03亿元,同比增长31.25%,毛利率23.82% [2][19] 业务进展与亮点 - 公司海外市场取得突破,产品完成泰国、马来西亚、韩国、印尼等多国入网测试,并中标老挝、刚果、印度等多个SVG项目 [2][20] - 公司具备交流10kV-35kV、直流20kV-60kV接入,240V-800V直流输出的固态变压器系列产品,整机效率已提升至98.5% [2][22] - 公司是国内少有的能提供数据中心交直流配电系统一二次关键设备及全套解决方案的厂家,上半年中标阿里巴巴、中国移动等多个数据中心项目 [22] 盈利预测与估值 - 报告预计公司2025-2027年归母净利润分别为8.28亿元、10.05亿元、12.05亿元,同比增长16%、21%、20% [3][24] - 报告预计公司2025-2027年动态市盈率分别为28倍、23倍、20倍 [3][24] - 根据盈利预测,公司2025-2027年每股收益分别为0.99元、1.21元、1.45元 [4] - 报告预测公司2025-2027年净资产收益率分别为17.7%、20.2%、22.5% [4]
四方股份20251030
2025-10-30 23:21
涉及的行业与公司 * 行业:电力自动化设备、新能源(风能、太阳能)发电、储能、数据中心(IDC/AIDC)、电网投资 [2][4][10][11][28] * 公司:四方股份 [1][2][3] 核心财务与运营表现 * 2025年第三季度收入增速达30%以上,净利润增速超过20% [3] * 2025年前三季度累计收入同比增长20%,净利润同比增长16% [3] * 2025年前三季度新签合同同比增长约20%,为全年100亿新签合同目标奠定基础 [2][5] * 毛利率有所下滑,主要由于业务结构变化,但整体盈利能力和净利率保持平稳 [3] * 电网自动化发货同比增长约15%,电厂及工业自动化发货同比增长约25% [2][7] * 新能源发货增长40%-50% [2][7] 各业务板块进展 **电网业务** * 电网业务新签合同保持15%-16%的增长,主网招标情况优于预期 [2][5] * 主网和配网发货分别保持百分之十几和20%以上的增速 [7] * 公司对主网投资长期保持乐观,将在优势领域持续稳健增长 [10] **新能源业务** * 新能源业务新签合同增速达30% [2][5][13] * 增长得益于产品品类和区域拓展,重点关注升压站配套需求 [2][4][14] * 每个新能源场站必然配套一套升压站,四方提供中资产品、SV产品和开关柜产品,大规模场站合同可能过千万元 [2][14] * 海上风电项目订单创历史新高,大基地项目中的数字孪生取得突破 [4][14] **国际业务** * 国际业务表现亮眼,2025年前三季度新签订单达4.1亿元,去年同期仅为1.5亿元,同比增长显著 [2][6] * 2025年国际业务目标是保5争6亿元新签订单 [6] * 海外业务毛利率优于国内,一次系统毛利率较高,二次系统毛利率约40% [2][16] * 中标菲律宾最大光储项目,海外SVG订单达八九千万元,比去年显著进步 [15] * 公司计划到2030年海外业务占比达到30% [4][29] 战略技术与未来增长点 **中压直流输配电与SST(固态变压器)** * 公司将中压直流输配电视为未来重要机遇,SST是重要战略布局 [2][8] * 结合AI和新能源送出需求,中压直流配电具有巨大潜力,有望成为公司下一轮数量级增长点 [2][8] * SST本质上是一个中压直流配电系统,需要深度一二次融合的技术,公司具备从500千瓦到5兆瓦的产品系列和多次场景迭代经验 [17][20] * 预计SST在2027年有商用化可能,需在2026年完成挂网、试运行等验证工作 [4][11] * SST是切入欧美国际市场的重要抓手 [18] **调相机与无功支撑** * 公司重点发展分布式调相机和静止同步调相机,预计增量过亿元级 [4][14] * 在国内具备完整提供四大核心系统(启动、励磁、保护、D3S)能力的企业仅两三家,公司具备竞争优势 [14] * 2025年分布式调相机市场预计约有200台,2024年约为100台 [19] * 调相机与新能源存在公式关系,需求主要集中在三北地区的大基地 [33] **数据中心业务** * 数据中心业务是公司的重要战略优先级 [4][11] * 公司关注绿色算力发展,提供绿电直连(新能源直送数据中心)的源网荷储一体化系统解决方案 [21][28] * 在数据中心应用中,SST需改进体积、功率模块、散热等核心技术 [12][23] **储能业务** * 今年储能业务保持明显增长,但具体数据未披露 [22] * 公司储能业务与传统规模化储能厂家不同,服务于特定场景如火储联合调频、构网型储能、绿电直连项目 [25][26] * 高压级联式高压直挂方式的储能可减少传统柴发设备使用成本,四方参与南方电网标杆项目,拥有先进技术储备 [26][30] 但该技术在当前订单中未占主要位置,应用场景有限 [31] 其他重要信息 * 公司通过本地化团队、加强二次能力(如前期策划、电力系统仿真)提升国际竞争力 [15][27] * 公司将国际业务发展的指挥棒交给负责一次业务的领导,以促进一次和新业务发展 [27] * 国内外市场在电压等级(如国内数据中心用200多伏,国外用800伏)和标准规范上存在差异,公司进行针对性产品适配 [24] * 常规储能无法提供转动惯量,但构网型储能可以满足基本要求 [34]
VAE再被补刀,清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
36氪· 2025-10-28 15:32
技术范式变革 - 图像生成领域出现无VAE潜在扩散模型新范式,清华与快手可灵团队推出SVG模型[1] - VAE因语义纠缠缺陷被接连抛弃,调整潜空间单一数值会导致图像多特征 unintended 联动变化[3] - 传统VAE+扩散模型范式将高分辨率图像压缩为低维潜空间特征,导致不同语义图像特征混乱交织,训练和生成效率低下[5] SVG模型核心技术优势 - 采用语义与细节双分支加分布对齐架构,以DINOv3预训练模型作为语义提取器解决语义纠缠问题[6][8] - 设计轻量级残差编码器补充DINOv3忽略的颜色、纹理等高频细节,并通过分布对齐机制实现完美融合[8] - 分布对齐机制至关重要,移除后生成图像FID值从6.12升至9.03,生成质量大幅下滑[9] 训练与生成效率突破 - 相比传统VAE方案,SVG实现训练效率62倍提升和生成速度35倍提升[1] - 在ImageNet 256×256数据集上,SVG-XL模型仅训练80个epoch,无分类器引导时FID达6.57,远超同规模基于VAE的SiT-XL(FID 22.58)[11] - 在5步采样推理效率消融实验中,SVG-XL的gFID为12.26,显著优于SiT-XL(SD-VAE)的69.38和SiT-XL(VA-VAE)的74.46[12] 多任务通用性表现 - SVG特征空间可直接用于图像分类、语义分割、深度估计等任务,无需微调编码器[13] - 在ImageNet-1K分类任务中Top-1精度达81.8%,与原始DINOv3几乎一致;在ADE20K语义分割任务中mIoU达46.51%,接近专门分割模型水平[13][14] - 模型在1400个epoch延长训练后,FID可低至1.92,接近当前顶级生成模型水平[11] 行业影响与团队背景 - 技术突破显示预训练视觉模型特征空间已具备替代VAE能力,代表行业技术发展方向[17] - 项目由加州大学伯克利分校博士后郑文钊负责,核心成员来自清华大学自动化系和快手可灵团队[15][17]
VAE再被补刀!清华快手SVG扩散模型亮相,训练提效6200%,生成提速3500%
量子位· 2025-10-28 13:12
技术趋势:无VAE潜在扩散模型的兴起 - 图像生成领域出现技术范式转变,VAE(变分自编码器)正被无VAE潜在扩散模型替代 [1] - 清华与快手可灵团队联合提出名为SVG的无VAE潜在扩散模型,标志着技术路线的演进 [1] SVG模型的核心技术创新 - 采用“语义+细节双分支+分布对齐”的架构,从根本上解决VAE的语义纠缠缺陷 [4] - 语义纠缠指传统VAE将不同语义特征置于同一潜空间,导致调整单一数值(如猫的颜色)会引发连锁反应(如体型、表情改变) [4] - 以DINOv3预训练模型作为语义提取器,确保不同类别(如猫、狗)的特征边界清晰可辨 [14] - 专门设计轻量级残差编码器补充DINOv3忽略的颜色、纹理等高频细节信息 [14] - 通过分布对齐机制调整细节特征,使其数值分布与DINOv3语义特征匹配,避免细节扰乱语义结构 [15][16] - 消融实验证明分布对齐机制至关重要,移除后生成图像的FID值从6.12升至9.03,生成质量大幅下滑 [16] SVG模型的性能优势 - 在训练效率上实现62倍提升,在生成速度上实现35倍提升 [3] - 在ImageNet 256×256数据集上,SVG-XL模型仅训练80个epoch,无分类器引导时FID达6.57,远超同规模基于VAE的SiT-XL(FID 22.58) [18] - 当训练延长至1400个epoch,SVG-XL的FID可低至1.92,接近当前顶级生成模型水平 [18][19] - 在推理效率上,5步采样时SVG-XL的gFID为12.26,显著优于SiT-XL(SD-VAE)的69.38和SiT-XL(VA-VAE)的74.46,表明其在较少采样步数下即可达到较好生成质量 [19][20] - 10步采样时,SVG-XL的gFID为9.39(无CFG)和6.49(有CFG),优于对比模型 [20] SVG模型的多任务通用性 - 模型构建的特征空间具备多任务通用能力,不仅用于图像生成,还可直接用于图像分类、语义分割、深度估计等视觉任务,且无需微调编码器 [22] - 在ImageNet-1K图像分类任务中Top-1精度达到81.8%,与原始DINOv3(81.71%)几乎一致 [22][23] - 在ADE20K语义分割任务中mIoU达46.51%,接近专门的分割模型 [22][23] 技术路线对比:SVG与RAE - SVG技术路线旨在兼顾生成与多任务通用,而谢赛宁团队的RAE技术路线则极致聚焦于图像生成性能 [4][11] - RAE直接复用DINOv2、MAE等预训练编码器,不修改编码器结构,仅优化解码器来还原图像细节,并针对性改造扩散模型架构 [9][10] - SVG则主动构建语义与细节融合的特征空间,而非直接复用预训练特征 [12]
无VAE扩散模型! 清华&可灵团队「撞车」谢赛宁团队「RAE」
机器之心· 2025-10-23 13:09
技术范式创新 - 提出名为SVG的系统性框架,旨在通过结合预训练视觉特征编码器与残差信息学习,替代传统变分自编码器在扩散模型中的应用 [2][3] - 核心思路是利用自监督特征构建统一特征空间,以更强的语义结构解锁模型生成潜力 [12] - 该思路验证了生成、理解与感知任务共享统一潜在空间的可行性,为后续通用视觉模型研发提供了新方向 [28] 传统VAE局限性与问题分析 - 传统VAE的潜在空间存在明显的语义纠缠现象,缺乏清晰语义结构,导致不同类别特征高度混合 [4] - 语义纠缠直接造成训练与推理效率低下,模型需花费大量步数学习数据分布 [4][6] - VAE依赖于重建损失训练,通用性差,在感知理解等视觉核心任务中的效果远不如专门的特征提取器 [8] SVG框架核心技术构成 - SVG自编码器由三部分组成:冻结的DINOv3编码器提供强判别性语义骨架;轻量残差编码器弥补色差并补充高频细节;解码器负责将特征映射回像素空间 [12][17] - 采用通道级拼接方式融合DINO特征与残差特征,并通过分布对齐机制防止残差特征破坏DINO的语义结构 [17] - 分布对齐机制至关重要,消融实验显示无对齐时生成FID从6.12升至9.03,对齐后恢复至6.11 [17] 性能表现:生成质量与效率 - 在ImageNet 256×256数据集上,SVG-XL在训练80个epoch、25步采样条件下,无分类器引导时gFID为6.57,显著优于同规模基线SiT-XL(SD-VAE)的22.58和SiT-XL(VA-VAE)的7.29 [18] - 有分类器引导时,SVG-XL的gFID进一步降至3.54,优于SiT-XL(VA-VAE)的4.13 [18] - 延长训练至1400个epoch后,SVG-XL的gFID可降至1.92,接近当前生成模型SOTA水平 [19] - 在少步数推理方面优势明显,5步采样时SVG-XL的gFID为12.26,远优于SiT-XL(SD-VAE)的69.38和SiT-XL(VA-VAE)的74.46 [22] 多任务通用性与空间特性 - SVG的潜在空间继承了DINOv3的良好性质,可直接用于分类、分割、深度估计等多种视觉任务,无需额外微调编码器 [23] - 消融实验证实SVG编码器完全保持了DINOv3编码器的性能,在ImageNet-1K分类任务中Top-1准确率达81.80% [25] - SVG空间在随机噪声的线性插值与球面线性插值下均能生成平滑过渡的图像,证明了其鲁棒性和可编辑性 [26][30]
盛弘股份:公司密切关注AIDC配储的相关方向
证券日报之声· 2025-10-09 17:13
公司战略方向 - 公司密切关注AIDC(人工智能数据中心)配储相关方向 [1] - 公司于2025年6月成立AIDC事业部,旨在基于现有电能质量产品基础研发新产品解决新需求 [1] - 长期战略目标是成为AIDC用能综合解决方案商,不仅提供电源产品,还将拓展至为数据中心、智算中心提供整体能源解决方案 [1] 产品研发与市场拓展 - 短期内公司将基于自身技术积累,从电源产品着手开发,重点方向包括HVDC、SST等AIDC供电领域 [1] - 公司通过深度市场调研和与下游客户积极沟通等方式,加快产品研发落地,以争取为收入规模增长带来新动力 [1] - 公司希望提升在AIDC市场的品牌影响力和竞争力,产品端将致力于提供更高效、稳定、智能的电源产品 [1]
盛弘股份:公司密切关注AIDC配储的相关方向,并且于2025年6月成立了AIDC事业部
每日经济新闻· 2025-10-09 09:03
公司战略与业务发展 - 公司密切关注AIDC(人工智能数据中心)配储的相关方向 [1] - 公司于2025年6月成立了AIDC事业部,以调研和研发新产品解决新需求 [1] - 公司长期致力于成为AIDC用能综合解决方案商,提供整体能源解决方案 [1] 技术能力与产品规划 - 公司在已有电能质量产品(如APF、SVG)的基础上进行研发 [1] - 短期内公司将基于自身技术积累,从电源产品着手开发,例如HVDC、SST等AIDC供电领域的新方向 [1] - 公司计划在产品端持续创新,提供更高效、稳定、智能的电源产品 [1] 市场拓展与增长动力 - 公司通过深度市场调研和与下游客户积极沟通,加快产品研发落地 [1] - 公司希望为收入规模增长带来新动力,并在AIDC市场提升品牌影响力和市场竞争力 [1] - 公司业务领域将不断拓展,向为数据中心、智算中心提供整体能源解决方案转变 [1]
《2025年中国低压电能质量行业市场白皮书》发布 盛弘股份多维度稳居第一梯队
证券日报网· 2025-09-04 21:10
行业市场规模与增长趋势 - 2024年中国低压电能质量整体市场规模达128亿元 在双碳目标推进 新能源大规模接入及智能制造升级背景下呈规模扩容与结构升级双趋势 预计2028年市场规模增长至152.8亿元 [1] - 工业项目 数据中心 新能源发电成为核心增长领域 [1] 公司市场地位与营收表现 - 盛弘股份为行业内唯一低压电能质量产品营收突破5亿元的企业 稳居市场第一梯队 [1] - 公司在SVG APF AVC三大有源产品线全部跻身第一梯队 正持续替代传统无功补偿装置 [2] - 半导体 数据中心 新能源发电等多个高端应用领域将公司作为首选品牌 [2] 产品技术优势与创新 - 碳化硅SiC技术成为行业最新发展趋势 公司率先实现新一代SiC产品研发与规模化应用 [3] - SiC产品相比传统Si基方案效率提升2个百分点 体积缩小50% 整体性能达市场领先水平 [3] - 公司以高效能 高可靠性优势引领行业实现从技术跟随到引领创新的关键跨越 [3] 应用场景覆盖与行业解决方案 - 产品全面覆盖半导体 新能源发电 石油化工 医院 船舶 轨道交通等关键领域 [2] - 在数据中心领域成为三大运营商及头部互联网企业供应商 [2] - 在半导体行业成为少数可为高端芯片制造提供定制化解决方案的本土企业 [2] - 在光伏 轨道交通 船舶 医疗等复杂场景提供定制化治理解决方案 [2] 政策驱动与未来发展 - 国家《电能质量管理办法》全面实施推动发电 电网和用电侧需求迅速释放 [3] - 公司成为多个国家级与省级重点项目优选合作伙伴 [3] - 未来将持续聚焦技术研发 推动产品智能化与绿色化升级 为构建高质量新型电力系统提供技术支撑 [3]
特变电工2025年半年报:四大产业协同增效 在逆境中实现高质量发展
证券时报· 2025-08-29 21:28
核心财务表现 - 2025年上半年实现营业总收入484.01亿元 同比增长1.12% [1] - 利润总额44.23亿元 同比增长15.62% [1] - 归母净利润31.84亿元 同比增长5% [1] 输变电业务 - 国内输变电市场签约273亿元 同比增长14.08% [2] - 国际市场输变电产品签约超9亿美元 同比增长88.10% [2] - 特高压试验制造基地、超特高压GIS智能工厂等产能项目投产提升履约能力 [2] - 成功参与陇东—山东等三条±800千伏特高压直流工程及750千伏环塔输变电工程 [3] - 在澳大利亚、沙特等国家实现单机出口大幅增长 [3] - 为全球50多个国家提供电网一揽子解决方案 [4] 新能源业务 - 多晶硅单位成本大幅下降 市场竞争力提升 [5] - 逆变器出货量同比增长40% [6] - 成功研发4.5kV/2kA柔直换流阀 填补国内技术空白 [6] - 灵活调整风光资源开发策略 加快优质项目获取与转让 [6] 能源产业 - 火电发电量72.59亿千瓦时(不含自备电厂) [6] - 年产20亿立方米煤制天然气项目加速建设 进度超前 [6] - 配套开发二氧化碳捕集利用和绿色能源耦合项目 [6] 新材料业务 - 高纯铝、电子铝箔及铝制品销量与收入同比大幅增长 [7] - 持续优化生产工艺 提升产品质量稳定性 [7] - 完善"资源—材料—应用"一体化产业链布局 [7] 技术创新与研发 - 22项新产品通过鉴定 其中16项达国际领先水平 [8] - 126kV真空环保型GIS完成武汉20个间隔项目并送电运行 [8] - 1000千伏低噪声电抗器噪声降至62分贝 刷新行业纪录 [8] 可持续发展 - 能源管理与气候变化投入超4亿元 [9] - 节能项目年节能量14.48万吨标准煤 相当于减碳37.66万吨 [9] - 提升绿色电力使用比例 打造零碳园区标杆 [9] - ESG评级持续提升 [9] 行业机遇 - 国内用电量单月突破1万亿千瓦时 中电联预测2025年用电增速5%-6% [4] - "十四五"期间规划19条特高压线路建设 [4] - 沙戈荒新能源基地外送通道与负荷中心受入工程推进 [4] - 雅下工程启动带来长周期产业链机会 [4]