AI训练
搜索文档
如何为 GPU 提供充足存储:AI 训练中的存储性能与扩展性
AI前线· 2025-10-28 17:02
文章核心观点 - 存储系统性能对大规模AI训练效率至关重要,GPU计算效率受存储性能制约 [2] - MLPerf Storage v2.0基准测试是评估AI训练存储系统表现的权威标准,重点分析共享文件系统类别 [2][6] - 在满足GPU利用率阈值前提下,存储系统能支撑的最大GPU数量是衡量其可扩展性与稳定性的关键指标 [9] - 基于以太网的存储方案在灵活性、成本效益方面具优势,而InfiniBand系统在延迟敏感型任务中性能突出 [27] MLPerf Storage v2.0测试负载 - 测试通过多客户端模拟真实AI负载,复现大规模分布式训练集群场景 [3] - 3D U-Net负载处理大体积三维医学图像顺序和并发读取,样本平均大小146 MB,考察大文件连续读取吞吐性能 [4] - ResNet-50负载属于小样本高并发随机读取,样本平均大小150 KB,对存储系统IOPS要求极高 [4] - CosmoFlow负载强调跨节点小文件并发访问和带宽扩展性,样本平均2 MB,对元数据处理和尾延迟控制要求严格 [4] - 新增Checkpointing负载模拟大模型训练中的checkpoint落盘与恢复,表现为大文件多并发顺序写负载 [5] 性能比较标准 - 核心指标为存储系统能支撑的最大GPU数量,取决于系统提供的最大聚合带宽 [9] - 采用网卡带宽利用率作为软件效率参考指标,利用率越高说明在相同硬件条件下性能性价比越高 [9] - 3D U-Net与ResNet-50的GPU利用率阈值为90%,Cosmoflow阈值为70% [9] 3D U-Net测试结果 - 大文件连续读取场景对存储系统读带宽要求较高 [11] - 基于以太网的方案中,JuiceFS支撑最多H100 GPU并维持86.6%高带宽利用率 [11] - IB网络方案硬件规格高,网络总带宽最低400 GiB/s,最高超1500 GiB/s,但带宽利用率普遍低于50% [14] CosmoFlow测试结果 - 海量小文件读取对元数据性能和读延迟性能要求极高,水平扩展困难 [16] - JuiceFS通过10个客户端支撑100张H100 GPU训练任务 [16] - IB网络系统凭借全链路极低且稳定延迟,在延迟敏感型任务中表现突出 [18] ResNet-50测试结果 - 高并发随机读负载对存储系统IOPS要求极高 [21] - JuiceFS在基于以太网方案中支撑最多500张H100 GPU,网络带宽利用率达72%,远超其他产品约40%的水平 [21] - IB网络方案凭借更高总带宽和IOPS,在支持GPU数量和吞吐带宽上成绩显著 [24] 存储方案类别比较 - 共享文件系统细分为基于以太网系统(如Alluxio、JuiceFS、Oracle)和基于IB网络解决方案(如DDN、Hewlett Packard) [7] - 以太网方案依赖以太网环境提供分布式存储,部分厂商采用RoCE以太网方案配置高带宽网卡 [7] - IB网络方案提供完整存储软硬一体机,硬件配置高成本高,但提供极高带宽和性能上限 [7]
凌云光跌2.13%,成交额9935.86万元,主力资金净流出1030.46万元
新浪财经· 2025-10-28 10:10
股价表现与资金流向 - 10月28日公司股价盘中下跌2.13%,报收41.32元/股,成交金额为9935.86万元,换手率0.52%,总市值190.48亿元 [1] - 当日主力资金净流出1030.46万元,其中特大单买入786.36万元(占比7.91%),卖出699.78万元(占比7.04%);大单买入1853.57万元(占比18.66%),卖出2970.62万元(占比29.90%) [1] - 公司今年以来股价累计上涨88.72%,近5个交易日上涨0.61%,近20日下跌22.94%,近60日上涨34.33% [1] - 今年以来公司1次登上龙虎榜,最近一次为2月20日,当日龙虎榜净买入2.33亿元,买入总计3.95亿元(占总成交额22.27%),卖出总计1.62亿元(占总成交额9.12%) [1] 公司基本情况与业务构成 - 公司全称为凌云光技术股份有限公司,成立于2002年8月13日,于2022年7月6日上市,总部位于北京市海淀区 [2] - 公司主营业务以光技术创新为基础,长期从事机器视觉及光通信业务,目前战略聚焦机器视觉业务 [2] - 主营业务收入构成为:智能视觉装备34.69%,可配置视觉系统30.97%,光通信产品27.44%,视觉器件5.31%,服务收入1.59% [2] - 公司所属申万行业为机械设备-专用设备-其他专用设备,所属概念板块包括全息概念、AI训练、智谱AI概念、小米概念、人形机器人等 [2] 财务与股东数据 - 2025年1月-6月,公司实现营业收入13.68亿元,同比增长25.73%;实现归母净利润9607.55万元,同比增长10.10% [2] - A股上市后公司累计派现9228.45万元 [3] - 截至9月30日,公司股东户数为2.80万户,较上期增加5.02%;人均流通股为16458股,较上期减少4.78% [2] - 截至2025年6月30日,香港中央结算有限公司已退出公司十大流通股东之列 [3]
这家AI芯片独角兽,考虑出售
半导体行业观察· 2025-10-26 11:16
公司概况与最新动态 - 人工智能芯片初创公司SambaNova Systems因融资困难,正考虑出售公司[2] - 公司成立于2017年,总部位于美国加州,曾致力于为训练和推理打造基于统一架构的AI芯片[2] - 公司在2023年发布了一款专为大语言模型微调和推理设计的芯片[2] - 公司上一轮融资是2021年的D轮融资,融资总额超过11亿美元,估值超过50亿美元[2] - 2024年4月下旬,公司大幅偏离最初目标,放弃训练雄心,裁掉15%的员工,将全部精力转向AI推理[3] 团队与技术优势 - 公司由芯片和AI/ML领域的三位传奇人物共同创立:CEO Rodrigo Liang、Kunle Olukotun和Christopher Ré[3] - 公司内部承接了大量Sun Microsystems芯片部门的员工,拥有丰富的芯片开发经验和供应链管理能力[3] - 过去两年中,团队围绕大模型技术路线培养了数十名LLM模型工程师,并在服务部署环节建立了先发优势[3] - 公司曾投入大量时间和精力实现高效的训练,针对训练设计和优化了硬件和软件功能[4][7] - 分析师曾认为公司凭借单芯片满足推理和训练市场需求,相较于Groq等竞争对手拥有独特优势[4][6] 战略转型与行业趋势 - 公司战略转型的主要原因包括:推理是更容易解决的问题、推理市场可能比训练市场更大、英伟达在AI训练芯片领域占据绝对主导地位[4][7] - 许多分析师认为,人工智能推理市场规模可能是训练市场的十倍[4] - 公司的转变反映了AI芯片领域的一个普遍趋势,即从训练转向推理,Groq和Cerebras等公司也曾做出类似调整[3][5][6] - 推理过程中无需存储梯度,激活函数使用后可丢弃,减少了内存占用,降低了芯片内存层次结构的复杂性[4] - 推理所需的芯片间联网相对简单,更适合许多初创公司的AI芯片网络功能[4]
紫光股份涨2.01%,成交额6.43亿元,主力资金净流入1200.74万元
新浪财经· 2025-10-24 10:31
股价表现与资金流向 - 10月24日盘中上涨2.01%,报27.92元/股,成交6.43亿元,换手率0.81%,总市值798.53亿元 [1] - 当日主力资金净流入1200.74万元,特大单买入8270.91万元(占比12.86%),卖出7554.23万元(占比11.74%) [1] - 公司股价今年以来上涨0.59%,近5个交易日上涨3.06%,近20日下跌9.76%,近60日上涨12.22% [1] - 今年以来1次登上龙虎榜,最近一次为2月21日,当日龙虎榜净买入1.31亿元,买入总计9.42亿元(占总成交额12.43%) [1] 公司基本情况与主营业务 - 公司成立于1999年3月18日,上市于1999年11月4日,主营业务涉及IT服务、信息电子类产品增值分销、IT基础架构产品及方案的研究、开发、生产、销售及服务 [2] - 主营业务收入构成为:ICT基础设施及服务76.00%,IT产品分销与供应链服务29.55%,其他(补充)0.47% [2] - 所属申万行业为计算机-IT服务Ⅱ-IT服务Ⅲ,概念板块包括AI训练、一体机概念、网络安全、态势感知、WIFI概念等 [2] 财务业绩与股东结构 - 2025年1月-6月实现营业收入474.25亿元,同比增长24.96%,归母净利润10.41亿元,同比增长4.05% [2] - 截至9月19日股东户数26.00万,较上期减少10.34%,人均流通股11000股,较上期增加11.54% [2] - A股上市后累计派现22.46亿元,近三年累计派现6.15亿元 [3] 机构持仓变动 - 截至2025年6月30日,香港中央结算有限公司为第四大流通股东,持股6615.51万股,较上期增加926.55万股 [3] - 华泰柏瑞沪深300ETF(510300)为第六大流通股东,持股3575.05万股,较上期减少169.92万股 [3] - 易方达沪深300ETF(510310)为第八大流通股东,持股2548.33万股,较上期减少67.95万股 [3] - 华夏沪深300ETF(510330)新进为第十大流通股东,持股1863.67万股,易方达中证人工智能主题ETF(159819)退出十大流通股东之列 [3]
首都在线前三季度营收9.26亿元同比降12.05%,归母净利润-9941.30万元同比增32.11%,销售费用同比增长10.11%
新浪财经· 2025-10-23 20:22
核心财务表现 - 2025年前三季度营业收入为9.26亿元,同比下降12.05% [1] - 归母净利润为-9941.30万元,亏损额同比收窄32.11% [1] - 扣非归母净利润为-1.16亿元,亏损额同比收窄21.89% [1] - 基本每股收益为-0.20元 [1][2] 盈利能力指标 - 2025年前三季度毛利率为12.75%,同比提升3.99个百分点 [2] - 2025年第三季度单季度毛利率为11.91%,同比提升5.52个百分点,但环比下降3.16个百分点 [2] - 前三季度净利率为-9.96%,较上年同期上升3.28个百分点 [2] - 第三季度单季度净利率为-9.01%,同比上升6.05个百分点,环比下降0.28个百分点 [2] - 加权平均净资产收益率为-11.16% [2] 费用控制情况 - 2025年三季度期间费用总额为2.22亿元,较上年同期减少487.01万元 [2] - 期间费用率为23.98%,较上年同期上升2.43个百分点 [2] - 销售费用同比增长10.11%,管理费用同比减少3.24%,研发费用同比减少11.99%,财务费用同比增长3.92% [2] 估值与市场数据 - 以10月23日收盘价计算,市盈率(TTM)约为-38.45倍,市净率(LF)约为12.36倍,市销率(TTM)约为8.26倍 [2] - 截至2025年三季度末,股东总户数为6.57万户,较上半年末下降2.27万户,降幅25.68% [2] - 户均持股市值由上半年末的11.04万元增加至18.13万元,增幅为64.21% [2] 公司业务概况 - 公司主营业务为高性能的IDC服务及云服务等信息技术服务 [3] - 主营业务收入构成为:云主机及相关服务49.89%,IDC服务45.83%,其他收入4.28% [3] - 公司所属申万行业为计算机-IT服务Ⅱ-IT服务Ⅲ,涉及概念板块包括AI训练、智谱AI概念、东数西算等 [3]
紫光股份涨2.08%,成交额7.46亿元,主力资金净流入4663.40万元
新浪财经· 2025-10-21 10:52
股价表现与资金流向 - 10月21日盘中上涨2.08%,报27.94元/股,成交额7.46亿元,换手率0.94%,总市值799.11亿元 [1] - 主力资金净流入4663.40万元,特大单买入1.35亿元(占比18.10%),卖出8831.52万元(占比11.83%) [1] - 公司今年以来股价上涨0.67%,近60日上涨13.03%,但近20日下跌2.85% [1] - 2月21日登上龙虎榜,当日净买入1.31亿元,买入总计9.42亿元(占总成交额12.43%) [1] 公司基本情况 - 公司成立于1999年3月18日,上市于1999年11月4日,主营业务为IT服务、信息电子类产品增值分销及IT基础架构产品服务 [2] - 主营业务收入构成为:ICT基础设施及服务76.00%,IT产品分销与供应链服务29.55%,其他(补充)0.47% [2] - 所属申万行业为计算机-IT服务Ⅱ-IT服务Ⅲ,概念板块包括AI训练、5G、英伟达概念等 [2] 经营业绩与股东情况 - 2025年1月-6月实现营业收入474.25亿元,同比增长24.96%,归母净利润10.41亿元,同比增长4.05% [2] - 截至9月19日,股东户数26.00万,较上期减少10.34%,人均流通股11000股,较上期增加11.54% [2] - A股上市后累计派现22.46亿元,近三年累计派现6.15亿元 [3] 机构持仓变动 - 截至2025年6月30日,香港中央结算有限公司为第四大流通股东,持股6615.51万股,较上期增加926.55万股 [3] - 华泰柏瑞沪深300ETF和易方达沪深300ETF持股分别减少169.92万股和67.95万股 [3] - 华夏沪深300ETF新进为第十大流通股东,持股1863.67万股,易方达中证人工智能主题ETF退出十大流通股东 [3]
【时代风口】 科技巨头为何大举收购传媒娱乐和社交平台资产
证券时报· 2025-10-21 01:11
埃里森家族收购派拉蒙案例 - 甲骨文创始人拉里·埃里森之子大卫·埃里森通过其天空之舞公司以80亿美元收购派拉蒙,其中拉里·埃里森提供60亿美元资金支持 [1] - 此次收购使埃里森家族获得派拉蒙影业、MTV电视台、CBS电视台、Showtime频道以及Simon & Schuster出版社等传奇媒体资产 [1] - 小埃里森后续可能收购华纳兄弟探索公司,旨在创建占据好莱坞半壁江山的巨无霸媒体帝国 [1] 科技巨头跨界并购趋势 - 科技巨头收购传媒娱乐及社交平台资产成为趋势,案例包括亚马逊收购《华盛顿邮报》、Facebook收购Instagram、马斯克以440亿美元收购推特以及微软以687亿美元收购动视暴雪 [1] 并购驱动逻辑与价值目标 - 科技巨头跨界并购背后存在完整的并购驱动逻辑与可重叠的价值目标诉求,重新定义商业竞争的产业边界、价值链条和竞争规则 [2] - 跨界融合深刻改变全球文化产业格局与生态系统,其商业赋能意义远超传统协同效应 [2] 对优质内容的集体追逐 - 科技巨头收购表达出对优质内容的集体追逐,内容成为数字经济时代最重要的价值驱动与核心引擎资产 [2] - 微软通过游戏内容增强其Xbox生态和云游戏战略吸引力,甲骨文利用派拉蒙影视库丰富云服务 [2] - 内容成为训练AI的核心养料,推特数亿条推文可训练AI理解人类决策逻辑,派拉蒙影视库成为训练视频识别AI的宝贵资源 [2] 内容与渠道的垂直整合 - 并购旨在实现内容与渠道的垂直整合,优质内容需要高效渠道实现价值最大化,强大渠道需要独家内容维持用户黏性 [3] - 科技巨头通过垂直整合将内容创作、技术支持、平台分发、用户关系等环节内化,形成完整价值闭环 [3] - 垂直整合提高运营效率并使价值分配向生态主导者倾斜,在全球范围内重塑传媒娱乐产业利润分配格局 [3] 对标资产的精准赋能 - 科技巨头通过控制受欢迎的内容与载体获取用户有限的注意力预算,注意力可通过广告、订阅、电商等方式变现 [4] - 科技巨头凭借技术优势对收购资产进行全方位数据化改造,通过大数据分析用户偏好精准指导内容创作、采购和推荐 [4] - 数据赋能体现在全产业链,例如亚马逊利用多元数据构建用户画像为原创内容制作提供洞察力,实现资产价值指数级放大 [4] 向数字生活运营商的战略转型 - 科技巨头通过收购实现从“功能提供商”向“数字生活运营商”的战略转型,构建覆盖用户工作、生活、娱乐的全场景数字生态 [5] - 以马斯克收购推特为例,X平台将发展成社交媒体与支付、游戏、打车服务融合的“一站式商店”,丰富消费场景延长用户停留时间 [5] - 用户生活沉浸于某个生态将形成高转换成本,产生强大的锁定效应 [5] 数字生态的寡头化趋势 - 科技巨头的收购加速数字生态的寡头化趋势,市场竞争从单一产品竞争升级为整个生态系统竞争 [5] - 新进入者面临极高壁垒,需要技术能力、资金实力、内容资源和用户基础,中小型内容创作者和平台要么被收购要么依附生态生存 [5] - 数字帝国疆域扩张使如何在寡头竞争中保持市场开放性和创新活力成为监管机构和行业参与者的共同挑战 [6]
神州数码涨2.06%,成交额2.46亿元,主力资金净流出33.41万元
新浪财经· 2025-10-20 11:30
股价与交易表现 - 10月20日盘中股价上涨2.06%至38.61元/股,成交额2.46亿元,换手率1.06%,总市值278.07亿元 [1] - 当日主力资金净流出33.41万元,特大单净卖出646.61万元,大单净买入613.2万元 [1] - 公司今年以来股价上涨11.00%,但近期表现疲软,近5个交易日下跌5.02%,近20日下跌12.01% [1] - 今年以来公司3次登上龙虎榜,最近一次为2月14日,当日龙虎榜净买入3.80亿元,买入总额7.54亿元(占总成交额18.54%),卖出总额3.74亿元(占总成交额9.20%) [1] 公司基本面与业务构成 - 公司主营业务为IT产品分销及服务,收入构成为:消费电子业务71.30%,企业增值业务24.24%,自有品牌产品4.33%,数云服务及软件2.30% [1] - 2025年1-6月实现营业收入715.86亿元,同比增长14.42%;但归母净利润为4.26亿元,同比减少16.29% [2] - A股上市后累计派现13.88亿元,近三年累计派现7.71亿元 [3] 股东结构与机构持仓 - 截至9月30日,公司股东户数为16.47万,较上期减少2.37%;人均流通股3652股,较上期增加2.43% [2] - 截至2025年6月30日,南方中证500ETF(510500)为第六大流通股东,持股843.75万股,较上期增加244.97万股;香港中央结算有限公司为第九大流通股东,持股531.73万股,较上期减少1173.14万股 [3] 行业与概念板块 - 公司所属申万行业为计算机-IT服务Ⅱ-IT服务Ⅲ [2] - 所属概念板块包括阿里云、华为鸿蒙、AIAgent(智能体)、ChatGPT概念、AI训练等 [2]
紫光股份涨2.03%,成交额2.86亿元,主力资金净流出2251.45万元
新浪财经· 2025-10-20 10:01
股价与资金表现 - 10月20日盘中股价上涨2.03%至27.64元/股,成交额2.86亿元,换手率0.36%,总市值790.53亿元 [1] - 当日主力资金净流出2251.45万元,特大单买卖金额分别为3382.44万元和6875.33万元,占比11.84%和24.06% [1] - 今年以来股价微跌0.41%,近5日和20日分别下跌4.72%和5.60%,但近60日上涨11.23% [1] - 今年以来1次登上龙虎榜,最近一次为2月21日,当日净买入1.31亿元,买卖总额分别为9.42亿元和8.11亿元 [1] 公司基本情况 - 公司成立于1999年3月18日,于1999年11月4日上市,主营业务为IT服务、信息电子类产品增值分销及IT基础架构产品服务 [2] - 主营业务收入构成为ICT基础设施及服务76.00%,IT产品分销与供应链服务29.55%,其他0.47% [2] - 公司所属申万行业为计算机-IT服务Ⅱ-IT服务Ⅲ,概念板块包括5G、英伟达概念、AI训练、光通信、CPO概念等 [2] 财务与股东数据 - 2025年1-6月实现营业收入474.25亿元,同比增长24.96%,归母净利润10.41亿元,同比增长4.05% [2] - 截至9月19日股东户数为26.00万,较上期减少10.34%,人均流通股11000股,较上期增加11.54% [2] - A股上市后累计派现22.46亿元,近三年累计派现6.15亿元 [3] 机构持仓变动 - 截至2025年6月30日,香港中央结算有限公司为第四大流通股东,持股6615.51万股,较上期增加926.55万股 [3] - 华泰柏瑞沪深300ETF和易方达沪深300ETF分别为第六和第八大流通股东,持股分别减少169.92万股和67.95万股 [3] - 华夏沪深300ETF新进为第十大流通股东,持股1863.67万股,易方达中证人工智能主题ETF退出十大流通股东之列 [3]
合合信息涨2.32%,成交额7039.54万元,主力资金净流出289.29万元
新浪财经· 2025-10-16 10:01
股价表现与市场数据 - 10月16日盘中股价上涨2.32%,报172.80元/股,总市值241.92亿元,成交额7039.54万元,换手率0.43% [1] - 当日主力资金净流出289.29万元,其中大单买入633.94万元(占比9.01%),卖出923.23万元(占比13.11%) [1] - 公司股价今年以来上涨20.69%,近5个交易日上涨3.60%,近20日上涨11.35%,近60日上涨3.38% [2] 公司基本面与财务业绩 - 公司2025年1-6月实现营业收入8.43亿元,同比增长22.51%,归母净利润2.35亿元,同比增长6.63% [3] - 公司A股上市后累计派发现金分红2.00亿元 [4] - 公司主营业务收入构成为:智能文字识别-C端产品81.65%,商业大数据-B端产品及服务9.44%,智能文字识别-B端产品及服务4.87%,商业大数据-C端产品3.48% [2] 股东结构与机构持仓 - 截至2025年6月30日,公司股东户数为8894户,较上期减少4.82%,人均流通股3148股,较上期增加47.08% [3] - 十大流通股东中,泰信中小盘精选混合增持38.50万股至118.00万股,泰信鑫选混合A增持34.00万股至77.00万股 [4] - 大摩数字经济混合A新进持股60.65万股,博时上证科创板人工智能ETF发起式联接A新进持股27.96万股,长城创新驱动混合A增持5.18万股至24.34万股 [4] 公司业务与行业定位 - 公司成立于2006年8月8日,于2024年9月26日上市,主营业务是基于智能文字识别及商业大数据技术为C端和B端客户提供数字化、智能化产品及服务 [2] - 公司所属申万行业为计算机-软件开发-垂直应用软件,概念板块包括数据要素、金融科技、数字经济、AI训练、大数据等 [2]