Semiconductor

搜索文档
全新GPU高速互联设计,为大模型训练降本增效!北大/阶跃/曦智提出新一代高带宽域架构
量子位· 2025-05-19 12:37
大模型分布式训练技术 - 随着大模型参数规模扩大,分布式训练成为AI发展的中心技术路径[1] - 高带宽域(HBD)设计对提升大模型训练效率至关重要[2] - 张量并行和专家并行需依赖HBD提供Tbps级带宽支持[6] 现有HBD架构的局限性 - 以交换机为中心的HBD(如NVIDIA NVL-72)成本高昂且不易扩展[3][8] - 以GPU为中心的HBD(如Google TPUv3)存在严重的故障传播问题[3][12] - 交换机-GPU混合HBD(如TPUv4)在成本和容错方面仍不理想[3][18] InfiniteHBD创新架构 - 采用以光交换模组为中心的HBD架构,单位成本仅为NVL-72的31%[4] - 通过OCS技术实现节点级故障隔离,GPU浪费率接近零[4][59] - 与NVIDIA DGX相比,MFU最高提升3.37倍[4][63] 关键技术突破 - 基于硅光子技术的OCS光电转换模组(OCSTrx),支持800Gbps带宽[30][31] - 可重配置的K-Hop Ring拓扑,支持动态构建任意大小的GPU粒度环[36][39] - HBD-DCN编排算法将跨ToR流量降低5.8倍[69] 性能优势 - 互连成本仅为NVL-72的31%、TPUv4的63%[74] - 能耗为NVL-72的75%,与TPUv4持平[74] - 在Llama3.1和GPT-MoE 1.1T训练中表现优异[62][64] 行业合作 - 阶跃星辰作为通用大模型创业公司参与研发[77] - 曦智科技作为光电混合算力提供商支持技术创新[77] - 上海智能算力科技正在筹备相关集群建设[77]
华为+DeepSeek,推理性能创新高!技术报告也公布出来了
量子位· 2025-05-19 12:37
华为昇腾技术突破 - 华为昇腾在超大规模MoE模型推理性能上全面超越英伟达Hopper架构,实现"英伟达含量为0"的突破 [1] - 通过"以数学补物理"策略,利用数学理论、算法和建模弥补硬件局限,最大化发挥芯片和系统能力 [1] - 具体产品性能: - CloudMatrix 384超节点在50ms时延下单卡Decode吞吐达1920 Tokens/s [1][18] - Atlas 800I A2推理服务器在100ms时延下单卡吞吐达808 Tokens/s [1][21] 技术开源与披露 - 公司将全面开源昇腾超大规模MoE模型推理部署技术,包括技术报告和核心代码 [2] - 技术披露周活动将展示最新进展,相关资源可通过指定链接获取 [40][41] 行业趋势与挑战 - 大模型发展重心从训练转向推理应用落地,企业竞争焦点转向推理效率 [5][6] - 超大规模MoE模型(如6710亿参数的DeepSeek V3)带来三大挑战: - 内存压力:单个专家2.5G,64GB内存硬件难以承载 [7] - 通信开销:跨芯片数据传输耗时超过计算时间 [8] - 架构创新负担:如MLA机制导致中间变量激增 [9] 技术解决方案 硬件部署优化 - 采用PD分离部署解耦Prefill和Decode时延约束 [10] - CloudMatrix 384超节点采用144卡EP并行部署,128卡专用于路由专家 [17] - Atlas 800I A2采用多节点互联,2机16卡Prefill+4机32卡Decode [20] 框架与模型优化 - 基于vLLM框架适配DP/EP并行策略,优化调度分桶和分层传输 [12] - 采用A8W8C16量化策略(INT8+BF16),差异化部署不同机型 [13] - API Server横向扩展方案提升高并发场景QPS,动态负载均衡技术解决显存占用问题 [22] 通信优化 - FlashComm方案降低25%通信量并提升10%推理性能 [25] - 层内并行转换方案消除节点内卡间求和操作 [26] - 计算通信并发机制最大化硬件利用率,MLA层计算性能提升10% [27] 算子优化 - AMLA算法将乘性计算转为加性等价形式,减少数据搬运 [31] - L1/L2缓存精细化管理提升命中率,K-buffer流水排布掩盖计算耗时 [31] - 通算融合算子实现Token粒度流水排布,降低卡间同步开销 [31] 性能实测数据 - Prefill阶段:16K序列端到端耗时631ms,卡均吞吐1622 Tokens/s [34][36] - Decode阶段: - 2K输入+2K输出场景下吞吐达808 Tokens/s(90%接受率) [32] - 1K输入+2K输出场景下吞吐达876 Tokens/s(90%接受率) [32] - SiliconLLM框架部署DeepSeek-R1实现单卡1920 Tokens/s,等效H100性能 [38][39]
复旦大学获1亿元匿名捐赠,12名商界校友财富值合计超2800亿元
证券时报· 2025-05-19 11:21
e公司,证券时报旗下专注上市公司新媒体产品,立志打造A股上市公司资讯第一平台。提供7x24小时上市公司标准化快讯,针对可能影响上市公司股价 的主题概念、行业事件及时采访二次解读,从投资者需求出发,直播上市公司有价值的活动、会议。 5月18日,一则复旦大学获一名校友匿名捐款1亿元的消息突然登上网络热搜。 消息称,在复旦大学谢希德-俞吾金哲学发展基金(第二期)捐赠 签约仪式上,一位热心的复旦校友为基金捐赠1亿元,支持哲学学科发展。 以下文章来源于e公司 ,作者证券时报 曾剑 e公司 . 1亿元匿名捐赠,说明这位神秘的复旦校友不图名利,而且资金雄厚。 除了上述人士外,复旦大学在诸多领域还有很多知名校友。比如,在半导体领域, 国产EDA龙头华大九天董事长刘伟平,全球最大的电荷泵充电管理芯 片厂商南芯科技创始人阮晨杰,国内集成电路设计业第一家上市公司复旦微电董事长蒋国兴、总经理施雷等均是毕业于复旦大学。 证券时报·e公司记者注意到,从2024胡润百富榜来看,至少有12位复旦大学校友上榜。他们大多是上市公司实控人、主要股东或高管。粗略算来,这些 人(家族,下同)的财富值合计超2800亿元。 中国"网游教父"陈天桥,财富值 ...
3 Tech Stocks Destined to Drive Wealth Now and for Years to Come
The Motley Fool· 2025-05-18 20:00
Investors can often simplify their investment choices by buying stock in established, wealth-building companies. Such stocks tend to offer investors more safety, and this approach is especially beneficial when a stock has not approached the end of its high-growth years.Fortunately, the market offers numerous stocks that fit this description, and many of them have achieved their growth through success in artificial intelligence (AI).With that, three analysts from The Motley Fool have recommended stocks that ...
Wall Street Analysts Believe SkyWater Technology (SKYT) Could Rally 34.97%: Here's is How to Trade
ZACKS· 2025-05-16 23:01
股价表现与目标价分析 - SkyWater Technology(SKYT)最新收盘价为8 15美元 过去四周累计上涨23 7% 华尔街分析师给出的平均目标价11美元隐含35%上行空间 [1] - 5份目标价预测区间为8-12美元 标准差1 73美元 最低目标价隐含1 8%跌幅 最高目标价隐含47 2%涨幅 标准差较小显示分析师预测集中度较高 [2] - 尽管共识目标价是重要参考指标 但单纯依赖该指标做投资决策存在风险 因分析师目标价设定能力与客观性长期受质疑 [3] 盈利预测修正信号 - 分析师对公司盈利前景乐观情绪增强 过去30天内有两项EPS预测上调 零下调 推动Zacks共识预期上调20 8% [12] - 盈利预测修正趋势与短期股价走势存在强相关性 当前积极的EPS修正趋势支持股价上行预期 [11] - SKYT目前获Zacks Rank 1(强力买入)评级 位列4000多只股票前5% 该评级基于四项盈利预测相关因素 历史回溯显示该指标对短期股价有较强预示作用 [13] 分析师目标价的局限性 - 全球多所大学研究表明 分析师目标价误导投资者的频率高于指导作用 实证显示无论共识度高低 目标价对股价实际走向的预测效果有限 [7] - 华尔街分析师虽具备公司基本面深度认知 但常因商业动机(如维护客户关系)设定过度乐观目标价 导致目标价虚高 [8] - 低标准差显示的目标价集中度可作为研究起点 但投资决策需结合其他基本面驱动因素分析 对目标价应保持审慎态度 [9][10]
清溢光电: 中信证券股份有限公司关于深圳清溢光电股份有限公司使用募集资金向全资子公司增资及借款以实施募投项目的核查意见
证券之星· 2025-05-16 22:13
募集资金基本情况 - 公司2023年度向特定对象发行A股股票4,800万股,每股发行价25元,募集资金总额12亿元,扣除发行费用1,299.06万元后净额为11.87亿元 [1] - 募集资金到位情况经天健会计师事务所审验并出具验资报告,资金实行专户存储管理,签订三方及四方监管协议 [1] 募集资金投资项目调整 - 原计划募投项目总投资14.05亿元,拟投入募集资金12亿元,实际募集资金净额11.87亿元,调整后拟投入募集资金金额与净额一致 [2] - 主要投向高精度掩膜版生产基地建设项目一期和高端半导体掩膜版生产基地建设项目一期 [2] 全资子公司增资及借款安排 - 公司拟将原计划以自有资金对佛山清溢增资4亿元调整为使用募集资金,增资后其注册资本从2亿元增至6亿元 [2][3][4] - 同时向佛山清溢提供不超过4亿元借款用于高精度掩膜版生产基地建设项目一期实施,借款期限至项目完成 [4] - 佛山清溢为2023年9月新设全资子公司,截至审计日总资产3.92亿元,净资产1.95亿元,2023年营收23.76万元,净亏损466.59万元 [4] 项目实施影响及管理 - 增资及借款有助于加速募投项目建设,符合公司战略规划,未改变募集资金投向 [4] - 资金将存入专项账户并受监管协议约束,严格按《募集资金管理制度》使用 [5] 审议程序 - 董事会及监事会于2025年5月审议通过增资及借款议案,保荐人中信证券出具无异议核查意见 [5][6]
知识城广场:人工智能与数字经济的创新高地,打造黄埔产业腾飞关键引擎
21世纪经济报道· 2025-05-16 20:15
园区概况 - 知识城广场位于广州开发区、黄埔区,是大湾区高质量发展的重要支撑点,以人工智能、半导体和数字经济为核心产业[1] - 项目由知识城集团打造,总建筑面积78万平方米,总投资超100亿元,包含51.4万平方米办公面积、3万平方米商业面积、13.6万平方米公寓面积和4759个停车位[1] - 业态涵盖会议展览、星级酒店、商务/人才公寓、研发办公、甲级/高层办公、独栋/合院办公、创新商业等[1] 产业集群 - 初步形成以"人工智能、数字经济"为核心的产业集群,聚焦芯片设计、算力生态、人形机器人及智慧城市应用[1] - 已入驻约30家企业,包括壁仞科技、希姆计算(芯片设计制造)、黄埔商汤智算中心(算力支持)、数梦工场(人工智能应用)等重点项目[2] - 形成完整的产业链条,吸引上下游企业集聚,提升区域产业竞争力[2] 知识产权服务 - 园区以"知识产权运用和保护综合改革实验"为导向,集聚8大知识产权载体和43家服务机构[2] - 配套世界知识产权组织技术和创新支持中心、国际知识产权服务大厅、黄埔区人民法院知识产权审判大楼等专业机构[2][3] - 推动国内外知识产权要素资源整合,为企业提供全方位知识产权服务[2] 配套设施 - 配备产业运营、科创孵化、智慧园区、酒店会展、餐饮消费、运动休闲等多元服务[3] - 已入驻粤港澳大湾区知识产权主题图书馆、罗森便利店、蜜蜂咖啡、知韵酒店、知行公寓、知城印象智慧餐厅等品牌[3] - 配置篮球场、羽毛球场、健身房、慢跑道等休闲设施[3] 发展规划 - 未来将重点发展算力、算法和数据三大要素,形成生产-流通-消费的良性循环[4] - 打造人形机器人创新中心、跨境算力总调度中心、低空经济应用区、集成电路设计示范区[4] - 建设成为泛凤凰湖"人工智能+"产业赋能示范项目,推动区域产业升级[4]
Tower印度建厂,命途多舛
半导体芯闻· 2025-05-16 18:08
公司动态 - Tower Semiconductor首席执行官Russell Ellwanger表示公司在五六个月前主动放弃了在印度建设价值100亿美元晶圆厂的计划,退出理由充分但未公开 [1] - 公司澄清近期关于阿达尼集团暂停该项目的报道不实,强调退出决定是单方面行为且未达成正式推进协议 [1] - 公司在印度业务发展曲折,2012年与Jai Prakash Associates及IBM组建财团失败,2017年曾尝试通过阿布扎比Next Orbit Ventures财团提供知识产权服务 [2] 财务表现 - 2025年第一季度营收达3.58亿美元,同比增长9%(2024年Q1为3.27亿美元) [2] - 2025年Q1净利润4000万美元,略低于去年同期的4500万美元 [2] - 对2025年Q2业绩展望乐观,预计收入增长至3.72亿美元(±5%),同比增幅达6% [3] 技术发展 - 公司在射频基础设施领域(包括SiPho和SiGe技术)创下营收纪录,计划全年提升相关技术收入 [3] - 重点发展200毫米高压电源管理业务和传感器业务,同时通过300毫米技术平台开拓包络跟踪器新市场 [3] - 利用全球规模和技术广度应对地缘政治不确定性,挖掘新机遇 [3] 印度项目背景 - 印度马哈拉施特拉邦曾批准Tower与Adani集团合作建设100亿美元晶圆厂,原计划2024年9月启动,需等待中央政府补贴批准 [2]
唯捷创芯难解行业内卷 市场份额被瓜分 PA模组老二地位如何保?
新浪证券· 2025-05-16 17:45
公司业绩表现 - 2024年公司营收21.03亿元,同比下降29.46%,归母净利润-0.24亿元,由盈转亏 [1] - 2025年一季度营收5.09亿元,同比增长10.24%,但归母净利润仍亏损-0.18亿元 [2] - 2020-2021年营收增速分别为211.38%、93.80%,2021年毛利率达27.76%,同比提升9.84个百分点 [4][5] - 2023年营收同比增长30.32%,归母净利润同比增长110.31%,达历史利润最高点 [5] 行业竞争与市场环境 - 射频前端芯片市场85%以上份额被Broadcom、Qualcomm等国外厂商占据 [8] - 2024年全球智能手机市场复苏缓慢,Q4需求同比下滑,行业竞争白热化 [8] - 同业公司卓胜微2024年营收44.87亿元(+2.48%),毛利率39.49%(同比-6.96pct),唯捷创芯营收跌幅显著高于同业 [9][10] - 昂瑞微2024年营收21.01亿元(+23.98%),与唯捷创芯规模相当,但亏损收窄,形成反差 [9][10] 产品结构与毛利率变化 - 2021年5G产品毛利率40.10%,显著高于4G产品的21.55% [5] - 2023年5G射频功率放大器模组营收占比超52.05%,但综合毛利率24.66%,同比下降6.42个百分点 [6] - 2024年毛利率23.75%,仅高出昂瑞微3.52个百分点,盈利能力未与同业拉开差距 [9][10] 历史发展与竞争策略 - 公司2019年打赢与络达的PA价格战,联发科战略投资后市场份额快速提升 [3] - 2022年营收下滑1/3至22.88亿元,但毛利率提升至30.68%,实现扭亏为盈 [5] - 2023年同业竞争导致毛利率下降,2024年竞争压力彻底爆发 [7]
牛市早报|持续推进城市更新行动意见印发,证监会强化上市公司募资监管
搜狐财经· 2025-05-16 08:25
市场数据 - 上证综指跌0.68%报3380.82点,科创50指数跌1.26%报1000.97点,深证成指跌1.62%报10186.45点,创业板指跌1.92%报2043.25点 [1] - 道指涨0.65%报42322.75点,标普500指数涨0.41%报5916.93点,纳指跌0.18%报19112.32点 [1] - 纽约轻质原油期货价格下跌2.42%至每桶61.62美元,伦敦布伦特原油期货价格下跌2.36%至每桶64.53美元 [1] 财经要闻 - 国务院强调做强国内大循环,聚焦外贸企业帮扶、稳定就业、提振消费、扩大有效投资及科技创新培育产业亮点 [2] - 两办印发《关于持续推进城市更新行动的意见》,提出八项任务包括老旧小区改造、城市基础设施建设及生态修复 [3] - 央行等四部门联合推进科技金融工作,加大对国家重大科技任务和科技型中小企业的金融支持 [3] 经济数据 - 4月全国企业销售收入同比增长4.3%,工业企业销售收入同比增长3.7%,制造业销售收入同比增长4.4% [4] - 高技术产业和数字经济核心产业销售收入分别增长15.3%和13.4%,建筑业销售收入同比增长6.5% [4] 政策监管 - 最高法、证监会联合发布指导意见,严打编传虚假信息扰乱市场秩序行为 [4] - 证监会2024年查办证券期货违法案件739件,处罚责任主体1327人次,市场禁入118人 [5] - 证监会修订《上市公司募集资金监管规则》,新增9条条文并提升监管层级,2025年6月15日起施行 [6] 国际贸易 - 商务部回应美国对华为芯片限制,称其违反市场规则并威胁全球半导体产供链稳定 [5][6] - 商务部表示中美同意建立经贸磋商机制,就经贸关切保持沟通 [6] 公司财报 - 阿里巴巴2025财年Q4营收2364.54亿元(325.84亿美元)同比增长7%,非公认会计准则净利润298.47亿元(41.13亿美元)同比增长22% [7] - 经调整EBITA同比增长36%至326.16亿元,主要因收入增长和运营效率提升 [7]