Workflow
混合计算
icon
搜索文档
摩尔线程,走英伟达的路,也走自己的路
钛媒体APP· 2025-12-22 09:37
公司战略定位与核心趋势 - 摩尔线程在MDC 2025大会上传递的核心趋势是,国产GPU公司正像真正的基础设施公司那样思考问题,而不仅仅是追求性能追赶 [2] - 公司被视为“中国版英伟达”,其创始人及团队拥有深厚的英伟达背景,公司行事风格与产品思路(如全功能GPU、开发者大会对标GTC)均与英伟达相似 [2] - 摩尔线程并非简单复刻英伟达,而是在用英伟达的方法论,结合中国面临的供应链不确定性、技术封锁和国产生态薄弱等独特产业条件,解决中国自己的算力问题 [3] - 公司的能力已从单卡扩展到万卡集群,关注点从追求性能转向追求稳定性、线性度和MFU等系统级指标,标志着向算力基础设施公司的转变 [3] 全功能GPU的战略意义与技术演进 - 公司坚持发展全功能GPU,其创新被视为一部算力进化史,GPU的计算边界从早期图形渲染持续拓展至通用并行计算、AI和科学计算 [5] - 未来五至十年的关键应用形态将集中在具身智能领域,这需要算力平台同时具备计算、仿真、图形与感知能力,单一功能加速器无法胜任 [5] - “3D + AI + HPC”的组合是全功能GPU自然演进的结果,使其成为支撑新一代科技发展的核心基础设施 [6] - 全功能GPU集成了四类核心计算引擎:AI计算引擎、3D图形渲染引擎、高性能计算与物理仿真引擎、智能视频编解码引擎,以统一支撑多样化计算需求 [6][7] MUSA统一计算架构与软件生态 - MUSA是公司自主研发的元计算统一计算架构,覆盖从芯片架构、指令集、编程模型到软件运行库的全栈技术体系,被视为公司的“第一产品” [7] - 一个完整的MUSA架构底层是全功能GPU,之上是硬件系统(如夸娥智算集群),再之上是包括加速库、调试工具和应用案例的全套软件栈 [7][8] - MUSA 5.0标志着架构步入成熟,原生MUSA C深度兼容TileLang、Triton,核心计算库muDNN的GEMM/FlashAttention效率超98%,通信效率达97%,编译器性能提升3倍 [10] - 公司计划逐步开源计算加速库、通信库及系统管理框架等核心组件,并推出MTX中间语言、muLang编程语言、MUSA-Q量子计算融合框架和muLitho计算光刻库 [10] - MUSA统一软件栈能够支持国际和国产的CPU系统及开发环境,覆盖“云边端”全系列产品,用同一套软件支撑不同硬件 [11] 新一代“花港”架构与芯片产品路线 - 公司发布了新一代全功能GPU架构“花港”,在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破 [11] - “花港”架构核心特性包括:算力密度提升50%,支持从FP4到FP64的全精度计算,新增MTFP6/MTFP4及混合低精度支持 [11] - 架构集成新一代异步编程模型,并通过自研MTLink高速互联技术支持十万卡以上规模智算集群扩展 [11] - 架构内置AI生成式渲染架构,增强硬件光线追踪,完整支持DirectX 12 Ultimate,实现图形与AI深度融合 [12] - 架构基于全栈自研,具备安全可信能力,截至2025年6月30日,公司累计授权专利514项,其中发明专利468项 [12] - 基于“花港”架构,公司公布了两款未来芯片技术路线:“华山”专注AI训推一体与超大规模智能计算;“庐山”专攻高性能图形渲染 [12][14] - “庐山”图形芯片相比前代实现显著性能跨越:AI计算性能提升64倍,几何处理性能提升16倍,光线追踪性能提升50倍 [14] 夸娥智算集群与系统级能力 - 公司正式发布了夸娥万卡智算集群,具备全精度、全功能通用计算能力 [15] - 该万卡集群浮点运算能力达到10 Exa-Flops,在Dense大模型上训练算力利用率达60%,在MOE大模型上达40%,有效训练时间占比超90%,训练线性扩展效率达95% [15] - 在训练侧,基于原生FP8能力完整复现顶尖大模型训练流程,并在多项关键精度指标上达到国际主流水平,Flash Attention算力利用率超95% [15] - 在推理侧,经过与硅基流动的联合优化,在DeepSeek R1 671B全量模型上,MTT S5000单卡实现Prefill吞吐突破4000 tokens/s、Decode吞吐突破1000 tokens/s [15] - 公司发布了MTT C256超节点的架构规划,采用计算与交换一体化的高密设计,旨在为下一代超大规模智算中心构建硬件基石 [16]
混合计算成为常态,这个平台急需建设
中金在线· 2025-10-24 14:21
行业趋势与核心观点 - Gartner将AI超级计算平台列为2026年首要战略技术趋势,该平台整合CPU、GPU、AI ASIC等多种计算范式以统筹复杂工作负载[1] - 到2028年,超过40%的领先企业将采用混合计算范式,较当前8%的水平实现跨越式增长[1] - 算力供给模式正发生根本性重构,混合算力因海外供应链风险从“可选项”变为“必选项”,被视为企业AI战略的生存问题[1] 混合算力面临的挑战 - 算力架构需从以CPU为中心转向以GPU为中心以支持AI原生应用,同时需加速GPU国产化替代以满足金融、政务等领域的合规要求[1] - 在未经优化的混合环境中,算力利用率普遍低于40%,存在资源浪费严重的局面[2] - 从实验到生产系统的规模化过程中,混合架构的复杂性呈指数级增长,超出大多数企业技术团队的掌控范围[2] 京东云JoyScale平台解决方案 - 京东云JoyScale AI算力平台定位为“算力操作系统”,旨在打通全链路的混合算力服务新范式[3] - 平台智能调度核心全面适配十余家国产算力,兼容昇腾、寒武纪、海光等国产加速卡,整体资源利用率提升70%,推理性能提升50%[5] - 平台具备生态兼容能力,通过与国产芯片厂商深度合作,从内核层屏蔽异构硬件复杂性,实现更高效的AI算力[5] - 平台通过信通院最高等级双认证,全栈软件平台自主研发,满足金融级数据安全、性能和稳定性要求[6] 市场应用与客户案例 - 算力基础设施竞争正从“规模竞赛”转向“体系化竞争”,企业需兼顾短期利用率与成本问题及长期架构敏捷性[7] - 京东云JoyScale凭借内核级算力池化、全栈自研可控等优势,已获数十家头部国央企采用以构建新一代AI算力平台[7] - 某知名证券公司案例显示,部署JoyScale后,通过将5个业务系统的GPU资源池化,AI算力分时复用实现多团队共享,推理任务资源满足率从65%提升至98%,国产芯片使用占比稳步提升[7] - 京东云基于集团复杂场景实践,已构建从智算基础设施到上层Agent应用开发的一站式大模型产品矩阵,支持国央企快速部署AI应用[7]
Synaptics (SYNA) Conference Transcript
2025-08-12 02:02
**Synaptics (SYNA) 电话会议纪要关键要点总结** **1 公司及行业概述** - 公司为半导体企业Synaptics,专注于核心物联网(Core IoT)及边缘AI领域[4][5][6] - 行业定位:半导体行业,核心物联网(IoT)、边缘计算、无线连接技术(WiFi/蓝牙/UWB/Thread)[7][10][12] - 公司历史:成立40年,多次成功转型,当前重点转向核心IoT及边缘AI[4][5] **2 核心战略与产品** - **核心IoT战略**:公司未来增长核心,聚焦低功耗、高性能边缘AI处理器及无线连接解决方案[6][7][10] - **Astra处理器**:新一代边缘AI处理器,与谷歌研究院合作开发,支持本地AI模型推理,功耗效率显著[9][11][12] - 应用场景:视频处理(机顶盒、摄像头)、音频处理(无线音箱)、工业设备[13] - 竞争优势:与谷歌的合作关系,可快速适配AI模型(如Transformer架构)[11][12] - **无线技术**:通过Broadcom授权获得高性能WiFi/蓝牙/UWB技术,适配核心IoT需求[7] **3 财务与运营表现** - **增长数据**: - 2025财年总收入同比增长12%,核心IoT业务增长超50%[18][23] - 每股收益(EPS)同比增长61%,受益于高毛利产品组合[24] - **库存与需求**:渠道库存已恢复至疫情前水平,终端需求逐步改善[20][21] - **毛利率目标**:长期维持57%,未来可能通过解决方案业务(如整合硬件+软件)提升[39][40] **4 市场竞争与差异化** - **与Qualcomm/MediaTek对比**: - 不直接竞争高端处理器(如Snapdragon),专注边缘AI的低功耗、低成本场景[16] - 预计90%边缘应用更适合Synaptics处理器[16] - **市场机会**: - 核心IoT设计订单(design wins)持续增加,2023-2025年订单将驱动2026-2028年增长[14] - 折叠屏手机潜在机会:若苹果2027年推出折叠屏,Synaptics触控方案或覆盖1亿单元(双屏需求)[33][34] **5 其他业务动态** - **企业及汽车市场**: - 企业市场缓慢复苏,PC换机周期(4亿台待更新)及办公室设备升级为潜在催化剂[29][30] - 汽车市场仍疲软,拖累企业&汽车业务整体表现[28] - **并购(M&A)方向**: - 未来可能通过收购加速核心IoT解决方案布局(如整合处理器+无线+传感的完整方案)[35][36][38] **6 风险与关注点** - **短期挑战**:企业/汽车需求复苏慢于IoT,依赖PC换机周期提速[28][29] - **长期机会**:边缘AI生态扩展(谷歌合作)、折叠屏手机渗透率提升[12][33][34] **数据引用** - 核心IoT增长:2025财年同比超50%[18][23] - 总营收增长:2025财年同比12%,EPS同比61%[24] - 潜在市场:折叠屏手机或带来1亿单元需求(5%智能手机市场)[33] (注:未提及部分如具体财务预测、未公开客户名称等未列入总结)