芯云协同 - 财报，业绩电话会，研报，新闻

芯云协同

搜索文档

半导体芯闻· 2025-06-27 18:21

AI算力架构变革 - AI基础设施正从"GPU为中心"转向"多设备协同"的异构计算架构，传统GPU算力架构面临边际效能递减挑战[2][7] - 大模型负载需要CPU和GPU协同配合，涉及数据采集、清洗、标注、RAG等多个环节，要求企业同步升级两类算力资源[4][5] - 英特尔提出基于异构的四大解决方案：数据预处理CPU流水线（训练性价比提升10%）、投机执行CPU+GPU方案、KVCache QAT压缩优化（Qwen2.5-14B首词延迟下降）、稀疏感知MoE CPU卸载（DeepSeek-R1并发数从11提升至27）[6][7] 至强6处理器技术突破 - 至强6采用模块化设计，I/O与计算模块解耦，支持灵活扩展（最高288核），BIOS框架升级实现性能核与能效核动态调度[10] - 性能飞跃：内存带宽提升2.3倍（12通道DDR5达6400MT/s），PCIe带宽提升1.2倍，跨插槽通信提升1.8倍，支持CXL 2.0[12][13] - 内置硬件加速模块：单个QAT引擎可替代6.8个CPU核心，4个QAT模块释放32核资源；AMX加速器提升AI任务效率[13] - 场景性能：6900系列性能提升2倍，能效比提升1.4倍；云计算场景实现2倍核心密度，60%能效提升，30% TCO节省[13][14] 芯云协同实践 - 英特尔与火山引擎合作推出第四代ECS实例，CPU频率提升20%，网络存储带宽最大提升100%，IOPS/PPS提升30%[18][20] - RAG应用全链路优化：利用AMX加速器使任务耗时最多减少90%，CPU推理吞吐能力提升114%[20][22] - 双单路架构增强稳定性，新增支持Jumbo Frame、TDX机密计算及新型SSD云盘[20] 本地化部署方案 - 推出锐炫GPU+至强CPU的高性价比一体机，提供纯本地部署（数据不出域）和云边协同部署两种架构[24][27] - 锐炫Pro B60配备24GB显存，支持32K-128K token上下文窗口，通过EAP软件封装实现模型"零改造"迁移[28] - 集成Grafana监测系统，提供完整可观测性，支持与企业现有运维体系集成[28]