异构计算架构 - 财报，业绩电话会，研报，新闻

异构计算架构

搜索文档

搜狐财经· 2026-02-27 19:44

公司开源战略与演进路径 - 公司自2010年开始有组织地使用开源软件，2012年逐步参与OpenStack等开源项目，并于2019年和2020年开源了openEuler、openGauss等项目 [1] - 公司是300多个开源社区的核心贡献者，有六千多名员工参与开源项目开发 [1] - 公司是全球开源领域的顶级玩家，是Linux基金会、Apache软件基金会等众多著名国际开源基金会的顶级成员或创始成员 [3] 基础软件开源理念与价值 - 公司认为基础软件复杂度、维护成本高，更适合开放出去，共建、共享、共用 [3] - 在智算产业，底层框架、基础软件由业界开源共建，应用层则呈现百花齐放格局，以此创造价值 [3] - 公司的生态策略是硬件开放、软件开源、使能伙伴、发展人才，合力推动计算产业创新 [7] 智算框架开源：CANN - 公司于2019年发布异构计算架构CANN，在昇腾智算生态中扮演类似英伟达CUDA的角色 [4] - CANN在2025年宣布正式开源开放，允许客户自主调优底层算子与硬件资源调度，提高AI演进效率 [4] - CANN社区已建立并正常运行，正与全国高校合作培养人才，未来将持续更新并开发新的推理套件、框架和工具 [4] 通用计算生态构建：鲲鹏 - 公司2019年推出基于ARM架构的鲲鹏处理器，初期面临软件生态挑战 [5] - 截至2025年上半年，鲲鹏已支持大数据、数据库等多款主要开源软件 [5] - 公司通过推出鲲鹏DevKit开发套件和BoostKit应用使能套件，以软硬协同提高性能，增强生态吸引力 [5] 操作系统开源：openEuler - 公司于2019年底宣布openEuler开源，2021年将其捐赠给开放原子开源基金会管理 [6] - 截至2025年底，openEuler社区已吸引2100多家企业、研究机构和高校加盟，拥有26000多名开源贡献者，累计装机量超过1600万套 [6] - openEuler在2025年12月底发布了第一个支持超节点的操作系统版本，支持全场景应用，其成功得益于技术优越、商业成功、生态完善及社区组织得力 [6] 数据库开源：openGauss - 公司主导创建了企业级关系型数据库开源项目openGauss，具有高可用、高性能、高安全等优点 [7] - openGauss已获得金融、电信、政务等关键行业客户的信任 [7] - 未来将持续投入改进内核，提升对多模态数据的支持能力，并增强oGRAC多写功能以支持分布式超节点架构 [7]

智微智能：推出‘智擎’机器人大脑域控制器系列，覆盖100TOPS至2070 FP4TFLOPS多档AI算力

21世纪经济报道· 2026-01-21 19:51

公司产品发布 - 公司针对机器人大脑域控制器推出了名为“智擎”的新产品线 [1] - 该产品线主力采用NVIDIA Jetson系列芯片，具体涵盖Orin NX、AGX Orin和AGX Thor等型号 [1] - 产品提供从100 TOPS到2070 FP4 TFLOPS的多种AI算力选择 [1] 产品技术与性能 - 产品依托车规IATF16949质量体系进行生产制造 [1] - 产品在散热、体积、重量、信号完整性及防震等级等方面均满足客户要求 [1] - 产品采用异构计算架构，集成了多模态感知、深度学习与生成式AI能力 [1] - 产品支持对图像、语言、触觉等多源信息进行处理 [1]

NVIDIA Jetson芯片（包含Orin NX

NVIDIA Jetson芯片（包含Orin NX

海光信息20250912

2025-09-15 09:49

**海光信息电话会议纪要关键要点** **涉及的行业与公司** * 行业涉及服务器CPU AI芯片智算中心异构计算信创市场互联网市场工控机器人汽车电子网安领域[2] * 公司为海光信息中科曙光作为其第一大股东及重要生态合作伙伴[3][8] **核心观点与论据：市场空间与业务预期** * 中国服务器CPU市场规模巨大年化约1000亿人民币其中信创与非信创市场各占50%[2] * 公司原预期在服务器CPU领域实现300-400亿收入净利润75-90亿[2] * 公司业务已扩展至工作站CPU PC 工控机器人数通汽车电子和网安等领域潜在市场空间新增近1000亿[2][3] * 在AI驱动下国内智算中心AI CPU市场空间可达1400亿人民币相当于再造一个传统服务器CPU市场[2][4] * 国内AI芯片市场总空间可能达到1125亿美元（约8000亿元人民币）[4] * 预计公司2025-2027年收入目标分别为142亿 206亿及275亿元人民币若净利润率达30%-35% 2027年净利润可能达96亿元[3][10] **核心观点与论据：产品与技术优势** * 公司DCO业务拥有60亿元存货供应链保障充足主力产品为海光3号和海光4号[2][5] * 市场对公司全精度加速卡的预期差体现在智算中心需求互联网订单及单卡和集群性能三方面[2][6] * 未来中国政府侧智算中心需求量将远超当前水平单体规模将从几万卡提升到10万卡甚至更多[6][7] * 公司在互联网领域进展加速预计2025年将在T客户和A客户等取得显著进展[2][7] * 公司单卡性能预计对标甚至超过英伟达特供款产品并达到英伟达A100级别集群架构下性能优势明显[2][7] * 公司研发节奏顺利预计2026年前会发布多个新版本芯片[7] **核心观点与论据：生态系统与合作伙伴** * 中科曙光作为海光第一大股东在多卡互联技术高速互联总线存储和液冷技术方面具备领先地位[3][8] * 中科曙光发布了国内首个AI计算开放架构"曙光AI超级群系统" 并联合20多家企业开放低谱AI深算智能引擎等工具[8][9] * 中科曙光在产业链上下游合作广泛为海光生态系统提供坚实基础[8][9] **其他重要内容：财务指标与风险提示** * 截止2025年上半年公司合同负债为30.9亿元显示下游需求旺盛预付款为24.63亿元显示供应链韧性强[7] * 初步设定公司1万亿市值目标但需注意风险包括中美博弈加剧市场竞争加剧宏观经济影响及消费需求变化等因素[3][10]

算力需求井喷，英特尔至强6如何当好胜负手？

半导体芯闻· 2025-06-27 18:21

AI算力架构变革 - AI基础设施正从"GPU为中心"转向"多设备协同"的异构计算架构，传统GPU算力架构面临边际效能递减挑战[2][7] - 大模型负载需要CPU和GPU协同配合，涉及数据采集、清洗、标注、RAG等多个环节，要求企业同步升级两类算力资源[4][5] - 英特尔提出基于异构的四大解决方案：数据预处理CPU流水线（训练性价比提升10%）、投机执行CPU+GPU方案、KVCache QAT压缩优化（Qwen2.5-14B首词延迟下降）、稀疏感知MoE CPU卸载（DeepSeek-R1并发数从11提升至27）[6][7] 至强6处理器技术突破 - 至强6采用模块化设计，I/O与计算模块解耦，支持灵活扩展（最高288核），BIOS框架升级实现性能核与能效核动态调度[10] - 性能飞跃：内存带宽提升2.3倍（12通道DDR5达6400MT/s），PCIe带宽提升1.2倍，跨插槽通信提升1.8倍，支持CXL 2.0[12][13] - 内置硬件加速模块：单个QAT引擎可替代6.8个CPU核心，4个QAT模块释放32核资源；AMX加速器提升AI任务效率[13] - 场景性能：6900系列性能提升2倍，能效比提升1.4倍；云计算场景实现2倍核心密度，60%能效提升，30% TCO节省[13][14] 芯云协同实践 - 英特尔与火山引擎合作推出第四代ECS实例，CPU频率提升20%，网络存储带宽最大提升100%，IOPS/PPS提升30%[18][20] - RAG应用全链路优化：利用AMX加速器使任务耗时最多减少90%，CPU推理吞吐能力提升114%[20][22] - 双单路架构增强稳定性，新增支持Jumbo Frame、TDX机密计算及新型SSD云盘[20] 本地化部署方案 - 推出锐炫GPU+至强CPU的高性价比一体机，提供纯本地部署（数据不出域）和云边协同部署两种架构[24][27] - 锐炫Pro B60配备24GB显存，支持32K-128K token上下文窗口，通过EAP软件封装实现模型"零改造"迁移[28] - 集成Grafana监测系统，提供完整可观测性，支持与企业现有运维体系集成[28]

14.9万元，满血流畅运行DeepSeek一体机抱回家！清华90后初创出品

量子位· 2025-04-29 12:18

产品性能与定价 - 褐蚁HY90一体机搭载671B参数FP8精度原版DeepSeek模型，价格降至14.9万元级别，较传统百万级设备成本降低一个数量级[1][5][19][31] - 推理速度达22 tokens/s，优于DeepSeek官网表现，数学题等复杂任务仍保持20+ tokens/s[4][10][16] - 采用双路AMD 9005系列CPU+消费级GPU异构架构，1TB/s高内存带宽突破"内存墙"，硬件成本控制在10万元内[24][25] 技术架构与创新 - 自主研发推理引擎框架，FP8精度下Decode阶段速度稳定20+TPS，128K上下文仍保持15TPS，16K上下文首字延迟≤80秒[26][27] - 支持INT4量化技术，Decode速度提升至28TPS（1K上下文），预留1.5T参数模型扩展能力[26][28] - 通过参数压缩与算法优化，实现满血FP8精度模型部署，未来将支持MoE类模型[27][29] 公司背景与团队 - 创始人季宇为清华90后博士，CCF优博奖得主，曾任华为昇腾AI芯片编译器专家，入选"天才少年"计划[6][35][38][39] - CTO余洪敏为中科院博士，主导过百度昆仑芯、华为车载昇腾芯片等10余款芯片流片与量产[40][41][42] - 获智谱AI、峰瑞资本等明星机构投资，成立两年即实现技术突破[42][43][44] 行业影响 - 改写行业格局，将满血671B模型部署成本从百万级降至10万元级，同类低配方案价格区间原为20-40万元[31][32] - 推动大模型在智能客服、数据分析等场景的普惠应用，为中小团队提供高扩展性AI部署方案[32][33]