Workflow
KTransformers系统
icon
搜索文档
高性能计算群星闪耀时
雷峰网· 2025-08-18 19:37
高性能计算(HPC)与大模型发展 - 高性能计算是大模型训练的核心基础设施 没有高性能计算就没有大模型[2] - HPC技术在大模型时代扮演降本增效的关键角色 通过软硬协同优化可显著提升训练效率[3][4] - 中国HPC发展经历了三个阶段 从自研计算机到采购工作站再到自研处理器构建超算[4] 清华高性能计算研究所 - 清华高性能所是中国HPC研究的先驱 率先采用工作站集群方案打破美日垄断[4] - 研究方向从硬件转向软件优化 在计算/存储/通信三大领域积累深厚经验[5] - 培养了大量顶尖人才 包括华为海思首席科学家/网易有道CEO等产业界精英[16] 存储技术创新 - 郑纬民团队突破大规模SAN存储技术 将产品价格大幅降低[13] - 提出云存储概念并开发国内首个云计算平台"清华云"[13] - 陆游游团队开发的SuperFS文件系统夺得IO500全球存储榜首[63] 大模型训练优化 - 开发"八卦炉"训练系统 支持174万亿参数MoE模型在国产超算上运行[37] - 推出全球首个开源MoE训练框架FastMoE 训练效率提升显著[41] - SmartMoE系统采用动态并行策略 进一步优化稀疏模型训练[42] 推理系统创新 - Mooncake系统实现KVCache共享 节省GPU算力消耗[55] - KTransformers系统实现CPU/GPU协同推理 降低显存需求[57] - "赤兔"推理引擎支持国产芯片 性能优于主流开源方案[44] 国产芯片生态建设 - 清程极智专注国产芯片编译优化 支持华为/沐曦等十余家厂商[86] - 开发九源智能基础软件栈 实现跨硬件平台适配[96] - 目标是用国产芯片训练国际一流大模型 突破算力瓶颈[85] 新兴计算方向 - 张悠慧研究类脑计算 提出类脑计算完备性理论[74] - 开发通用类脑编译器 解决软件碎片化问题[77] - 汪东升团队发现多个处理器安全漏洞 推动硬件安全防御[81]
院士郑纬民:中国不仅要构建类CUDA系统,同时也要做好10个关键软件
观察者网· 2025-07-26 22:48
人工智能产业发展战略 - 上海市正深化人工智能全产业链布局 构建全市智能算力资源统筹调度服务平台 2025年底智算供给能力将超10万P [1] - 上海市形成"4个基础模型+N个垂域模型"发展路线 打造"一东一西 一软一硬"差异化布局 [1] - 上海将通过构建高质量语料供给体系 加大重点垂直领域应用 创新应用生态构建等措施加快建设人工智能"上海高地" [1] 人工智能技术挑战与突破 - 我国人工智能产业在芯片 算力 数据 生态等领域面临挑战 需聚焦低成本个人用推理机研制和国产智算系统可用性提升 [3] - KTransformers系统通过以存换算方式降低AI使用门槛 国产智算系统需构建类CUDA系统并完善10个关键软件 [3] - 企业应用AI需找准核心问题 用好高质量数据 微调基础大模型 [3] 数据要素发展现状 - 高质量数据集具备高技术含量 高知识密度 高价值应用的"三高"特征 是AI发展核心驱动力 [5] - 高质量数据集建设面临目标定位模糊 实施路径碎片化 技术底座薄弱三大难题 [5] - 国家部委和地方政府推动"人工智能+数据要素"政策协同 新一代数据标注和合成数据为突破"数据墙"提供新思路 [5] 企业人工智能布局 - 中国电子建立完整集成电路产业链 构建以飞腾 麒麟 达梦 中国电子云 中国长城为代表的全栈信创底座 [7] - 中国电子云自主研发CECSTACK专属云平台 提供通算 智算 超算一体化服务 打造全链路AI解决方案 [7] - 中国电子云将在政务 医疗 金融等关键行业打造行业大模型 推动"人工智能+"行动落地 [7]