大模型适配
搜索文档
摩尔线程MTT S5000完成对智谱GLM-5的适配
北京商报· 2026-02-12 11:32
公司技术进展与产品适配 - 摩尔线程公司于2月12日宣布,其基于SGLang推理框架,在旗舰级AI训推一体全功能GPU MTT S5000上,完成了对智谱新一代大模型GLM-5的Day-0全流程适配与验证 [1] - 公司凭借MUSA架构广泛的算子覆盖与强大的生态兼容能力,成功打通了模型推理全链路,并深度释放了MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用,实现了GLM-5的高性能推理 [1] - 此次快速适配印证了MUSA软件栈的成熟度,展现了国产全功能GPU对最新大模型即时、高效的支持能力 [1] 产品性能与市场定位 - GLM-5大模型与MTT S5000 GPU的国产双强联合,为开发者带来了可对标国际顶尖模型的极致编程体验 [1] - 该组合在函数补全、漏洞检测和Debug场景中均表现卓越,以显著增强的逻辑规划能力,从容应对各类复杂的长程任务挑战 [1]
摩尔线程MTT S5000完成智谱GLM-5大模型适配
财经网· 2026-02-12 10:18
公司技术进展 - 摩尔线程于2月12日宣布,其旗舰级AI训推一体GPU MTT S5000已完成对智谱新一代大模型GLM-5的全流程适配与验证 [1] - MTT S5000是专为大模型训练、推理及高性能计算设计的全功能GPU智算卡,基于第四代MUSA架构“平湖”打造 [1] - 该GPU单卡AI算力最高可达1000 TFLOPS [1] 行业合作动态 - 摩尔线程的硬件产品与智谱AI的最新大模型GLM-5实现了技术适配,表明国内AI芯片公司与大模型开发商之间的生态合作正在推进 [1]
摩尔线程MTT S5000率先完成对GLM-5的适配
新浪财经· 2026-02-12 08:53
公司产品与技术进展 - 摩尔线程基于SGLang推理框架,在其旗舰级AI训推一体全功能GPU MTT S5000上,完成了对GLM-5大模型的Day-0全流程适配与验证 [1] - 公司成功打通了模型推理全链路,并深度释放了MTT S5000的原生FP8加速能力,在确保模型精度的同时显著降低了显存占用,实现了GLM-5的高性能推理 [1] - 此次快速适配印证了公司MUSA软件栈的成熟度,并展现了其国产全功能GPU对最新大模型即时、高效的支持能力 [1] 行业生态与合作 - 智谱于2月11日正式发布新一代大模型GLM-5 [1] - 摩尔线程凭借其MUSA架构广泛的算子覆盖与强大的生态兼容能力,完成了对GLM-5的快速适配 [1]
寒武纪、华为昇腾适配DeepSeek最新模型
财联社· 2025-09-30 08:59
模型发布与技术创新 - DeepSeek-V3.2-Exp模型于9月29日在Hugging Face平台正式发布并开源[1] - 模型引入稀疏Attention架构,能够降低计算资源消耗并提升模型推理效率[1] 昇腾适配与支持 - 昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持[1] - 面向开发者开源所有推理代码和算子实现[1] 寒武纪技术适配 - 寒武纪宣布同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码[1] - 依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本[1] 海光信息技术优势 - 海光信息DCU实现无缝适配加深度调优,做到大模型算力"零等待"部署[1] - DeepSeek-V3.2-Exp在海光DCU上展现出优异性能,验证海光DCU高通用性、高生态兼容度及自主可控的技术优势[1]
填补空白!第四范式发布「信创模盒」ModelHub XC,连接国产GPU和国产大模型
格隆汇· 2025-09-22 19:12
行业痛点 - 行业面临算力与模型二元割裂的隐形天花板 部署模型与芯片架构互不兼容 采购硬件缺乏适配模型[1] - 国产硬件使用国外优化模型时出现水土不服 不同模型需分别适配 导致耗时长且重复工作量大[8] 产品发布 - 公司正式发布信创模盒ModelHub XC平台 信创社区及信创模型适配增值服务 旨在打破客户 算力与开发者之间的屏障[3] - 产品获得华为昇腾 壁仞科技 天数智芯 昆仑芯 摩尔线程和曦望等头部芯片厂商现场支持[5] 技术方案 - 开创性发布AI引擎体系EngineX 通过基础算法架构适配驱动批量化模型支持 解决国产信创芯片在模型兼容性和支持数量的长期瓶颈[7] - 极大缩短模型上国产算力平台部署周期 实现引擎驱动和多模型即插即用[7] 平台能力 - 上线当日提供上百个适配认证模型 包含DeepSeek V3.1和OpenAI开源大语言模型gpt-oss-20B等热门模型[10] - 平台已适配华为昇腾 寒武纪 天数智芯 昆仑芯 沐曦和曦望等信创算力 未来将覆盖所有主流信创算力[10] - 模型标注可适配的国产芯片品牌 明确下载模型与采购芯片的对应关系[10] 发展目标 - 未来半年适配认证模型数量达千数级 一年内达十万数级 后续保持持续更新速度[10] 增值服务 - 提供信创模型适配增值服务 针对不了解国产算力适配模型或需要模型适配指定算力的用户提供调整服务[12] - 数百名专业工程师团队解决卡跑不了模型或模型不知匹配什么卡的问题 后续将开放更多定制化能力[12]