Workflow
EngineX引擎
icon
搜索文档
信创模盒ModelHub XC | 上线两个月模型适配破千 铸就国产AI算力与应用融合新基座
智通财经网· 2025-11-27 11:22
平台发展里程碑 - 「信创模盒」ModelHub XC上线两个月后,已完成适配并认证的模型数量突破1000个,比原计划提前了4个月[1] - 平台于2025年9月22日正式启动上线,旨在解决模型与底层芯片架构互不兼容的行业核心痛点[1][2] - 2025年11月25日,平台在摩尔线程芯片上一次性完成108个模型的规模化适配,为扩展至千量级模型库奠定基础[11] 核心技术突破与适配成果 - 2025年10月17日,在国产芯片曦望S2上完成风洞计算大模型的完整适配,实现单张图处理时间约1.5秒,性能比肩国际主流高端GPU[4] - 2025年11月1日,完成创新模型DeepSeek-OCR在昇腾、沐曦等信创算力卡上的适配测试,模型输出效果与NVIDIA平台完全一致,推理性能差距控制在30%以内[6] - 2025年11月17日,在昇腾910B4芯片上完成总参数量2300亿的顶尖开源Agent模型MiniMax-M2的适配,通过EngineX对GGML/MoE架构的深度优化实现“即插即用”部署[8][9] 平台核心能力与生态建设 - 平台以"EngineX引擎+批量适配"为核心,通过基础算法架构的深度适配实现模型在国产芯片上的“即插即用”[12] - 模型生态覆盖从通用大语言模型、垂直领域专业模型到前沿创新模型的多元化品类,已广泛支持华为昇腾、壁仞科技、天数智芯、昆仑芯、摩尔线程、曦望等主流国产算力[1][2][12] - 每个模型均标注可运行的芯片型号,支持用户快速匹配模型与算力[12] 未来发展规划 - 平台未来将加速向“万模互联”迈进,计划在一年之内冲刺十万模型,持续扩展模型规模与芯片支持范围[13] - 公司将保持快速更新节奏,以构建更完整、更高效的国产AI基础设施[13]
信创模盒ModelHub XC|上线两个月模型适配破千 铸就国产AI算力与应用融合新基座
格隆汇· 2025-11-27 11:12
平台发展里程碑 - 公司于2025年9月22日正式上线「信创模盒」ModelHub XC平台、信创社区及模型适配增值服务,旨在解决模型与底层芯片架构不兼容的行业核心痛点 [1][2] - 平台上线两个月后,已完成适配并认证的模型数量突破1000个,比原计划提前了4个月,标志着国产信创AI生态在模型覆盖广度上取得显著进展 [1][11] - 2025年10月17日,公司在国产芯片曦望S2上完成风洞计算大模型的完整适配与深度优化,实现单张图处理时间约1.5秒,性能比肩国际主流高端GPU [4] - 2025年11月1日,公司完成创新模型DeepSeek-OCR在昇腾、沐曦等信创算力卡上的适配测试,模型输出效果与NVIDIA平台完全一致,推理性能差距控制在30%以内 [6] - 2025年11月17日,公司在昇腾910B4芯片上完成高效Agent模型MiniMax-M2的适配,该模型为顶尖开源Agent模型,总参数量2300亿 [7] - 2025年11月25日,平台在摩尔线程芯片上实现108个模型的规模化适配,广泛覆盖文本生成、视觉理解、多模态问答等多种任务类型 [9] 平台核心能力与技术优势 - 平台以"EngineX引擎+批量适配"为核心,通过基础算法架构的深度适配实现模型在国产芯片上的"即插即用",极大缩短部署周期 [12] - EngineX体系对Transformer架构提供底层支持,并对GGML/MoE架构进行深度优化,实现了复杂模型在信创环境下的高效、稳定推理 [6][7] - 平台模型生态丰富多元,覆盖从通用大语言模型(如DeepSeek V3.1)、垂直领域专业模型(如风洞计算大模型)到前沿创新模型(如gpt-oss-20B,MiniMax-M2)的多元化品类 [1] - 平台广泛支持华为昇腾、壁仞科技、天数智芯、昆仑芯、摩尔线程、沐曦、曦望等主流国产算力芯片 [2][12] - 每个模型均标注可运行的芯片型号,支持用户快速匹配模型与算力,提供清晰的适配标签 [12] - 平台提供「信创模型适配增值服务」,由数百人工程师团队支撑,确保指定模型在国产环境中的成功适配与稳定运行 [12] 行业发展与未来规划 - 平台解决了AI产业发展的新矛盾:部署的模型与底层芯片架构互不兼容,采购的硬件缺乏充分适配的模型生态,这种"算力—模型"的二元割裂正成为制约AI规模化落地的隐形天花板 [1] - 平台为国产AI软硬件协同发展提供了坚实基础,将持续为产业智能化转型提供更为坚实与丰富的模型基座 [1] - 平台已按原计划提前4个月达成"千模适配"里程碑,未来将加速向"万模互联"迈进,计划一年之内冲刺十万模型 [14] - 公司将持续扩展模型规模与芯片支持范围,保持快速更新节奏,构建更完整、更高效的国产AI基础设施 [14]
信创模盒+摩尔线程|完成逾百个模型适配 量化模型优势显著
智通财经网· 2025-11-25 15:05
信创模盒ModelHub XC适配进展 - 范式智能宣布其信创模盒ModelHub XC已完成108个主流AI模型在摩尔线程GPU上的适配认证,涵盖文本生成、视觉理解、多模态问答等多种任务类型 [1] - 适配模型系列包括Mata、千问、Deepseek、混元、Open Sora等,预计未来半年内将扩展至千量级 [1][3] - 信创模盒ModelHub XC是面向信创算力生态的AI模型与工具平台,提供涵盖模型训练、推理到部署的全流程解决方案 [4] 摩尔线程GPU技术优势 - 摩尔线程GPU在量化模型方面展现出显著优势,凭借对低精度数据类型的硬件级支持、优化的指令集与缓存机制,有效降低模型显存占用并提升推理速度 [1] - 通过精细化校准与优化,适配模型在性能提升的同时确保推理精度满足商业落地要求 [1] - 摩尔线程于11月24日正式启动科创板发行,发行价为114.28元/股,创下2025年以来A股新股发行价新高 [1] EngineX引擎技术突破 - 范式智能依托自研EngineX引擎技术,重点突破模型在国产芯片上的兼容性与运行效率,显著降低开发者部署门槛 [1] - EngineX引擎实现“引擎驱动、多模型即插即用”,有效解决国产芯片在模型兼容性与规模支持上的瓶颈 [3] - 引擎支持多种国产算力卡,包括沐曦曦云C系列、天数智芯智铠/天垓系列等,覆盖文本生成、图片生成、语音合成等任务 [5] 国产算力生态合作 - 信创模盒平台支持多家国产硬件厂商,包括摩尔线程、寒武纪、昆仑芯、沐曦、海光等 [4] - 平台提供热门推理引擎如EngineX特制优化版本,基于transformer和diffusion架构,支持vLLM等 [5] - 平台定位为国内开发者互帮互助的AI社区,推动模型在国产化算力上生根发芽 [5]
完成逾百个模型适配 量化模型优势显著
智通财经· 2025-11-25 15:04
信创模盒ModelHub XC适配进展 - 范式智能宣布“信创模盒”ModelHub XC已完成108个主流AI模型在摩尔线程GPU上的适配认证,涵盖文本生成、视觉理解、多模态问答等多种任务类型 [1] - 平台预计未来半年内将扩展适配至千量级模型,为国产算力生态注入持续动能 [1] - 目前已完成包括Mata、千问、Deepseek、混元、Open Sora等模型系列的适配验证 [3] 摩尔线程GPU技术优势 - 摩尔线程GPU在量化模型方面展现出显著优势,其硬件凭借对低精度数据类型的硬件级支持、优化的指令集与缓存机制,有效降低模型显存占用并提升推理速度 [1] - 通过精细化校准与优化,适配模型在性能提升的同时,确保了推理精度满足商业落地要求 [1] - 摩尔线程于11月24日正式启动科创板发行,发行价为114.28元/股,创下2025年以来A股新股发行价新高 [1] EngineX引擎技术支撑 - 范式智能依托自研的EngineX引擎技术,重点突破模型在国产芯片上的兼容性与运行效率,显著降低开发者的部署门槛 [1] - EngineX引擎作为底层支撑体系,实现了“引擎驱动、多模型即插即用”,有效解决了国产芯片在模型兼容性与规模支持上的瓶颈 [3] - 该引擎是运行于国产算力卡(如沐曦曦云C系列、天数智芯智铠/天垓系列)的特制优化版本,基于transformer、diffusion等架构 [6] 信创模盒平台定位与服务 - 信创模盒ModelHub XC是面向信创算力生态的AI模型与工具平台,兼具社区和服务功能,致力于推动国产硬件平台上的人工智能创新与落地 [5] - 平台提供涵盖模型训练、推理到部署的全流程解决方案 [5] - 平台定位为国内开发者互帮互助的AI乐园,提供国产化算力开发经验分享,是最新最全的国产化算力社区 [6] 已适配的国产硬件与模型组合 - 适配工作覆盖多家国产GPU硬件,包括摩尔线程MTT S4000、沐曦曦云C500、天数智芯智铠100/天垓100、寒武纪MLU370-X4/X8、昆仑芯R200-8F、海光K100AI等 [4] - 已完成适配的模型包括姜子牙2-13B-Chat、Yi-1.5-9B、XVERSE-MoE-A4.2B、XVERSE-7B等多个文本生成与文本分类模型 [4] - 引擎支持的任务类型多样,包括文本生成、语音合成、图片生成等 [6]