面壁小钢炮MiniCPM4.0 - 财报，业绩电话会，研报，新闻

面壁小钢炮MiniCPM4.0

搜索文档

新浪科技· 2025-06-10 17:37

模型性能与架构创新 - 面壁智能发布第四代"面壁小钢炮"MiniCPM4 0端侧模型包含8B和0 5B两种参数规模实现同级最佳性能 [2] - MiniCPM4 0-8B模型在MMLU CEval MATH500 HumanEval等基准测试中以22%训练开销达到Qwen-3-8B性能超越Gemma-3-12B [2] - MiniCPM4 0-0 5B以2 7%训练开销实现Qwen-3-0 6B和Llama3 2两倍性能推理速度达600Token/s [2] - 采用InfLLMv2稀疏注意力架构将行业普遍40%-50%稀疏度降至5% 注意力层计算量减少90% [4] 速度与效率突破 - 相比Qwen-3-8B Llama-3-8B等同参数模型实现长文本推理5倍常规加速及220倍极限加速 [3] - 在128K长文本场景下缓存存储空间仅为Qwen3-8B的25% [4] - 通过优化Transformer架构内存问题显著降低长序列数据处理的内存占用 [3] 应用与市场表现 - 基于8B版本开发出MCP Client和MiniCPM4-Surve两款特定能力模型后者可媲美Deep Research工具 [5] - MiniCPM系列全平台累计下载量突破1000万次 [5] 技术差异化 - InfLLMv2架构解决NSA方案在短文本推理慢的短板同时提升文本相关性精准度 [4] - 联合创始人刘知远强调加速成果源于模型架构数据治理软硬件结合的全栈创新 [3]

面壁小钢炮4.0原生稀疏模型发布：最高220倍提速，开启端侧长文本时代

IPO早知道· 2025-06-10 10:39

模型发布与性能突破 - 面壁智能在2025智源大会上发布新一代端侧模型MiniCPM4.0，包括8B稀疏闪电版和0.5B版本，实现端侧性能创新式跃升[2] - 第四代小钢炮推出首个原生稀疏模型，5%极高稀疏度结合系统级创新技术，实现端侧长文本高效运行，宣告端侧长文本时代到来[2] - MiniCPM 4-8B采用新一代上下文稀疏高效架构，长文本推理速度实现5倍常规加速和最高220倍加速(显存受限场景)[4] 技术参数与性能表现 - MiniCPM 4.0推出8B和0.5B两种参数规模组合，延续"以小博大"特性，实现同级最佳性能[4] - MiniCPM 4.0-8B在MMLU等基准测试中以22%训练开销比肩Qwen-3-8B，超越Gemma-3-12B[4] - MiniCPM 4.0-0.5B以2.7%训练开销实现比Qwen-3-0.6B更优性能，参数减半性能翻倍，推理速度达600 Token/s[4] 存储优化与适配能力 - MiniCPM 4.0在128K长文本场景下仅需Qwen3-8B 1/4的缓存空间，量化版实现90%模型瘦身[5] - 模型已适配Intel、高通、MTK、华为昇腾等主流芯片，可在vLLM、SGLang等开源框架部署[6] - 加强MCP支持，性能超过同尺寸开源模型，拓展模型开发和应用潜力[6] 应用场景与市场表现 - 基于8B版本微调出MCP Client和MiniCPM4-Surve研究报告工具[6] - MiniCPM系列全平台累计下载量突破1000万[8] - 公司将持续基于"大模型密度定律Densing Law"提高知识密度与智能水平，推动端侧智能产业化[8]

端侧长文本

原生稀疏模型

Artificial Intelligence

面壁小钢炮MiniCPM4.0

端侧长文本

原生稀疏模型

Artificial Intelligence

面壁小钢炮MiniCPM4.0