MiniCPM - 财报，业绩电话会，研报，新闻

MiniCPM

搜索文档

搜狐财经· 2025-12-24 02:43

文章核心观点 - 北京市人工智能产业，特别是大模型领域，在技术突破与商业化落地双轮驱动下，已从“模型热”迈向“应用热”，模型备案数量、产业应用规模及多项关键指标均居全国首位，正巩固其作为全球AI战略高地和“人工智能第一城”的地位 [1][2] 行业规模与地位 - 截至12月17日，北京市新一批生成式人工智能大模型完成国家备案，大模型备案数量突破200款，备案数量与产业应用规模两项指标持续保持全国首位 [1] - 北京大模型备案数占全国备案总量的30%，人工智能产品应用完成登记数量147款，模型备案与产品登记数量之和占全国总量的35% [2] - 北京市头部大模型注册用户规模达14.39亿，抖音、智谱、月之暗面等企业累计服务全国超3万家机构，日均调用频次达7.46亿次 [2] 代表性公司技术突破 - **面壁智能**：提出“密度定律”，强调模型能力密度每100天可倍增一次，其端侧大模型MiniCPM仅用24亿参数实现了超过百亿参数大模型的性能 [5] - **月之暗面**：无预警开源发布K2模型，为全球首个万亿参数、320亿激活的MoE架构模型，登顶全球开源榜单 [5] - **百度**：文心大模型升级至5.0版本，成为统一的原生全模态模型，公司认为技术迭代速度是唯一护城河 [5] - **智源研究院**：推出Emu3.5多模态世界大模型，依托超10万亿token的大规模多模态数据训练，使视频数据训练时长从15年跃升至790年，参数量从8B提升至34B [5] - 截至目前，北京已备案的大模型中有37款为多模态模型 [5] 底层算力与生态支撑 - 百度预告将发布新一代昆仑芯M100及M300，推动国产算力自主可控 [6] - 智谱AI已适配40多款国产芯片，包括摩尔线程、寒武纪、昇腾、沐曦等主流国产芯片，认为使用国产算力进行训练或推理在技术上已经可行 [6] 商业化应用与市场表现 - **百度AI搜索**：截至9月，月活用户达3.82亿，连续三个季度登上国内AI搜索行业月活榜首 [1] - **豆包大模型**：截至12月，日均tokens调用量已超过50万亿，相比去年12月实现了超过十倍的增速 [1] - **AI数字人技术**：成为商业化“主力军”，今年“双11”期间，83%的开播主播使用百度慧播星数字人，开播直播间数同比增长119%，GMV同比提升91%，该技术已落地巴西并计划进军东南亚、美国 [9] - **百度搜索**：进行“十年最大改版”，首条结果富媒体覆盖率已达70%，从工具转向“万能搭子” [9] - **智谱**：通过开源策略带动API调用量增长10倍，实现开源与商业双赢 [9] - **面壁智能**：其端侧模型已在汽车、手机终端规模化落地，预计设备数量将实现十倍增长 [9] 产业应用场景分布 - 北京市目前有121款通用模型，其余80款为行业模型，主要覆盖政务、科研、教育、文化、旅游、创意、工业、资源、制造、安全、电商、生活服务等领域 [10]

Artificial Intelligence

Generative AI

Artificial Intelligence

文心大模型

豆包大模型

MiniCPM

Artificial Intelligence

Generative AI

Artificial Intelligence

文心大模型

豆包大模型

MiniCPM

从「密度法则」来看Scaling Law撞墙、模型密度的上限、豆包手机之后端侧想象力......｜DeepTalk回顾

锦秋集· 2025-12-15 12:09

文章核心观点 - 大模型的发展正从依赖规模扩张的“规模法则”转向追求效率提升的“密度法则” [2][3] - “密度法则”指出，模型能力密度每3.5个月翻一倍，使得实现相同智能水平所需的参数量和成本呈指数级下降 [11][28] - 行业未来的核心竞争力将从规模竞赛转向效率与智能密度竞赛，为端侧智能的普惠化奠定基础 [11][59] Scaling Law的可持续性问题 - 规模法则在数据和算力上面临可持续发展瓶颈，并非完全失效，而是“撞墙了” [2][15] - 训练数据瓶颈：核心训练数据依赖互联网公开语料，其规模增长已放缓，基本停留在20T Token左右，难以继续扩展 [15] - 计算资源瓶颈：模型规模指数级增长需要不可持续的计算资源，例如LLaMA 3 405B模型训练使用了1.6万块H100 GPU [16] 密度法则的提出与定义 - 灵感来源于信息时代的摩尔定律，智能时代需要关注“知识压缩效率”与“智能密度” [3][20] - 观察到行业趋势：用越来越少的参数实现相同的智能水平，例如2020年GPT-3需千亿参数，2023年初MiniCPM仅用2.4B参数达到相似能力 [23] - 定义了模型的“相对能力密度” = 同能力基准模型的参数量 / 目标模型参数量，以此量化模型的知识压缩效率 [24][25] 密度法则的核心推论 - 推论1：实现特定AI水平的模型参数量呈指数级下降，每3.5个月下降一半 [32] - 推论2：模型推理开销随时间呈指数级下降，例如GPT-3.5推理百万Token成本约20美元，相同能力的Gemini 1.5 Flash仅需0.075美元 [36][38] - 推论3：自ChatGPT发布后，大模型能力密度的增长速度明显加快 [42] - 推论4：模型小型化带来巨大的端侧智能潜力，未来3-5年端侧芯片预计可运行10B-60B参数规模的模型 [45] 构建超高能力密度模型的制备体系 - 架构高效：趋势从“大模型”迈向“长模型”与“全稀疏架构”，包括前馈网络和自注意力机制的稀疏化，以处理长序列和复杂思考 [53] - 计算高效：坚持软硬协同优化，包括自研训练框架、投机采样、量化技术等，例如全阵敏感4比特量化能在保持99%性能下将存储压缩至Int4 [54][56] - 数据高效：预训练阶段核心是提升数据质量与清洗；后训练阶段关键在于通过人机协同合成高质量数据 [55][57] - 学习高效：构建“模型能力风洞”，通过训练小规模模型验证数据配比、超参等，以科学化调度降低大模型训练的试错成本 [58][67] 行业现状与头部厂商动态 - OpenAI通过推出“Mini”或“Flash”版本，积极将旗舰模型能力压缩至小模型，以降低推理成本 [71] - Google在架构层面进行探索，例如在Diffusion Model中展示非自回归快速生成能力，并应用高效的注意力机制 [71][72] - 预训练数据的核心瓶颈是互联网语料质量低；后训练的关键瓶颈是高质量Query和稳定运行环境的稀缺 [68][69] 未来技术趋势展望 - 明年技术主线将集中在Agent领域，其能力提升的核心驱动力依然是数据积累 [73] - 高质量的后训练数据和稳定的运行环境将成为决定各家模型能力上限的关键因素 [69][73] - 端侧智能预计在2026年迎来重要转折点，驱动力包括普惠化需求、隐私保护以及端侧芯片算力与模型能力密度的协同提升 [75][76][77] - 端侧多模态的发展方向包括高清高刷体验的优化，以及流式全模态处理能力 [78] 模型评价与行业发展 - 现有大模型“排行榜”因容易导致模型过拟合而有效性受到质疑 [82] - 未来需要发展内部私有评测体系，并构建动态、前瞻性的评测集，以引导模型向更通用的方向发展 [84][86] - 长期需关注对模型自主学习能力的评测 [85]