MiniCPM系列模型
搜索文档
面壁智能完成新一轮融资,26年累计融资超10亿,跻身基模独角兽行列
机器之心· 2026-04-07 11:54
公司融资与市场地位 - 公司于近期完成新一轮数亿元人民币融资,由深创投和汇川产投联合领投,道禾长期投资、国泰君安创新投、武岳峰科创等跟投 [1] - 公司在2026年第一季度累计融资规模预计已超10亿元人民币,并在过去一年内陆续完成3次融资,获得京国瑞、茅台基金、龙芯创投、中金保时捷等多方知名机构投资 [1] - 公司在2026年中关村论坛年会上获颁“2026年度中国独角兽企业”称号,正式跻身基座大模型独角兽行列 [2] 投资方战略逻辑与行业趋势 - 领投方深创投作为国家级硬科技创投机构,认为公司在端侧通用基座模型方向的突破,高度契合国家“智能经济”战略对终端智能化的核心需求 [4] - 深创投认为,在算力约束下持续提升模型智能密度是端侧AI的第一性原理,高智能密度能有效降低智能体部署与调用成本,为智能体经济的规模化爆发奠定基础 [4] - 领投方汇川产投作为工业自动化龙头,其入局代表产业端对端侧AI支撑新型工业化、深度融合实体产业的战略共识 [5] - 汇川产投认为,公司的MiniCPM系列模型在模型能力、尺寸、芯片生态和工程经验层面,与其工业AI战略高度适配,期待模型能力融入其通用自动化、具身等产品线 [5] - 投资方国泰君安创新投认为,公司是国内少数在端侧模型持续迭代与规模化场景落地方面均保持领先的中坚力量,看好其引领端侧模型商业化爆发的黄金浪潮 [5] 公司技术路径与核心成果 - 公司坚持“密度法则”,即在有限算力下持续提升模型能力密度,并将其作为第一性原理 [6][7] - 公司已形成“理论-模型-工具-应用”的全链路技术生态闭环与产业向心力 [7] - 公司的MiniCPM系列开源模型是“密度法则”的直接产物,涵盖语言、全模态、多模态、语音模型,是国内除阿里以外唯一开源“端侧模型全家桶”的AI厂商 [8] - MiniCPM系列在GitHub、Hugging Face等平台累计下载量已突破2400万 [8] - 公司于2026年初发布行业首个全双工全模态大模型MiniCPM-o 4.5,以9B的精简体量实现语音、视频、文本的全模态同步交互,支持边看、边听、主动说的类人感知能力 [10] - 在2026中关村论坛上,公司将MiniCPM模型部署于具身机器人进行实机展示,实现了在嘈杂环境中对快速手势、复杂菜单、中英文混合视觉信息的精确理解与本地化实时响应 [10] 产品布局与商业化落地 - 公司已在汽车、智能手机、AIPC、智能家居等领域实现规模化商业落地 [12] - 公司将于今年推出首款AI原生端侧智能开发板“松果派(Pinea Pi)”,基于NVIDIA Jetson系列模组打造,内置完整软硬一体全栈AI软件体系,支持Agent原生、多模态原生、端侧原生能力 [12] - 公司与清华联合开源的“可端可云”版龙虾EdgeClaw已与松果派深度适配,形成主打安全可控、开箱即用的智能硬件产品EdgeClaw Box [12] - EdgeClaw Box集成了公司端侧模型MiniCPM全家桶,支持数据本地处理、断网运行,实现零Token消耗 [12]
洪泰基金2025年度回顾:在冰与火之间,看见中国科技的未来
新浪财经· 2026-02-14 17:15
洪泰基金2025年度运营总结 - 新成立5只股权投资基金,覆盖人工智能应用、智能制造、数字经济、半导体和硬件、超导、新材料、能源等多个方向,获得险资、母基金、国有企业、民营企业等多元投资人支持 [2][15] - 全年完成27个投资项目,主要聚焦于半导体和硬件、具身智能机器人、智能制造、商业航天、人工智能等高成长性技术方向,其中超过70%的项目在交割当年申报IPO或完成新一轮融资 [2][15] - 全年退出项目数量达42个,其中2025年完成IPO或正在IPO中的项目超过20个,包括摩尔线程等明星项目,另有20余个项目在辅导中计划1年内提交IPO申请 [2][15] - 44家洪泰Family成员企业再融资规模达数百亿 [3][16] 2025年代表性投资项目列举 - **半导体和硬件领域**:投资了包括新声半导体(国产高端射频滤波器)、物奇微电子(短距通信与终端AI芯片)、影微创新(端侧AI影像芯片)、芯正微(军工芯片国产替代)、佳迈股份(高端气动/流体控制)、西安奕材(12英寸电子级硅片,全球第六)及昆仑芯(行业头部AI芯片供应商)等企业 [4][17] - **具身智能机器人和AI大模型领域**:投资了微分智飞(飞行具身智能)、跨维智能(文旅人形机器人)、非夕机器人(自适应机器人)、它石智航(具身智能)、仙工智能(机器人控制系统)、微亿智造(工业具身智能)、面壁智能(端侧AI大模型)、纽氏达特(精密行星减速机)、原力灵机(全栈智能机器人)、西恩科技(高端伺服驱动)及无问芯穹(大模型能效优化)等企业 [4][17] - **商业航天及其他先进制造领域**:投资了微联星智(商业卫星通信载荷)、国星宇航(AI智算卫星星座)、东方空间(商业航天)、万宇科技(搅拌摩擦焊)、盛方科技(平板显示准分子激光管)及韵腾激光(激光设备)等企业 [6][19] 行业荣誉与市场地位 - 2025年公司获得多项权威奖项,包括中国保险资产管理业协会A类私募股权投资基金管理人、清科研究中心2025中国创业投资机构榜单TOP30、中国证券报第九届创业投资机构金牛奖(三年期)、证券时报2025创投金鹰奖之年度VC机构、中国基金报第二届中国私募股权创投英华示范机构综合实力50强等 [5][18] - 同时获得融资中国2025年中国创业投资机构TOP20及最佳募资创业投资机构TOP10、全球PE论坛组委会及财新智库2024-2025年度中国创业投资机构二十强、钛媒体2025年度募资先锋及投资先锋TOP20等多项细分领域认可 [6][19] 创始人关于2025年AI行业与资本市场的核心观察 - **AI领域的心态逆转与标志性事件**:2025年初DeepSeek的横空出世是划时代事件,其在一周内斩获1亿用户,将中美大模型技术的差距从行业此前悲观预期的三到五年,大幅缩短至3到5个月,标志着中国在生成式AI领域与美国站上同一起跑线 [7][20] - **资本市场呈现“冰与火”分化**:二级市场对AI概念极度狂热,部分上市公司仅因贴上“AI Agent”标签,市值便从两百亿量级飙升至七八百亿区间,估值溢价达到极致 [8][21] - **一级市场面临成本飙升与专业度挑战**:AI赛道投资成本急剧上升,相关天使轮融资额达5亿、10亿起步,行业正被逼向极致的专业化与垂直化,过去“泛投”模式难以为继 [8][21] - **资本格局发生结构性变化**:硬科技、创新赛道的主导资本由美元基金转向人民币基金,美元基金因退出渠道及投资逻辑限制而退潮,人民币基金快速崛起并成为主力,重构了一级市场投融资生态 [9][22] - **投资逻辑发生根本性变革**:市场核心稀缺物是具备核心技术壁垒、可持续商业价值并能落地变现的优质硬资产,AI时代拉平了“认知差”,专业度成为投资人唯一的核心竞争力 [10][23] - **对未来中国科技的展望**:AI领域的突破让中国科技站在世界前列,未来需要更多类似DeepSeek的技术突破、更多专精特新企业崛起,以及投资人的专业与耐心 [11][24]
中国大模型团队登Nature封面,刘知远语出惊人:期待明年“用AI造AI”
36氪· 2025-12-25 09:24
大模型发展规律:从规模法则到密度法则 - 过去半个世纪,全球科技产业遵循摩尔定律,即芯片性能每18个月翻一番[1] - 安迪-比尔定律指出,硬件性能提升的红利会被软件复杂度的增加所抵消,驱动了PC与互联网时代的产业进化[1][2] - 在生成式人工智能时代,Scaling Law(规模法则)主导下,模型参数指数级膨胀,软件对算力的索取远超摩尔定律的供给速度,AI发展的边际成本急剧上升[2] - 当硬件供给遭遇能源、数据等天花板时,旧的“安迪比尔”式增长范式开始失效[3] - 产业需要一场逆向革命,大模型需要通过极致的算法与工程化重构,在现有硬件上爆发更强的能力[4] - 清华大学刘知远团队在《自然·机器智能》发表论文,正式提出大模型的“密度法则”[5] - 基于对51个主流大模型的严谨回测,论文揭示从2023年到2025年,大模型的智能密度以每3.5个月翻倍的速度狂飙[5] - 这是一条比摩尔定律陡峭5倍的进化曲线,意味着每100天,就可以用一半参数量实现当前最优模型相当的性能,每100天成本减半,一年后成本就可能降至原来的十分之一[6] - 密度法则与规模法则相辅相成,是硬币的两面,密度法则通过在模型架构、数据治理、学习方法等方面的持续技术创新,找到一条更加“陡峭”的“规模法则”曲线[16][17] - 密度法则并非自然规律,而是人类社会在该科技领域的一种“自我实现”:投入越多,密度增长越快,2023年之前周期接近五个月,2023年之后则缩短到三个多月[14] 中国大模型公司的技术创新路径 - 2025年,中国大模型公司成为通过架构创新提升模型效率的最坚定实践者[5] - DeepSeek V3通过细粒度混合专家架构以1/10算力成本对标顶尖模型[5][18] - Kimi等团队在稀疏注意力机制上取得突破[5] - 清华大学刘知远及其面壁智能团队发布的MiniCPM系列模型,仅用约1/10的参数规模,即可承载对标云端大模型的智能水平,成为端侧高效AI的案例[5] - 追求效率有中国算力有限的国情因素,中国企业正通过技术创新绕过“算力墙”[11] - 2025年是模型架构创新的大年,主要方向包括:以DeepSeek V3为代表的细粒度混合专家架构走向成熟;稀疏注意力机制大行其道;复兴循环神经网络思想,与Transformer混合架构[20] - 大规模强化学习的应用取得巨大飞跃,尤其在数学和代码领域,模型通过自我探索持续提升能力,解决了数据枯竭的问题[19][20] - 原生训练的高密度模型相比剪枝、量化等方法更具优势,剪枝、蒸馏、量化都会降低模型密度,要把密度做高必须从头构建一套复杂的原生技术体系[28] 密度法则对产业竞争格局的影响 - 3.5个月的迭代周期意味着,任何一个投入巨资训练的大模型,如果不能在3到6个月内通过商业化收回成本,这种模式就很难持续[6][29] - 云端API服务的竞争会极其惨烈,最终可能只会剩下几家拥有海量用户和强大技术迭代能力的头部厂商[29] - 对于创业公司而言,机会可能在于“端侧智能”,端侧场景的约束条件使得技术优势成为唯一的竞争点,大厂的“钞能力”难以发挥[29] - 端侧智能会先从智能座舱等对功耗不那么敏感的场景开始,最终AGI时代一定会有属于它自己的智能终端形态[30] - 虽然训练模型的厂商会收敛,但推理算力需求会爆炸式增长[33] - 快速发展肯定伴随局部泡沫,但整体上正进入智能革命时代,如果AI也走50个周期,按现在的速度,大概到2030-2035年就能实现全球普惠的AGI[31][32] 技术前沿与未来展望 - 谷歌发布的Gemini 3是一个非常重要的里程碑,它在图像生成中对文字的控制达到了前所未有的高度,表明其模型的可控性和对世界的理解能力达到了新水平[22] - 密度法则是一个普遍规律,虽然不同领域的倍增周期可能不同,但只要是通用的、遵循Scaling Law的模型,未来也一定会遵循Densing Law[21] - 端侧设备的发展受限于多个因素:尚未形成好的端侧应用场景;端侧技术生态尚未形成;AGI发展还没收敛,产品设计上还没法完全规避错误[23][24] - 软硬协同面临挑战,硬件厂商受摩尔定律18个月周期的影响,架构调整更审慎,而模型每3个月就进化一次,短期内是软件适配硬件,长期看硬件会针对稳定的新技术做优化[26][27] - 最期待的创新是“用AI制造AI”,明年一个重要节点是自主学习,未来的生产标志就是“用AI制造AI”,这将是一个指数级加速的过程[35]
2025,中国大模型不信“大力出奇迹”?
36氪· 2025-12-19 19:06
文章核心观点 - 2025年生成式AI发展进入新阶段,其演进围绕认知深化、维度突破和效率重构三条核心脉络交织进行,开始定义AI进化的新范式 [1] - 单纯依赖算力和参数规模扩张的Scaling Law边际效益递减,行业正通过架构创新(如MoE、稀疏注意力)和多模态数据(尤其是视频)利用来寻求新的性能提升路径 [1][8] - 大模型行业的竞争格局呈现中美、开源与闭源“双核驱动”的态势,商业化成功的关键在于构建算力、能力、生态三层“护城河”,并聚焦于高价值的专业用户(ToP)市场 [3][7][10] - 智能体(Agent)和具身智能(Embodied AI)是重要的演进方向,但面临商业化、技术成熟度及软硬件协同的挑战,端云协同与模型“能力密度”提升是未来发展核心 [3][11][17][19] - 中国AI产业有望通过开源生态和专注于提升模型效率(如“密度法则”)的路径,在算力受限环境下实现突围 [3][20] 2025年大模型进化三大脉络 - **认知深化:从“直觉”到“逻辑”**:一线模型通过强化学习(RL)和更长的中间推理,从快速的模式匹配(System 1)向多步深度推理(System 2)演进 [1] - **维度突破:从“语言”到“物理空间”**:AI演进逻辑从理解语言符号进化到理解物理世界本身,“空间智能”成为关键,视频数据因其蕴含的丰富时空信息成为迈向物理世界的关键桥梁 [1][2] - **效率重构:从“暴力美学”到“性价比”**:产业落地回归极致的算力效能比,采用混合专家模型(MoE)、稀疏注意力等架构革新使模型变“轻”,以解决无限上下文带来的算力挑战 [1] Scaling Law与模型迭代新范式 - **Scaling Law面临瓶颈**:在大语言模型领域,由于互联网文本数据枯竭,单纯堆算力、堆参数的边际效益在递减 [8] - **多模态数据成为新红利**:视频数据的量级是互联网文本数据的百倍、千倍乃至万倍,从视频中学习(Learning from Video)成为大模型新的性能提升机会 [8] - **“密度法则”成为新方向**:类似于芯片摩尔定律,行业追求在单位参数内提升“智能密度”,通过技术创新实现模型能力压缩,预计每100天模型密度变得更高 [3][9] - **端云协同成为未来格局**:未来算力格局将是云端负责规划,端侧负责执行(做事),预计到2030年,端侧设备可承载GPT-5级别的模型能力 [3][18] 大模型公司的竞争“护城河” - **三层金字塔结构**:最底层是算力的获取、组织和有效利用;中间层是维持SOTA水平的模型能力;最上层是触达用户、获得数据反馈的生态 [9][10] - **“双核驱动”格局已定**:开源与闭源大模型、中国与美国的企业和人才,形成双核驱动格局,2025年被视为中国大模型的破局之年 [3][7] - **赢家通吃**:大模型是一个全球留不下几家公司的赢家通吃行业 [9] 智能体(Agent)的商业化现状与瓶颈 - **从玩具到工具的挑战**:智能体商业化面临三大技术瓶颈:基础模型推理能力仍有欠缺、领域适配时的“翘翘板效应”(能力此消彼长)、模型的记忆和遗忘机制不完善 [11][12][13] - **端侧与云端智能体的区别**:端侧智能体需满足隐私、实时、稳定需求,并对全模态数据有感知理解与个性化服务能力;云端智能体主要处于数字世界 [13] - **商业化变现聚焦ToP市场**:在ToB(企业)和ToC(消费者)之间,面向专业型用户(ToP)的市场是目前中美AI行业变现效率最高的地带,如AI编程和创作者付费工具 [14] - **ToB与ToC市场挑战**:ToB是门槛高的“攻坚战”,落地较好的是嵌入特定环节的流程型Agent;ToC则因能力不足、缺乏新硬件载体及商业模式(Token成本高于广告收益)的悖论而尚需时日 [15] 具身智能(Embodied AI)的发展与挑战 - **产业处于早期阶段**:需要足够耐心,其发展依赖于世界模型和具身大脑等基础模型的进步 [17] - **世界模型是关键底座**:如智源的多模态世界模型Emu3.5,从视频中学习时空、因果等信息,致力于预测下一个时空状态,为具身智能构建“世界模型”底座 [2][17] - **“大小脑”协同架构**:未来机器人将采用类似“大小脑”的分工,实时感知与行动留在本地(小脑),深度思考可借助云端(大脑) [17] - **软硬结合是理想路径**:大模型AI走向物理世界,智能(软件)至关重要,但在中国环境下,硬件比重可能更重,最理想的模式是软硬结合 [19] 开源生态与中国AI的突围之路 - **开源开放推动行业进步**:人工智能行业的快速发展离不开开源开放生态,这推动了技术普惠和产业化落地 [20] - **高效模型是突围关键**:通过“密度法则”等技术提升模型效率,降低训练和使用成本,是中国在算力存在短板情况下的重要突围路径,适用于端侧和云侧 [20] - **开源模型是国运级机会**:集全国之力支持优秀开源模型,在此基础上比拼应用和生态,是中国AI发展的良好路径 [20] - **给创业者的关键建议**:在大模型难以触及的行业深处寻找机会,并建立能够跨越模型迭代周期的商业结构,避免做过于通用的产品 [21]