松果派(Pinea Pi)
搜索文档
对话面壁智能:定位「大模型的光刻机」,要持续把单一优势变为综合性优势
IPO早知道· 2026-02-06 09:26
核心观点 - 面壁智能发布行业首个全双工全模态大模型MiniCPM-o 4.5,其具备“边看、边听、主动说”的类人感知与交互能力,旨在重新定义人机交互方式,开启人机交互新时代 [2] - 公司同步官宣首款AI原生端侧智能开发板“松果派”,计划于今年年中上市,旨在通过软硬一体解决方案构建开发者生态,打通模型到应用的最后一公里 [6][14] 产品技术:MiniCPM-o 4.5模型 - **模型定位与突破**:MiniCPM-o 4.5是行业首个全双工全模态大模型,实现了“即时自由对话”,具备感知不中断、交互零等待、对话不死板的类人感知与交互沟通能力 [2] - **技术参数与性能**:模型参数为9B,在全模态、视觉理解、文档解析、语音理解与生成、声音克隆等方面均达到全模态模型SOTA水准,体现了“高密度”特点 [3] - **能效比与部署优势**:模型追求极致能效比,通过更低的显存占用和更快的响应速度,在提供SOTA级全模态表现的同时实现了最佳推理效率和最低推理开销 [4] - **应用场景潜力**:其类人感知交互能力和小参数“身材”,有望赋能具身机器人、汽车、PC等终端,补齐例如具身机器人所需的“理解、沟通、交互”大脑能力 [4] 公司战略与行业认知 - **基础模型驱动策略**:公司定位为基模公司,工作模式是通过技术驱动训练出好的基础模型,从而一次性开放出一批场景,而非针对单一场景训练模型 [7][8] - **持续竞争力构建**:公司秉承做“大模型的光刻机”的定位,即不断训练出更高知识密度的大模型,并同步构建商业、生态、品牌等维度的综合性优势 [9] - **商业化进展**:公司自2023年起即坚持“两条腿走路”,在提升模型能力的同时积极推动商业化,并已交出不错的商业化答卷 [9] - **对端侧市场的看法**:端侧是一个大方向,但并非统一市场,而是分散、长尾且拥有诸多高价值场景的大市场,足以容纳多家创业公司差异化发展 [11] - **行业共荣心态**:认为越多厂商进入端侧赛道、共同做大行业蛋糕是值得高兴的事情,这证明了公司最初认知和坚持的正确性 [12] 生态构建:松果派与开发者生态 - **硬件发布初衷**:“松果派”AI原生端侧智能开发板的发布,主要目的是构建生态而非追求直接商业化,旨在通过软硬一体解决方案让更多人快速感知并应用其模型能力 [14] - **解决行业痛点**:该举措旨在打通模型到应用的最后一“公里”,并践行发布端侧原生模型时即做好与硬件适配的理念 [14] - **生态合作愿景**:希望“松果派”作为开端,吸引更多硬件和芯片厂商加入,使模型能在各种主流芯片中良好适配,从而搭建行业生态 [14] - **生态现状与动力**:2025年上半年调研显示,深圳做AI硬件的厂商中,超一半在使用MiniCPM端侧模型,这一数据是公司2025年发力开发者生态和硬件产品的重要原因 [15]
告别“对讲机”时代:面壁智能给 AI 装上了“神经末梢”
AI科技大本营· 2026-02-05 12:08
文章核心观点 - 行业正从追求云端大模型的“暴力美学”转向追求端侧小模型的“密度法则”,以实现低延迟、高隐私和强实时交互的“具身智能”[4][16][21] - 面壁智能通过发布仅9B参数的全模态模型MiniCPM-o 4.5和硬件开发板“松果派”,旨在定义“模型原生”的端侧智能标准,构建生态基础设施[19][25][31] - 解决“1Hz”的高层智能决策与“10Hz”的低层运动控制之间的断层,是推动机器人等具身智能设备走向实用的关键[34][35][37] 行业痛点与趋势转变 - 当前火热的Agent(如OpenClaw)存在根本缺陷:本质是将本地隐私数据打包发送至云端处理,导致延迟、隐私泄露和断网即失效三大问题[2][3] - 行业狂热追捧云端大模型和Agent概念的同时,一个被忽视的痛点是:AI若想真正接管生活,其“大脑”需要位于本地设备(端侧)[3][4] - AI交互需从“云端的神谕”转变为“指尖的直觉”,从“回合制”的对话模式转向“全双工”的实时自然交互[4][5][6] 技术突破:全双工交互与感知不中断 - 面壁智能的MiniCPM-o 4.5实现了“全双工”交互,打破了传统语音交互的“回合制”牢笼,使AI能边听、边看、主动说[6][8] - 该模型实现了“感知不中断”,即使自身正在说话,也能毫秒级地处理用户的插话或环境变化,并实时调整回应[8] - 技术核心是通过“时分复用”机制,在统一时间轴上并行处理视频流、音频流及输出流,让9B小模型具备处理并发多模态信息的能力[9] 模型战略:密度法则与小参数模型 - 行业过去信奉Scaling Law(尺度法则),追求模型参数越大越好,而面壁智能提出并践行Densing Law(密度法则),追求在更小参数内塞入更高密度的知识与能力[15][16] - 据测算,大模型知识密度约每100天翻一倍,因此当前9B模型的能力可能相当于一年前700亿(70B)甚至更大模型的能力[17] - MiniCPM-o 4.5仅用90亿(9B)参数,集成了视觉理解、文档解析、语音理解与生成、声音克隆等全模态能力,并达到SOTA水准[19] - 模型足够小是实现在手机、车机、机器人等端侧设备本地运行的前提,以解决云端方案的延迟与隐私问题[20][21] 硬件创新:松果派与模型原生设计 - 面壁智能跨界发布硬件开发板“松果派”,旨在为端侧智能提供一个“开箱即用的物理大脑”[22][25] - 该硬件核心采用Orin AGX 64G模组,并集成了高清摄像头、环形麦克风阵列、主动散热风扇及丰富接口,专为运行9B级端侧模型优化[25] - 其目的是“打个样”,定义“Model-Native(模型原生)”的硬件标准,优化数据流处理路径,将端到端延迟从4秒压至1秒以内[28][29][31] - 硬件与软件的深度协同优化至关重要,缺乏合适的“身体”,再聪明的“大脑”也无法发挥性能[30] 生态构建与工程化能力 - 公司通过开源模型和参考硬件,正在构建庞大的端侧智能生态,已推动模型在6款国产主流芯片上获得端到端推理性能提升[31] - 面对高度碎片化的端侧市场(汽车、手机、PC、机器人等),公司选择深耕适配不同硬件、压榨延迟等“苦活累活”,以此建立工程壁垒[38][39] - MiniCPM-o 4.5已支持16种不同大小的int4和GGUF量化模型,可通过llama.cpp和Ollama在本地设备高效推理,展现了极致的工程化能力[39] 应用前景:具身智能与1Hz大脑 - 当前机器人行业存在“小脑”(10Hz高频运动控制)发达但“大脑”(1Hz低频智能决策)薄弱的瓶颈[32][33][34] - MiniCPM-o 4.5旨在成为通用的“1Hz大脑”或“感知中枢”,使机器人能同时处理环境感知、指令理解和路径规划等高层智能任务[35] - “端侧大脑+本地小脑”的架构是具身智能走出实验室、进入家庭场景的可行路径,且不依赖网络[36][37] - 端侧智能市场高度碎片化,不同于赢家通吃的通用搜索市场,为专注适配与优化的公司提供了生存与发展空间[38][41]
AI能帮忙厨房看火了!面壁智能开源全模态模型MiniCPM-o4.5,边看边听还能主动抢答
量子位· 2026-02-04 20:31
文章核心观点 - 面壁智能开源的全模态模型MiniCPM-o4.5,实现了“边看、边听、主动说”的全双工实时交互,代表了AI从问答机向持续在场智能体的范式转变,是AI进入现实连续世界的关键分水岭[4][10][49] - 该模型是公司长期专注“端侧AI”战略路线的自然结果,其核心在于软硬一体、端侧原生,旨在打通端侧模型到应用的最后一公里,赋能汽车、手机、机器人等差异化终端和高价值长尾场景[51][56][64][66] 模型核心能力与特性 - **全双工实时交互**:模型采用全双工多模态实时流机制,可一边持续接收视频和音频输入,一边同步生成语音或文本输出,实现“边看、边听、边主动说”,打破了传统串行模型的I/O阻塞[10][33][35] - **即时自由对话**:模型在自身说话时也能听见并响应新插入的指令,支持即时自由对话与自然打断,改变了传统一问一答的交互模式[25][28][30] - **持续感知与主动响应**:模型以1Hz频率持续进行语义判断以决定是否介入回应,不再依赖检测静音的VAD机制,从而能基于对场景的持续理解主动发起提醒或评论[39][40][46] - **高性能表现**:在仅9B参数规模下,模型在全模态理解、视觉理解、文档解析、语音理解与生成、声音克隆等多个方向上,均达到了当前全模态模型的领先水平[42] 公司战略与商业模式 - **专注端侧AI路线**:公司自2022年8月成立起,在行业重心仍在云端时,便将方向押注在端侧AI模型上,其差异化在于“只做端,把端做到极致”[51][69][71] - **软硬一体协同**:公司与芯片厂商深度协同,芯片在设计阶段向模型侧开放以验证架构,模型研发也反向对硬件能力提出要求,形成软硬一体、双向奔赴的研发模式[53][58][59] - **端原生模型开发**:不将云端模型压缩后部署,而是在训练阶段就以端侧芯片为目标环境,开发“生来就能跑在端上”的模型[60] - **构建端侧生态**:通过配套推出AI Native的端侧智能开发板“松果派”,并实现模型在其上的开箱即用,旨在打通端侧模型到应用的最后一公里,赋能开发者与终端厂商[61][62][63] - **瞄准差异化市场**:公司认为端侧市场由大量差异化终端和长尾高价值场景构成,并非统一市场,关键是用尽可能少的参数实现尽可能强的能力,该市场可同时容纳多家创业公司[66][67][68] 技术架构与实现 - **流式处理机制**:通过将离线模态编码器与解码器升级为支持流式输入/输出的在线版本,并采用时分复用机制,在毫秒级时间线上对齐多模态输入与输出,实现高效流式处理[35][37] - **端到端全模态设计**:通过稠密特征将各模态编码器与解码器直接连接到大语言模型主干,使视觉、音频等模态在模型生成输出的同时仍能持续更新[39] - **语音建模创新**:语音侧采用文本与语音token交错建模,既支持全双工语音生成,也提升了长语音生成的稳定性[36] 应用场景与价值 - **场景适应性**:模型能力可自然延展至具身智能、车端或终端助手、复杂系统等场景,其价值在于持续运行、一直在场,在合适的时机接话或提醒,而非仅回答问题[44][45][48] - **硬件产品规划**:公司计划在年中发布首款AI硬件“松果派”,用于支持硬件场景的全栈开发,并已在智能座舱等方向落地,体现了软硬协同路线的具体实施[61]
9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
新浪财经· 2026-02-04 20:20
公司战略与市场定位 - 公司于2023年行业“百模大战”时,战略转向专注于端侧大模型,此决策初期受市场质疑,直至次年苹果入局端侧才验证其判断 [2] - 公司当前战略清晰,正全力推进端侧布局,包括发布支持“即时自由对话”的大模型以及计划在年中发布首款AI硬件“松果派”以支持硬件场景全栈开发 [2] - 公司核心理念是“知识密度定律”,认为大模型知识密度约每100天提升一倍,导致模型保鲜期短,因此核心竞争力在于构建能持续产出高知识密度模型的系统,而非单一模型 [14] - 作为创业公司,公司认为端侧市场分散、长尾且场景多样,并非统一市场,这为创业公司提供了切入细分领域、避免与大厂直接阵地战的机会 [15] - 公司定位为连接芯片厂商、终端厂商和开发者的重要媒介,2025年发力重点之一是建设开发者生态 [10] 核心产品与技术突破 - 公司于2024年2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,参数规模为9B [3][25] - MiniCPM-o 4.5是原生全双工的全模态模型,实现了“边看、边听、主动说”的端到端能力,支持即时自由对话,交互方式高度拟人,看、听、说并行不阻塞 [3][4] - 该模型两大核心创新为:1) 全双工机制,多模态输入输出互不阻塞;2) 全模态自主交互机制,模型可自主判断语义成熟度以触发输出 [4] - 技术挑战在于将图像、语音、指令等多种能力统一训练至单一模型,需精细把握训练动态以避免知识冲突,最终在保持文本和指令能力的同时实现了SOTA级全模态表现 [4][5] - 模型通过架构优化实现低延迟,采用“主干模型+轻量级语音生成模块”设计,并依赖高效推理框架llama.cpp-omni,降低了计算开销 [7][10] - 模型当前记忆时长约1分钟,为推理最佳“舒适区” [7] 开发者生态与硬件布局 - 2025年上半年在深圳的调研显示,当地涉及端侧模型的AI硬件项目中,超过一半在使用公司的MiniCPM模型 [11] - 公司推出首款AI原生端侧智能开发板“松果派”,旨在降低开发者在多模态设备上运行、微调和对齐模型的难度,构建软硬一体、全栈覆盖的端侧AI软件体系 [11][13] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,计划于2025年年中量产上市,初期不以盈利为目的,主要承担市场教育功能 [13] - 公司硬件由合作伙伴设计,自身负责整合应用,核心仍聚焦于端侧原生模型的研发,通过商业化落地验证模型能力并建立数据飞轮 [13] 运营效率与组织文化 - 公司内部推行AI原生计划,不到200人的团队在10个月内完成2000万行代码,按传统方式估算需700人完成 [16] - 其中一位核心员工在一个月内编写了65万行代码,通过将核心系统接入AI并重构,大幅提升效率 [16] - 公司内部出现“一人公司”趋势,小团队或个人可完成过去需团队数月完成的工作 [17] - 公司对“AI Native”的定义是:接到任务首先考虑用AI完成,并追求比人工完成得更好,AI已深刻影响其思维方式和工作模式 [17] - 公司招聘注重吸引“AI原生人才”,要求员工具备利用AI作为内在工具发现、解决问题并判断结果质量的能力 [17] 行业趋势与未来展望 - 公司判断端侧与云端的协同将是未来长期主流形态,智能终端是模型能力延伸的重要载体 [18] - 当前大部分产品仍依赖云端,存在延迟、隐私和安全问题,而端侧模型在实时性要求高的任务中不可或缺,价值在于本地即时处理与快速响应 [18] - 手机在大模型应用上仍有巨大空间,未来需提升其“输入”侧的环境感知与理解能力,但这在资源受限的终端上面临技术和工程挑战 [19] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键 [19] - 多模态/全模态能力是未来多智能体体系的基础,智能体之间的协同是必然选择 [19] - 通用人工智能的发展有两条主线:智能能力持续增强,以及智能的实现与使用不断高效化 [20] - 预计未来1-2年,模型的交互与专业能力将快速提升,具备更强自主学习能力;随后多智能体协同将成为重点;长远看模型将展现创新创造能力 [20] - 展望未来3-5年,每个人可能拥有一个在终端侧持续成长、越来越懂自己的大模型助手 [20]
9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
AI前线· 2026-02-04 18:53
公司战略与市场定位 - 公司在2023年百模大战期间,战略转向端侧大模型,此决策在次年因苹果入局而获得市场验证 [2] - 公司当前战略清晰,火力全开,发布可“即时自由对话”的大模型及首款AI硬件松果派(Pinea Pi),以支持硬件场景的全栈开发 [2] - 公司核心理念是“知识密度定律”,即大模型知识密度约每100天提升一倍,因此持续推出优秀模型是保持行业前沿的关键 [17][18] - 公司目标是打造一个能够持续训练出高知识密度大模型的系统,这被视为其最重要的产品和技术核心 [18] - 公司认为端侧市场分散、长尾且存在高价值场景,是创业公司更适合切入的领域,避免了与大厂在统一市场的直接竞争 [19] - 公司内部正推动“AI原生”计划,不到两百人的团队在十个月内写了2000万行代码,效率远超传统模式,并出现“一人公司”趋势 [20][21] 新产品与技术发布:MiniCPM-o 4.5模型 - 公司于2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,该模型是原生全双工的全模态大模型 [3] - 模型新引入端到端的“边看、边听、主动说”全模态能力,支持即时、自由的对话交互,弱化了传统“一问一答”的轮次概念 [3] - 该模型的核心创新在于全双工机制和全模态自主交互机制,实现了多模态输入输出互不阻塞,并能自主判断输出时机 [5] - 模型将所有能力统一训练到一个9B参数的模型中,克服了多维度训练难度大、系统负担重及知识冲突等挑战 [5][6] - 模型在保持文本和指令跟随能力不受损甚至有小幅提升的同时,实现了更低的显存占用、更快的响应速度及最佳的推理效率 [6] - 模型侧的低延迟优化得益于全双工状态下无需外部工具判断推理时机,以及采用“大主干模型+轻量级语音生成模块”的架构 [9] - 模型当前记忆时长约为一分钟,是其推理的“舒适区”,未来若需全天候陪伴式使用,需在方法和机制上创新 [9] - 公司判断全双工、全模态的自主交互机制可能是未来新的学习与增长方式,并已在统一建模、高效泛化及理解生成一体化方面迈出关键一步 [11] 开发者生态与硬件布局:松果派 - 公司今年发力重点之一是开发者生态,计划通过生态建设让开发者共同推动模型部署,而非单纯依靠商业化 [13] - 公司在深圳调研发现,超过一半涉及端侧模型的AI硬件项目都在使用MiniCPM,这是其建设生态和提供硬件的根本原因 [13] - 公司发布首款AI原生端侧智能开发板“松果派”,旨在通过软硬一体工具降低多模态模型在设备上运行、微调和应用开发的难度 [14] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,构建了软硬一体、全栈覆盖的端侧AI软件体系 [16] - 松果派计划在年中量产上市,但今年主要承担市场教育作用,目标是打通端侧模型到应用的“最后一公里”硬件 [16] - 硬件定价不以盈利为主要目的,初期采用成熟方案,后续将推出国产化及不同算力版本,并根据开发者反馈调整 [16] - 公司强调其核心是聚焦端侧原生模型研发,硬件由合作伙伴设计,公司负责整合应用 [16] 技术理念与行业洞察 - 公司认为端侧与云端的协同将是未来长期存在的主流形态,智能终端是大模型能力向用户延伸的重要载体 [23] - 端侧模型在实时性要求高的任务中不可或缺,其核心价值在于本地即时处理数据并快速响应,这是端云协同中端侧不可替代的意义 [23] - 手机在大模型应用上仍有巨大拓展空间,未来需提升“输入”侧能力,使其能直接感知和理解现实环境,实现更自然的交互 [24] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键,是跨场景、跨本体适应能力的基础 [25] - 多模态乃至全模态能力是未来多智能体体系的基础,智能体可抽象为输入、模型、输出三个核心要素,未来将围绕这三要素不断强化 [25] - 通用人工智能的发展有两条主线:一是智能能力持续增强,二是智能的实现与使用不断变得高效 [25] - 公司判断未来一两年内,模型的专精能力和与现实世界交互能力将快速提升,逐步具备自主学习和成长能力 [26] - 随后,多智能体协同将成为重要突破,长远来看,模型还将展现出创新与创造能力 [26] - 未来三到五年,每个人都将拥有一个持续成长、越来越懂自己的大模型助手 [26]