AI原生(AI Native)
搜索文档
9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
AI前线· 2026-02-04 18:53
公司战略与市场定位 - 公司在2023年百模大战期间,战略转向端侧大模型,此决策在次年因苹果入局而获得市场验证 [2] - 公司当前战略清晰,火力全开,发布可“即时自由对话”的大模型及首款AI硬件松果派(Pinea Pi),以支持硬件场景的全栈开发 [2] - 公司核心理念是“知识密度定律”,即大模型知识密度约每100天提升一倍,因此持续推出优秀模型是保持行业前沿的关键 [17][18] - 公司目标是打造一个能够持续训练出高知识密度大模型的系统,这被视为其最重要的产品和技术核心 [18] - 公司认为端侧市场分散、长尾且存在高价值场景,是创业公司更适合切入的领域,避免了与大厂在统一市场的直接竞争 [19] - 公司内部正推动“AI原生”计划,不到两百人的团队在十个月内写了2000万行代码,效率远超传统模式,并出现“一人公司”趋势 [20][21] 新产品与技术发布:MiniCPM-o 4.5模型 - 公司于2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,该模型是原生全双工的全模态大模型 [3] - 模型新引入端到端的“边看、边听、主动说”全模态能力,支持即时、自由的对话交互,弱化了传统“一问一答”的轮次概念 [3] - 该模型的核心创新在于全双工机制和全模态自主交互机制,实现了多模态输入输出互不阻塞,并能自主判断输出时机 [5] - 模型将所有能力统一训练到一个9B参数的模型中,克服了多维度训练难度大、系统负担重及知识冲突等挑战 [5][6] - 模型在保持文本和指令跟随能力不受损甚至有小幅提升的同时,实现了更低的显存占用、更快的响应速度及最佳的推理效率 [6] - 模型侧的低延迟优化得益于全双工状态下无需外部工具判断推理时机,以及采用“大主干模型+轻量级语音生成模块”的架构 [9] - 模型当前记忆时长约为一分钟,是其推理的“舒适区”,未来若需全天候陪伴式使用,需在方法和机制上创新 [9] - 公司判断全双工、全模态的自主交互机制可能是未来新的学习与增长方式,并已在统一建模、高效泛化及理解生成一体化方面迈出关键一步 [11] 开发者生态与硬件布局:松果派 - 公司今年发力重点之一是开发者生态,计划通过生态建设让开发者共同推动模型部署,而非单纯依靠商业化 [13] - 公司在深圳调研发现,超过一半涉及端侧模型的AI硬件项目都在使用MiniCPM,这是其建设生态和提供硬件的根本原因 [13] - 公司发布首款AI原生端侧智能开发板“松果派”,旨在通过软硬一体工具降低多模态模型在设备上运行、微调和应用开发的难度 [14] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,构建了软硬一体、全栈覆盖的端侧AI软件体系 [16] - 松果派计划在年中量产上市,但今年主要承担市场教育作用,目标是打通端侧模型到应用的“最后一公里”硬件 [16] - 硬件定价不以盈利为主要目的,初期采用成熟方案,后续将推出国产化及不同算力版本,并根据开发者反馈调整 [16] - 公司强调其核心是聚焦端侧原生模型研发,硬件由合作伙伴设计,公司负责整合应用 [16] 技术理念与行业洞察 - 公司认为端侧与云端的协同将是未来长期存在的主流形态,智能终端是大模型能力向用户延伸的重要载体 [23] - 端侧模型在实时性要求高的任务中不可或缺,其核心价值在于本地即时处理数据并快速响应,这是端云协同中端侧不可替代的意义 [23] - 手机在大模型应用上仍有巨大拓展空间,未来需提升“输入”侧能力,使其能直接感知和理解现实环境,实现更自然的交互 [24] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键,是跨场景、跨本体适应能力的基础 [25] - 多模态乃至全模态能力是未来多智能体体系的基础,智能体可抽象为输入、模型、输出三个核心要素,未来将围绕这三要素不断强化 [25] - 通用人工智能的发展有两条主线:一是智能能力持续增强,二是智能的实现与使用不断变得高效 [25] - 公司判断未来一两年内,模型的专精能力和与现实世界交互能力将快速提升,逐步具备自主学习和成长能力 [26] - 随后,多智能体协同将成为重要突破,长远来看,模型还将展现出创新与创造能力 [26] - 未来三到五年,每个人都将拥有一个持续成长、越来越懂自己的大模型助手 [26]