9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
新浪财经·2026-02-04 20:20

公司战略与市场定位 - 公司于2023年行业“百模大战”时,战略转向专注于端侧大模型,此决策初期受市场质疑,直至次年苹果入局端侧才验证其判断 [2] - 公司当前战略清晰,正全力推进端侧布局,包括发布支持“即时自由对话”的大模型以及计划在年中发布首款AI硬件“松果派”以支持硬件场景全栈开发 [2] - 公司核心理念是“知识密度定律”,认为大模型知识密度约每100天提升一倍,导致模型保鲜期短,因此核心竞争力在于构建能持续产出高知识密度模型的系统,而非单一模型 [14] - 作为创业公司,公司认为端侧市场分散、长尾且场景多样,并非统一市场,这为创业公司提供了切入细分领域、避免与大厂直接阵地战的机会 [15] - 公司定位为连接芯片厂商、终端厂商和开发者的重要媒介,2025年发力重点之一是建设开发者生态 [10] 核心产品与技术突破 - 公司于2024年2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,参数规模为9B [3][25] - MiniCPM-o 4.5是原生全双工的全模态模型,实现了“边看、边听、主动说”的端到端能力,支持即时自由对话,交互方式高度拟人,看、听、说并行不阻塞 [3][4] - 该模型两大核心创新为:1) 全双工机制,多模态输入输出互不阻塞;2) 全模态自主交互机制,模型可自主判断语义成熟度以触发输出 [4] - 技术挑战在于将图像、语音、指令等多种能力统一训练至单一模型,需精细把握训练动态以避免知识冲突,最终在保持文本和指令能力的同时实现了SOTA级全模态表现 [4][5] - 模型通过架构优化实现低延迟,采用“主干模型+轻量级语音生成模块”设计,并依赖高效推理框架llama.cpp-omni,降低了计算开销 [7][10] - 模型当前记忆时长约1分钟,为推理最佳“舒适区” [7] 开发者生态与硬件布局 - 2025年上半年在深圳的调研显示,当地涉及端侧模型的AI硬件项目中,超过一半在使用公司的MiniCPM模型 [11] - 公司推出首款AI原生端侧智能开发板“松果派”,旨在降低开发者在多模态设备上运行、微调和对齐模型的难度,构建软硬一体、全栈覆盖的端侧AI软件体系 [11][13] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,计划于2025年年中量产上市,初期不以盈利为目的,主要承担市场教育功能 [13] - 公司硬件由合作伙伴设计,自身负责整合应用,核心仍聚焦于端侧原生模型的研发,通过商业化落地验证模型能力并建立数据飞轮 [13] 运营效率与组织文化 - 公司内部推行AI原生计划,不到200人的团队在10个月内完成2000万行代码,按传统方式估算需700人完成 [16] - 其中一位核心员工在一个月内编写了65万行代码,通过将核心系统接入AI并重构,大幅提升效率 [16] - 公司内部出现“一人公司”趋势,小团队或个人可完成过去需团队数月完成的工作 [17] - 公司对“AI Native”的定义是:接到任务首先考虑用AI完成,并追求比人工完成得更好,AI已深刻影响其思维方式和工作模式 [17] - 公司招聘注重吸引“AI原生人才”,要求员工具备利用AI作为内在工具发现、解决问题并判断结果质量的能力 [17] 行业趋势与未来展望 - 公司判断端侧与云端的协同将是未来长期主流形态,智能终端是模型能力延伸的重要载体 [18] - 当前大部分产品仍依赖云端,存在延迟、隐私和安全问题,而端侧模型在实时性要求高的任务中不可或缺,价值在于本地即时处理与快速响应 [18] - 手机在大模型应用上仍有巨大空间,未来需提升其“输入”侧的环境感知与理解能力,但这在资源受限的终端上面临技术和工程挑战 [19] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键 [19] - 多模态/全模态能力是未来多智能体体系的基础,智能体之间的协同是必然选择 [19] - 通用人工智能的发展有两条主线:智能能力持续增强,以及智能的实现与使用不断高效化 [20] - 预计未来1-2年,模型的交互与专业能力将快速提升,具备更强自主学习能力;随后多智能体协同将成为重点;长远看模型将展现创新创造能力 [20] - 展望未来3-5年,每个人可能拥有一个在终端侧持续成长、越来越懂自己的大模型助手 [20]

9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆 - Reportify