9B 模型“平替”GPT-4o ？！面壁赌对OpenClaw端侧AI，内部上演一人月产65万行代码的效率核爆

公司战略与市场定位 - 公司于2023年行业“百模大战”时，战略转向专注于端侧大模型，此决策初期受市场质疑，直至次年苹果入局端侧才验证其判断 [2] - 公司当前战略清晰，正全力推进端侧布局，包括发布支持“即时自由对话”的大模型以及计划在年中发布首款AI硬件“松果派”以支持硬件场景全栈开发 [2] - 公司核心理念是“知识密度定律”，认为大模型知识密度约每100天提升一倍，导致模型保鲜期短，因此核心竞争力在于构建能持续产出高知识密度模型的系统，而非单一模型 [14] - 作为创业公司，公司认为端侧市场分散、长尾且场景多样，并非统一市场，这为创业公司提供了切入细分领域、避免与大厂直接阵地战的机会 [15] - 公司定位为连接芯片厂商、终端厂商和开发者的重要媒介，2025年发力重点之一是建设开发者生态 [10] 核心产品与技术突破 - 公司于2024年2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5，参数规模为9B [3][25] - MiniCPM-o 4.5是原生全双工的全模态模型，实现了“边看、边听、主动说”的端到端能力，支持即时自由对话，交互方式高度拟人，看、听、说并行不阻塞 [3][4] - 该模型两大核心创新为：1) 全双工机制，多模态输入输出互不阻塞；2) 全模态自主交互机制，模型可自主判断语义成熟度以触发输出 [4] - 技术挑战在于将图像、语音、指令等多种能力统一训练至单一模型，需精细把握训练动态以避免知识冲突，最终在保持文本和指令能力的同时实现了SOTA级全模态表现 [4][5] - 模型通过架构优化实现低延迟，采用“主干模型+轻量级语音生成模块”设计，并依赖高效推理框架llama.cpp-omni，降低了计算开销 [7][10] - 模型当前记忆时长约1分钟，为推理最佳“舒适区” [7] 开发者生态与硬件布局 - 2025年上半年在深圳的调研显示，当地涉及端侧模型的AI硬件项目中，超过一半在使用公司的MiniCPM模型 [11] - 公司推出首款AI原生端侧智能开发板“松果派”，旨在降低开发者在多模态设备上运行、微调和对齐模型的难度，构建软硬一体、全栈覆盖的端侧AI软件体系 [11][13] - 松果派基于NVIDIA Jetson系列模组打造，内置多模态硬件组件，计划于2025年年中量产上市，初期不以盈利为目的，主要承担市场教育功能 [13] - 公司硬件由合作伙伴设计，自身负责整合应用，核心仍聚焦于端侧原生模型的研发，通过商业化落地验证模型能力并建立数据飞轮 [13] 运营效率与组织文化 - 公司内部推行AI原生计划，不到200人的团队在10个月内完成2000万行代码，按传统方式估算需700人完成 [16] - 其中一位核心员工在一个月内编写了65万行代码，通过将核心系统接入AI并重构，大幅提升效率 [16] - 公司内部出现“一人公司”趋势，小团队或个人可完成过去需团队数月完成的工作 [17] - 公司对“AI Native”的定义是：接到任务首先考虑用AI完成，并追求比人工完成得更好，AI已深刻影响其思维方式和工作模式 [17] - 公司招聘注重吸引“AI原生人才”，要求员工具备利用AI作为内在工具发现、解决问题并判断结果质量的能力 [17] 行业趋势与未来展望 - 公司判断端侧与云端的协同将是未来长期主流形态，智能终端是模型能力延伸的重要载体 [18] - 当前大部分产品仍依赖云端，存在延迟、隐私和安全问题，而端侧模型在实时性要求高的任务中不可或缺，价值在于本地即时处理与快速响应 [18] - 手机在大模型应用上仍有巨大空间，未来需提升其“输入”侧的环境感知与理解能力，但这在资源受限的终端上面临技术和工程挑战 [19] - 在具身智能领域，多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键 [19] - 多模态/全模态能力是未来多智能体体系的基础，智能体之间的协同是必然选择 [19] - 通用人工智能的发展有两条主线：智能能力持续增强，以及智能的实现与使用不断高效化 [20] - 预计未来1-2年，模型的交互与专业能力将快速提升，具备更强自主学习能力；随后多智能体协同将成为重点；长远看模型将展现创新创造能力 [20] - 展望未来3-5年，每个人可能拥有一个在终端侧持续成长、越来越懂自己的大模型助手 [20]