全模态能力
搜索文档
9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
新浪财经· 2026-02-04 20:20
公司战略与市场定位 - 公司于2023年行业“百模大战”时,战略转向专注于端侧大模型,此决策初期受市场质疑,直至次年苹果入局端侧才验证其判断 [2] - 公司当前战略清晰,正全力推进端侧布局,包括发布支持“即时自由对话”的大模型以及计划在年中发布首款AI硬件“松果派”以支持硬件场景全栈开发 [2] - 公司核心理念是“知识密度定律”,认为大模型知识密度约每100天提升一倍,导致模型保鲜期短,因此核心竞争力在于构建能持续产出高知识密度模型的系统,而非单一模型 [14] - 作为创业公司,公司认为端侧市场分散、长尾且场景多样,并非统一市场,这为创业公司提供了切入细分领域、避免与大厂直接阵地战的机会 [15] - 公司定位为连接芯片厂商、终端厂商和开发者的重要媒介,2025年发力重点之一是建设开发者生态 [10] 核心产品与技术突破 - 公司于2024年2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,参数规模为9B [3][25] - MiniCPM-o 4.5是原生全双工的全模态模型,实现了“边看、边听、主动说”的端到端能力,支持即时自由对话,交互方式高度拟人,看、听、说并行不阻塞 [3][4] - 该模型两大核心创新为:1) 全双工机制,多模态输入输出互不阻塞;2) 全模态自主交互机制,模型可自主判断语义成熟度以触发输出 [4] - 技术挑战在于将图像、语音、指令等多种能力统一训练至单一模型,需精细把握训练动态以避免知识冲突,最终在保持文本和指令能力的同时实现了SOTA级全模态表现 [4][5] - 模型通过架构优化实现低延迟,采用“主干模型+轻量级语音生成模块”设计,并依赖高效推理框架llama.cpp-omni,降低了计算开销 [7][10] - 模型当前记忆时长约1分钟,为推理最佳“舒适区” [7] 开发者生态与硬件布局 - 2025年上半年在深圳的调研显示,当地涉及端侧模型的AI硬件项目中,超过一半在使用公司的MiniCPM模型 [11] - 公司推出首款AI原生端侧智能开发板“松果派”,旨在降低开发者在多模态设备上运行、微调和对齐模型的难度,构建软硬一体、全栈覆盖的端侧AI软件体系 [11][13] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,计划于2025年年中量产上市,初期不以盈利为目的,主要承担市场教育功能 [13] - 公司硬件由合作伙伴设计,自身负责整合应用,核心仍聚焦于端侧原生模型的研发,通过商业化落地验证模型能力并建立数据飞轮 [13] 运营效率与组织文化 - 公司内部推行AI原生计划,不到200人的团队在10个月内完成2000万行代码,按传统方式估算需700人完成 [16] - 其中一位核心员工在一个月内编写了65万行代码,通过将核心系统接入AI并重构,大幅提升效率 [16] - 公司内部出现“一人公司”趋势,小团队或个人可完成过去需团队数月完成的工作 [17] - 公司对“AI Native”的定义是:接到任务首先考虑用AI完成,并追求比人工完成得更好,AI已深刻影响其思维方式和工作模式 [17] - 公司招聘注重吸引“AI原生人才”,要求员工具备利用AI作为内在工具发现、解决问题并判断结果质量的能力 [17] 行业趋势与未来展望 - 公司判断端侧与云端的协同将是未来长期主流形态,智能终端是模型能力延伸的重要载体 [18] - 当前大部分产品仍依赖云端,存在延迟、隐私和安全问题,而端侧模型在实时性要求高的任务中不可或缺,价值在于本地即时处理与快速响应 [18] - 手机在大模型应用上仍有巨大空间,未来需提升其“输入”侧的环境感知与理解能力,但这在资源受限的终端上面临技术和工程挑战 [19] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键 [19] - 多模态/全模态能力是未来多智能体体系的基础,智能体之间的协同是必然选择 [19] - 通用人工智能的发展有两条主线:智能能力持续增强,以及智能的实现与使用不断高效化 [20] - 预计未来1-2年,模型的交互与专业能力将快速提升,具备更强自主学习能力;随后多智能体协同将成为重点;长远看模型将展现创新创造能力 [20] - 展望未来3-5年,每个人可能拥有一个在终端侧持续成长、越来越懂自己的大模型助手 [20]
9B 模型“平替”GPT-4o ?!面壁赌对OpenClaw端侧AI,内部上演一人月产65万行代码的效率核爆
AI前线· 2026-02-04 18:53
公司战略与市场定位 - 公司在2023年百模大战期间,战略转向端侧大模型,此决策在次年因苹果入局而获得市场验证 [2] - 公司当前战略清晰,火力全开,发布可“即时自由对话”的大模型及首款AI硬件松果派(Pinea Pi),以支持硬件场景的全栈开发 [2] - 公司核心理念是“知识密度定律”,即大模型知识密度约每100天提升一倍,因此持续推出优秀模型是保持行业前沿的关键 [17][18] - 公司目标是打造一个能够持续训练出高知识密度大模型的系统,这被视为其最重要的产品和技术核心 [18] - 公司认为端侧市场分散、长尾且存在高价值场景,是创业公司更适合切入的领域,避免了与大厂在统一市场的直接竞争 [19] - 公司内部正推动“AI原生”计划,不到两百人的团队在十个月内写了2000万行代码,效率远超传统模式,并出现“一人公司”趋势 [20][21] 新产品与技术发布:MiniCPM-o 4.5模型 - 公司于2月4日正式发布并开源新一代全模态旗舰模型MiniCPM-o 4.5,该模型是原生全双工的全模态大模型 [3] - 模型新引入端到端的“边看、边听、主动说”全模态能力,支持即时、自由的对话交互,弱化了传统“一问一答”的轮次概念 [3] - 该模型的核心创新在于全双工机制和全模态自主交互机制,实现了多模态输入输出互不阻塞,并能自主判断输出时机 [5] - 模型将所有能力统一训练到一个9B参数的模型中,克服了多维度训练难度大、系统负担重及知识冲突等挑战 [5][6] - 模型在保持文本和指令跟随能力不受损甚至有小幅提升的同时,实现了更低的显存占用、更快的响应速度及最佳的推理效率 [6] - 模型侧的低延迟优化得益于全双工状态下无需外部工具判断推理时机,以及采用“大主干模型+轻量级语音生成模块”的架构 [9] - 模型当前记忆时长约为一分钟,是其推理的“舒适区”,未来若需全天候陪伴式使用,需在方法和机制上创新 [9] - 公司判断全双工、全模态的自主交互机制可能是未来新的学习与增长方式,并已在统一建模、高效泛化及理解生成一体化方面迈出关键一步 [11] 开发者生态与硬件布局:松果派 - 公司今年发力重点之一是开发者生态,计划通过生态建设让开发者共同推动模型部署,而非单纯依靠商业化 [13] - 公司在深圳调研发现,超过一半涉及端侧模型的AI硬件项目都在使用MiniCPM,这是其建设生态和提供硬件的根本原因 [13] - 公司发布首款AI原生端侧智能开发板“松果派”,旨在通过软硬一体工具降低多模态模型在设备上运行、微调和应用开发的难度 [14] - 松果派基于NVIDIA Jetson系列模组打造,内置多模态硬件组件,构建了软硬一体、全栈覆盖的端侧AI软件体系 [16] - 松果派计划在年中量产上市,但今年主要承担市场教育作用,目标是打通端侧模型到应用的“最后一公里”硬件 [16] - 硬件定价不以盈利为主要目的,初期采用成熟方案,后续将推出国产化及不同算力版本,并根据开发者反馈调整 [16] - 公司强调其核心是聚焦端侧原生模型研发,硬件由合作伙伴设计,公司负责整合应用 [16] 技术理念与行业洞察 - 公司认为端侧与云端的协同将是未来长期存在的主流形态,智能终端是大模型能力向用户延伸的重要载体 [23] - 端侧模型在实时性要求高的任务中不可或缺,其核心价值在于本地即时处理数据并快速响应,这是端云协同中端侧不可替代的意义 [23] - 手机在大模型应用上仍有巨大拓展空间,未来需提升“输入”侧能力,使其能直接感知和理解现实环境,实现更自然的交互 [24] - 在具身智能领域,多模态大模型被视为突破模型通用性与泛化能力瓶颈的关键,是跨场景、跨本体适应能力的基础 [25] - 多模态乃至全模态能力是未来多智能体体系的基础,智能体可抽象为输入、模型、输出三个核心要素,未来将围绕这三要素不断强化 [25] - 通用人工智能的发展有两条主线:一是智能能力持续增强,二是智能的实现与使用不断变得高效 [25] - 公司判断未来一两年内,模型的专精能力和与现实世界交互能力将快速提升,逐步具备自主学习和成长能力 [26] - 随后,多智能体协同将成为重要突破,长远来看,模型还将展现出创新与创造能力 [26] - 未来三到五年,每个人都将拥有一个持续成长、越来越懂自己的大模型助手 [26]