端侧AI模型
搜索文档
AI能帮忙厨房看火了!面壁智能开源全模态模型MiniCPM-o4.5,边看边听还能主动抢答
量子位· 2026-02-04 20:31
文章核心观点 - 面壁智能开源的全模态模型MiniCPM-o4.5,实现了“边看、边听、主动说”的全双工实时交互,代表了AI从问答机向持续在场智能体的范式转变,是AI进入现实连续世界的关键分水岭[4][10][49] - 该模型是公司长期专注“端侧AI”战略路线的自然结果,其核心在于软硬一体、端侧原生,旨在打通端侧模型到应用的最后一公里,赋能汽车、手机、机器人等差异化终端和高价值长尾场景[51][56][64][66] 模型核心能力与特性 - **全双工实时交互**:模型采用全双工多模态实时流机制,可一边持续接收视频和音频输入,一边同步生成语音或文本输出,实现“边看、边听、边主动说”,打破了传统串行模型的I/O阻塞[10][33][35] - **即时自由对话**:模型在自身说话时也能听见并响应新插入的指令,支持即时自由对话与自然打断,改变了传统一问一答的交互模式[25][28][30] - **持续感知与主动响应**:模型以1Hz频率持续进行语义判断以决定是否介入回应,不再依赖检测静音的VAD机制,从而能基于对场景的持续理解主动发起提醒或评论[39][40][46] - **高性能表现**:在仅9B参数规模下,模型在全模态理解、视觉理解、文档解析、语音理解与生成、声音克隆等多个方向上,均达到了当前全模态模型的领先水平[42] 公司战略与商业模式 - **专注端侧AI路线**:公司自2022年8月成立起,在行业重心仍在云端时,便将方向押注在端侧AI模型上,其差异化在于“只做端,把端做到极致”[51][69][71] - **软硬一体协同**:公司与芯片厂商深度协同,芯片在设计阶段向模型侧开放以验证架构,模型研发也反向对硬件能力提出要求,形成软硬一体、双向奔赴的研发模式[53][58][59] - **端原生模型开发**:不将云端模型压缩后部署,而是在训练阶段就以端侧芯片为目标环境,开发“生来就能跑在端上”的模型[60] - **构建端侧生态**:通过配套推出AI Native的端侧智能开发板“松果派”,并实现模型在其上的开箱即用,旨在打通端侧模型到应用的最后一公里,赋能开发者与终端厂商[61][62][63] - **瞄准差异化市场**:公司认为端侧市场由大量差异化终端和长尾高价值场景构成,并非统一市场,关键是用尽可能少的参数实现尽可能强的能力,该市场可同时容纳多家创业公司[66][67][68] 技术架构与实现 - **流式处理机制**:通过将离线模态编码器与解码器升级为支持流式输入/输出的在线版本,并采用时分复用机制,在毫秒级时间线上对齐多模态输入与输出,实现高效流式处理[35][37] - **端到端全模态设计**:通过稠密特征将各模态编码器与解码器直接连接到大语言模型主干,使视觉、音频等模态在模型生成输出的同时仍能持续更新[39] - **语音建模创新**:语音侧采用文本与语音token交错建模,既支持全双工语音生成,也提升了长语音生成的稳定性[36] 应用场景与价值 - **场景适应性**:模型能力可自然延展至具身智能、车端或终端助手、复杂系统等场景,其价值在于持续运行、一直在场,在合适的时机接话或提醒,而非仅回答问题[44][45][48] - **硬件产品规划**:公司计划在年中发布首款AI硬件“松果派”,用于支持硬件场景的全栈开发,并已在智能座舱等方向落地,体现了软硬协同路线的具体实施[61]
井松智能:井松智能的产品化转型,优势在于成本效率和端侧AI模型全流程自我研发
证券日报· 2025-12-16 21:40
公司战略与产品转型 - 公司正在进行产品化转型 其核心优势在于成本效率和端侧AI模型全流程自我研发 [2] - 与市场上其他无人叉车不同 公司运用的是首个正在自主研发的端侧AI+物流园区到区外整个无人驾驶解决方案大模型 并使用国产芯片在端侧进行运用 [2] 技术方案与成本优势 - 该技术方案的部署让公司的无人AMR AGV产品能有效节省AI硬件采购成本 有效减少项目部署人员成本 [2] - 公司为客户交付标准化车辆及“一站式傻瓜式部署”解决方案 [2] 未来展望与销售预期 - 预计在未来随着产能逐步释放 公司将进一步大幅提升该类产品的销售比重 [2]
GG100 2025年度畅销旗舰手机:Apple iPhone 17 Pro
新浪财经· 2025-12-12 22:19
产品奖项与市场地位 - 苹果公司的iPhone 17 Pro荣获中关村在线2025年度百大优秀科技产品奖项Good Gear 100,被评为年度畅销旗舰手机 [1][4] - GG100大奖代表产品同时获得了专业编辑、专业机构、领域达人和消费者的一致认可,是2025年市场中的标杆产品 [4][5] 核心硬件与技术升级 - 核心搭载采用改良3nm工艺的A19 Pro芯片,其最大的工程突破在于首次引入VC均热板散热系统,有效缓解了前代机型在长时间高负载下的降频与发热问题 [3][4] - 整机标配12GB内存,提升了多任务处理能力,并为端侧AI模型的流畅运行构筑了算力基础 [3][4] - 公司产品在性能释放与全链路影像方面达到彻底成熟,被评价为修补了所有短板的“完全体”旗舰 [3][5] 影像系统与屏幕显示 - 影像系统是本次升级的重头戏,iPhone 17 Pro正式迈入“全4800万像素”时代 [3][5] - 全新的4800万像素长焦镜头支持5x光学变焦,配合4800万像素主摄与超广角,彻底消除了不同焦段间的画质割裂感,为后期裁切提供了巨大的冗余空间 [3][5] - 屏幕采用新的抗反射涂层配合ProMotion技术,在强光下的可视性与色彩通透度均有显著提升 [3][5] 目标用户群体 - 主要用户群体集中在对性能稳定性、影像可靠性和长期使用体验有明确需求的消费者 [3][5] - 具体包括内容创作者、移动办公人群以及依赖手机处理多场景任务的用户 [3][5] - 同时也适合追求生态联动效率的苹果设备既有用户,能够在跨设备协作和系统一致性方面获得更高的使用价值 [3][5]
95后“AI才女”罗福莉,宣布加入小米!曾被雷军千万元年薪挖角,是DeepSeek关键开发者!她出身农村普通家庭,“是家族骄傲”
每日经济新闻· 2025-11-12 15:58
公司核心人事动态 - 95后AI研究员罗福莉通过朋友圈官宣加入小米,致力于构建从语言迈向物理世界的AGI未来 [1][4] - 罗福莉是开源大模型DeepSeek-V2的关键开发者之一,此前小米创始人雷军曾试图以千万元年薪招揽其领导公司AI大模型团队 [5][6] - 今年10月,小米AI团队与北京大学联合发布的论文中已出现罗福莉的名字,预示其以新身份正式对外露面 [8] 公司AI战略与投入 - 公司正在积极搭建自己的GPU万卡集群以加大对AI大模型的投入力度,该计划已实施数月,雷军在其中扮演重要领导角色 [6] - 公司大模型团队在成立之初已拥有6500张GPU资源,万卡集群的搭建将进一步提升其在AI大模型领域的研发实力 [6] - 公司的核心战略是“人车家全生态”,汽车是重要节点,通过不同场景和终端的互联互通,汽车可调用整个生态的AI算力 [7][8] 公司业务与财务表现 - 2025年第二季度,公司智能电动汽车及AI等创新业务分部收入为人民币213亿元,其中智能电动汽车收入为人民币206亿元 [8] - 2025年第二季度,该分部毛利率为26.4%,经营亏损为人民币3亿元 [8] - 在人事官宣当日,公司股价上涨1.86%,总市值达到1.14万亿港元 [8] 行业趋势与应用前景 - AI大模型被视为智能网联汽车的未来趋势,蕴藏巨大创新机遇 [7] - 端侧AI模型无需联网,可整合车内外多传感器信号,实现拟人化语音控车和自定义手势控制,且本地算力调用可保障数据隐私安全 [7][8]