面壁小钢炮

搜索文档
面壁小钢炮4.0发布:性能比肩 Qwen-3-8B,极限220倍提速
新浪科技· 2025-06-10 17:37
新浪科技讯 6月10日下午消息,近日,面壁智能第四代"面壁小钢炮" MiniCPM4.0 端侧模型(代号"前进 四")发布。据悉,第四代小钢炮拥有 8B 、0.5B两种参数规模,实现了同级最佳的模型性能。可让长 文本、深思考在端侧真正跑起来,实现220倍极限加速。 据悉,MiniCPM 4.0 模型采用的InfLLMv2稀疏注意力架构改变了传统 Transformer 模型的相关性计算方 式,有效摆脱了逐字重复计算的低效,将稀疏度从行业普遍的40%-50%,降至极致的5%,注意力层仅 需1/10的计算量即可完成长文本计算。且对算子底层重写,进一步加速提升,并使得对文本相关性精准 性大大提升。 值得一提的是,DeepSeek 使用的长文本处理架构NSA(Native Sparse Attention)也引用并采用了与 InfLLM相同的分块注意力计算思路,但其对于短文本的推理较慢,InfLLMv2则很好地解决了NSA在短 文本推理上的短板。 在缓存消耗上,MiniCPM 4.0-8B在 128K 长文本场景下相较于Qwen3-8B仅需 1/4 的缓存存储空间。在速 度、性能飙升的同时,又做到了模型极致压缩,让端 ...
面壁小钢炮4.0原生稀疏模型发布:最高220倍提速,开启端侧长文本时代
IPO早知道· 2025-06-10 10:39
模型发布与性能突破 - 面壁智能在2025智源大会上发布新一代端侧模型MiniCPM4.0,包括8B稀疏闪电版和0.5B版本,实现端侧性能创新式跃升[2] - 第四代小钢炮推出首个原生稀疏模型,5%极高稀疏度结合系统级创新技术,实现端侧长文本高效运行,宣告端侧长文本时代到来[2] - MiniCPM 4-8B采用新一代上下文稀疏高效架构,长文本推理速度实现5倍常规加速和最高220倍加速(显存受限场景)[4] 技术参数与性能表现 - MiniCPM 4.0推出8B和0.5B两种参数规模组合,延续"以小博大"特性,实现同级最佳性能[4] - MiniCPM 4.0-8B在MMLU等基准测试中以22%训练开销比肩Qwen-3-8B,超越Gemma-3-12B[4] - MiniCPM 4.0-0.5B以2.7%训练开销实现比Qwen-3-0.6B更优性能,参数减半性能翻倍,推理速度达600 Token/s[4] 存储优化与适配能力 - MiniCPM 4.0在128K长文本场景下仅需Qwen3-8B 1/4的缓存空间,量化版实现90%模型瘦身[5] - 模型已适配Intel、高通、MTK、华为昇腾等主流芯片,可在vLLM、SGLang等开源框架部署[6] - 加强MCP支持,性能超过同尺寸开源模型,拓展模型开发和应用潜力[6] 应用场景与市场表现 - 基于8B版本微调出MCP Client和MiniCPM4-Surve研究报告工具[6] - MiniCPM系列全平台累计下载量突破1000万[8] - 公司将持续基于"大模型密度定律Densing Law"提高知识密度与智能水平,推动端侧智能产业化[8]
中信证券:中国权益资产正迎来年度级别牛市!茅台基金,参投这家AI公司;内控及管理不到位,光大证券领罚单… | 私募透视镜
搜狐财经· 2025-05-29 20:18
热点聚焦 中信证券:中国权益资产正迎来年度级别牛市! 5月28日,中信证券2025年资本市场论坛在上海举行。论坛上,中信证券宏观与政策首席分析师杨帆、中信证券首席A股策略分析师裘翔等发表了对于宏观 和策略等最新观点。 杨帆认为,长期来看,全球产业格局迎来深刻重塑,支撑美元体系的长期根基已出现松动,全球资产的"再平衡"趋势可能延续。2025年正迎来"十五五"经济 社会发展规划制定,将引领我国产业迈向更高质量的发展。其中在产业政策方面,今年未来产业的重点领域或是6G、具身智能和人工智能等,后续创设国 家级引导基金、落地债市科技板、加大基础研究财政支出等政策或渐次落地,以持续构建未来产业投入增长机制。 市场策略方面,裘翔认为,展望未来一年,中国权益资产正迎来年度级别牛市。从2025年四季度开始,全球主要经济体在经济和政策周期上预计再次同步, 财政和货币同时扩张,港股和A股市场将望迎来指数牛市,风格上也会发生2021年以来的重大切换,从持续4年的中小票题材轮动,转向核心资产的趋势性 行情。配置上,裘翔建议聚焦三个长期趋势带来的三个行业变化:一是中国自主科技能力的提升趋势;二是欧洲提升能源、基建和资源储备的趋势;三是中 ...
VC/PE周报:腾讯领投智元机器人;茅台基金出手投大模型公司
每日经济新闻· 2025-05-26 19:27
凯德投资人民币母基金将通过一系列子基金,重点投向具备稳定现金流和长期增值潜力的优质资产。子 基金的投资范畴涵盖中国一线及强二线城市的产业园区、购物中心、租赁住房及服务公寓等资产类别。 未来,子基金还将涉足数据中心、物流园和办公楼等其他领域的特殊机会投资。 每经记者|姚亚楠 每经编辑|彭水萍 上周,多家机构宣布设立基金、募资进展:凯德投资在中国设立其首只在岸母基金;祥峰投资募资5亿 元;FA机构光源资本设立创新前沿孵化基金并完成首期募资;港投公司也宣布与多家VC合作成立基 金。 在投资市场,产业资本持续活跃并看好AI,茅台基金出手投资大模型公司;腾讯领投智元机器人。 凯德投资联合头部险资在华设立首只境内母基金 近日,凯德投资在中国设立其首只在岸母基金——凯德投资人民币母基金,总股本承诺额为50亿元人民 币,已引入国内知名保险机构作为母基金主要投资者。母基金完成投资后,预计将为凯德投资的基金资 产管理规模贡献200亿元人民币。 点评:其投资方向反映出外资与险资共同看好中国优质不动产的长期稳定收益潜力。此次合作既体现了 险资对另类资产配置的需求增长,也展现了凯德依托本土化运营经验深化中国市场布局的战略意图。 祥峰投 ...
「AI新世代」茅台基金参投!面壁智能完成新一轮数亿元融资,大模型“吸金”几家欢喜几家愁
华夏时报· 2025-05-22 22:46
当年初DeepSeek以黑马姿态走出技术新路,曾经高举"颠覆GPT"旗帜的创业公司们才发现手中吸引资本的筹码已 悄然改变。今年以来,曾经风光无限的"AI六小虎"多数陷入融资静默,只有智谱风光无限地拿下多轮融资,近 日,面壁智能也官宣了一笔数亿元的新融资,投资名单上还出现了茅台基金。这场资本风向的转变,正在重新划 分AI创业的生存边界。 至于今年在其他领域有哪些布局,《华夏时报》记者采访了面壁智能方面,截至发稿对方未给出回复。 自2022年8月成立以来,面壁智能一共公开过四次融资信息,在最新一轮融资之前,2023年4月,面壁智能完成天 使轮融资,由知乎领投,智谱为跟投方;2024年4月,面壁智能完成数亿元的一轮融资,由春华创投领投,北京市 人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持;2024年12月,面壁智能宣布完成又一轮数亿元 融资,此次融资由龙芯创投、鼎晖百孚、中关村科学城基金和赛富投资基金联合领投,北京市人工智能产业投资 基金与清科创投跟投。 和股东智谱一样,面壁智能同样出身清华系,其创始团队来自于清华大学计算机系自然语言处理与社会人文计算 实验室(TsinghuaNLP),联合创始人、CE ...
速递|逆势狂奔!面壁智能再获数亿元融资,端侧大模型成资本新宠
搜狐财经· 2025-05-21 19:27
2024 年 4 月: 领投方:春华创投;跟投方:北京市人工智能产业投资基金、知乎(战略股东持续跟投) 用途:加速端侧大模型研发,探索智能座舱等场景落地。 图片来源:面壁智能 根据公开信息报道,面壁智能已完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。在 13 个月内连续完成 3 轮数 亿元融资,面壁智能成为国内大模型领域融资节奏最快的企业之一。 对于新一轮融资,面壁智能联合创始人、CEO 李大海表示,"如今,大模型已经进入行业赋能的加速时刻,需要我们对技术、市场具备更加前沿性的判 断,并为大模型行业赋能提供充足的供给。一直以来,面壁以打造高效大模型为目标,在模型关键指标上,屡屡做到越级领先。 本次融资后,我们将能够进一步加深面壁的壁垒,并持续推动大模型商业化进程,为 AGI 时代的到来贡献力量。" 三轮融资概览 投资方:洪泰基金、国中资本、清控金信、茅台基金 用途:构建"端侧大脑" 技术壁垒,推进千行百业规模化应用,尤其是智能座舱量产和垂直领域 AI 工具开发 相比于模型参数越做越大的诸多大模型公司,面壁智能以"知识密度"替代参数堆砌,聚焦端侧模型研发;专注于打造同等参数下性 ...
端侧大模型加速破圈!面壁智能获新一轮数亿元融资
机器人圈· 2025-05-21 17:40
面壁智能融资动态 - 公司近期完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 资金将用于构筑高效大模型技术壁垒和加速行业生态拓展 [1] - 2024年累计完成三笔数亿元级融资 4月由春华创投领投 12月由龙芯创投、鼎晖百孚等联合领投 北京市人工智能产业投资基金持续跟投 [1] 端侧大模型技术突破 - 公司定位高效低耗大模型研发 2025年1月发布全球首个端侧全模态模型MiniCPM-o 2.6 具备实时多模态交互能力 技术指标达国际领先水平 [2] - MiniCPM系列实现端侧ChatGPT/GPT-4V/GPT-4o功能 获2024年Hugging Face最多下载中国大模型称号 全平台累计下载量突破1000万次 [2] 机器人行业动态 - 2024年机器人上市公司年报显示行业分化加剧 部分企业业绩承压 但AI技术融合带来新机遇 [5] - 人形机器人领域呈现爆发态势 量产推进引发价格战 越疆科技港股上市后市值增长三倍 [5] - 学术研究取得多项进展 包括微纳感知赋能具身智能、仿生机器人地形适应技术等 [5][6] 人工智能前沿研究 - 院士专家提出行为智能与产品智能双驱动模型 强调机构智能技术对变形机器人落地的关键作用 [6] - 机器人创新设计聚焦六大关键技术 智能制造协同成为产业新动能 [6]
面壁智能完成新一轮数亿元融资 重点布局端侧大模型
中国经营报· 2025-05-21 16:16
融资动态 - 面壁智能完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 [1] - 公司自2024年以来已完成三轮融资 上一轮融资于2024年12月完成 规模同样为数亿元 [1] - CEO表示本轮融资将加深技术壁垒并推动大模型商业化进程 [1] 公司背景 - 公司创立于2022年8月 由清华大学NLP实验室孵化 联合创始人包括清华大学计算机系副教授刘知远 [1] - 采用"以小博大"策略 通过低成本、小参数实现高效率 区别于行业主流做大参数的路径 [2] - 较早明确"端侧大模型"战略方向 专注终端设备本地运行的AI模型 [2] 行业趋势 - 端侧大模型成为AI行业新增长引擎 预计2025年加速渗透消费电子和工业领域 [3] - 中国端侧AI市场规模预计从2023年千亿级增长至2028年1.9万亿元 [4] - 行业出现路径分化 部分企业转向垂直领域如医疗AI或B端服务 [2] 技术特点 - 端侧大模型通过轻量化技术压缩参数 实现设备端独立计算 解决云端部署的延迟和隐私问题 [2][4] - 推出80亿参数的全模态模型MiniCPM-o 2.6 具备图像理解、语音和多模态交互能力 [5] - 投资方认为端侧最能体现高知识密度 未来人机交互将向多模态融合发展 [3] 商业化进展 - MiniCPM系列平台累计下载量突破1000万 [5] - 在汽车领域与长安马自达等车企合作 首款量产车型MAZDA EZ-60已上市 [5][6] - 司法领域落地全国首个审判垂直领域大模型 辅助立案29.1万件 生成文书1.16万份 [6] - 教育领域与清华合作推出AI学生成长助手"清小搭" [6]
面壁智能获新一轮数亿元融资:端侧大模型技术与商业化持续突破
格隆汇· 2025-05-21 13:19
融资情况 - 公司成功完成新一轮数亿元融资,由洪泰基金、国中资本、清控金信和茅台基金联合投资[1] - 2024年起已完成三轮数亿元级别融资:2024年4月由春华创投领投,2024年12月由龙芯创投等联合领投,2025年5月完成最新一轮融资[1] - 公司成为市场上极少数能持续顺利融资的企业,彰显市场对其"端侧路线"战略的高度认可[1] 商业化进展 - 在汽车行业加速落地,发布全球首个车端纯端侧智能助手"小钢炮超级助手cpmGO",实现本地处理语音、视觉、车控推理[2] - 2025年4月与长安马自达合作推出MAZDA EZ-60车型,标志端侧大模型在汽车座舱领域商业化进入新阶段[2] - 已与长安汽车、上汽大众、长城汽车等头部车企达成多款车型定点合作,并与高通、英特尔等产业链企业深度协同[2] 垂直领域应用 - 法律领域参与最高人民法院"法信法律基座大模型"研发,助力深圳中院上线"司法审判垂直大模型",试运行以来辅助立案29.1万件、生成文书初稿1.16万份[3] - 教育领域与清华大学合作推出AI伴学助手"清小搭",学生结业率超40%,为传统MOOC的10倍,计划推广"全自动课堂MAIC"模式[3] 技术研发 - MiniCPM系列模型表现突出:MiniCPM-o 2.6以80亿参数实现全模态实时交互,MiniCPM-V 2.6以80亿参数实现200亿参数以下多模态理解能力领先[4] - MiniCPM系列平台累计下载量突破1000万次,在Hugging Face平台获"最多下载、最受欢迎中国大模型"称号[4] - 公司端侧模型在图像理解、语音处理等领域达到国际领先水平,推动端侧智能技术发展[4]
深耕端侧AI:面壁智能融资成功,加速大模型商业化
经济观察报· 2025-05-21 11:28
公司融资与资本认可 - 面壁智能于2025年5月21日完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 资金将用于构筑高效大模型技术壁垒和加速行业赋能 [1] - 2024年至今公司已完成三轮融资 包括2024年4月由春华创投领投的数亿元融资 以及2024年12月由龙芯创投等联合领投的数亿元融资 显示资本市场持续看好其技术路线 [3][4] - 投资者认为公司"端侧路线"代表中国AI创新能力 洪泰基金强调端侧场景的高知识密度特性 国中资本认可其体现中国式创新的独特魅力 [4][5] 技术路线与产品进展 - 公司专注端侧AI差异化路线 主打轻量化、高性能、低成本的大模型 其"小钢炮超级助手cpmGO"是全球首个纯端侧车用智能助手 实现语音、视觉、车控本地化处理 [2] - 2024年1月发布的端侧全模态模型MiniCPM-o 2.6具备实时多模态能力 达到国际先进水平 MiniCPM系列全平台累计下载量突破1000万 [2] - 技术路径以"高效"为第一性原理 在同等参数下实现更优性能 其产品已成功复现ChatGPT、GPT-4V等功能 2024年在Hugging Face中国大模型中下载量领先 [2] 商业化与行业布局 - 公司在汽车行业取得突破性进展 推动端侧大模型在座舱领域商业化落地 并已布局手机、电脑等终端领域 [2][5] - 联合创始人李大海指出大模型进入行业赋能加速期 本轮融资将推动商业化进程 目标为AGI时代做准备 [1][5] - 投资者预期端侧AI将重构人机交互模式 从GUI转向VUIGUI 智能终端产业格局面临再分配 [4] 行业竞争格局 - 全球AI竞赛进入白热化阶段 DeepSeek的广泛应用标志行业加速变革 高效低耗路径成为创新方向 [1] - 公司端侧技术被市场视为中国AI创新能力的代表 其商业化进展成为大模型技术落地标杆 [1][4]