Workflow
MiniCPM
icon
搜索文档
(活力中国调研行)北京何以成为中国“人工智能第一城”?
环球网资讯· 2025-06-17 22:07
北京人工智能产业发展现状 - 2024年北京人工智能企业突破2400家,核心产业规模近3500亿元,均占全国一半 [1] - 北京拥有全国重点实验室21家,集聚了全国超40%的顶尖人才 [1] - 建设首批23家人工智能领域北京市重点实验室,聚焦大模型、具身智能、人工智能安全等方向 [1] - 建设4家人工智能领域新型研发机构,产出全球首个原生多模态大模型Emu等国际领先原创成果 [1] 政策支持与创新能力 - 北京出台具身智能三年行动计划、科技赋能文化专项行动、人工智能+新材料等产业政策 [2] - 产出全球首款光训练芯片等成果,夯实人工智能创新底座 [2] - 建设北京市人工智能算力互连技术创新中心,布局全国首款64卡超节点算力服务器 [2] - 备案上线大模型132款,全国第一,重点企业发布豆包、GLM、可灵、Vidu、MiniCPM等国内领先通用基础大模型 [2] 基础设施与数据资源 - 2024年新增算力8620P,累计智能算力规模超3.3万P [2] - 建设国内首个数据基础制度先行区,发布中文互联网语料库CCI4.0 [2] - 上线北京人工智能数据运营平台,汇聚通用、行业数据集180余个、数据总量超2000TB [2] 国际合作与生态建设 - 联合外交部举办北京首届国际人工智能研讨班,35个发展中国家代表参与 [3] - 成功举办2025年智源大会,线下注册观众8000多人,线上观看开幕式直播达205万人,覆盖全球超过30个国家和地区 [3] - 持续打造全球"开源之都",落实《全球人工智能治理倡议》 [4] 未来发展规划 - 前瞻布局具身智能、AI+生命健康、AI for Science等前沿交叉领域 [3] - 加快培育光计算芯片、类脑智能等颠覆性技术 [3] - 构建"一委一业、一区一品"应用发展格局,推进大模型产品落地应用 [3] - 加大市区两级人工智能产业基金直投力度,建设人工智能领域人才高地 [4]
面壁智能完成新一轮亿级融资
搜狐财经· 2025-05-21 10:37
融资动态 - 公司完成新一轮数亿元融资 由洪泰基金、国中资本、清控金信和茅台基金联合投资 [1] - 2024年以来已连续完成3轮融资 显示资本市场对其技术路线的高度认可 [1] 技术突破 - 2024年9月发布MiniCPM 3 0模型 4B参数性能超越GPT-3 5 [1] - 2024年8月发布MiniCPM-V 6模型 8B参数实现20B以下多模态理解3项SOTA 达到GPT-4V水平 [1] - 2025年1月发布MiniCPM-o 2 6模型 8B规模实现全模态实时交互 [1] - 形成全模态/多模态/基座模型完整矩阵 持续刷新端侧大模型能力边界 [1] 市场表现 - MiniCPM系列获评2024年Hugging Face"最多下载、最受欢迎中国大模型" [1] - 平台累计下载量突破1000万次 [1] 商业化落地 - 推出全球首个车端纯端侧智能助手"小钢炮超级助手cpmGO" [2] - 参与研发最高人民法院"法信法律基座大模型" [2] - 与清华大学合作推出AI学生成长助手"清小搭" 覆盖全校本科生 [2] 战略规划 - 本轮融资将用于构筑技术/产品壁垒 加速行业赋能与生态拓展 [2] - 推动"端侧大脑"在千行百业规模化应用 [2]
面壁CEO李大海:物理世界要实现AGI,一定是通过端侧智能 | 中国AIGC产业峰会
量子位· 2025-05-09 13:00
核心观点 - 未来物理世界实现AGI必须通过端侧智能,因为只有将智能部署在终端设备上才能实现最灵敏的感知、最及时的决策和最完美的应对 [1][8][30] - 大模型知识密度是智能的核心指标,知识密度越高智能越强,高知识密度模型在端侧最具价值 [8][18] - 端侧智能具有隐私保护、成本优势和全天候响应等独特优势,是未来智能设备发展的关键方向 [27][29][30] 公司发展历程 - 面壁智能2019年all in大模型,2022年8月正式成立,2023年9月发布首个千亿级GPT-3.5水平模型并获得网信办安全备案 [14] - 2023年底开始聚焦端侧智能,2024年1月发布全球首个端侧全模态8B模型,3月推出纯端侧模型驱动的面壁小钢炮超级助手产品 [19][22] - 目前端侧模型已在汽车、机器人、手机、智能可穿戴设备等多个场景落地 [3][31] 技术突破 - 提出"密度定律",发现大模型知识密度每3.3个月翻一番,知识密度与芯片制程类似,直接影响模型智能水平 [18] - 开发出全球首个端侧全模态8B模型,可在iPad上流畅运行,看听说能力达到GPT-4o水平 [19] - 面壁小钢炮超级助手具备端上不依赖网络的全天候指令响应和主动环境感知能力 [24][25] 行业认知 - DeepSeek成功源于三个"高密度":团队密度(顶尖人才聚集)、组织密度(目标高度一致)、高资源密度(充足研发投入) [10][11][12] - 端侧智能在汽车场景优势显著:不受网络限制、避免隐私泄露、降低带宽成本 [27] - GUI Agent产品通过端侧模型实现屏幕行为理解,保证用户隐私同时具备强泛化能力 [29] 产品布局 - MiniCPM模型已拓展至手机、具身智能、AIPC、智能可穿戴设备等主流场景 [3] - 面壁小钢炮超级助手率先在汽车场景落地,实现感知-决策-执行三位一体 [22][26] - 规划让每个设备都具备智能,包括离线的翻译机等新型智能终端 [32]
AI不靠“闭门造神”,海内外一线专家共探智能新纪元,GOSIM AI Paris 2025圆满收官!
AI科技大本营· 2025-05-08 08:23
开源与AI融合趋势 - 开源和开放标准正逐步成为推动人工智能发展的核心力量,企业和用户越来越需要透明、安全且可信的系统[5] - Linux基金会正在推动一项专为AI模型设计的新型许可证OpenMDW,涵盖模型架构、数据集、参数、文档与工具[7] - 开源AI的成功不仅源于代码本身,更来自于一个中立、开放且富有活力的社区[5] 大模型技术发展趋势 - 多模态统一架构成为重要方向,Meta的BLT架构展示了这一方向的可行性,2025年有望诞生具突破性的统一模型[3] - 高效注意力机制快速发展,包括线性注意力、动态稀疏注意力和混合注意力等[3] - 二阶优化正逐步应用于大规模训练场景,未来将在提升训练效率和模型泛化能力方面扮演关键角色[3] - 后训练阶段成为关键环节,在特定任务优化中发挥越来越重要的作用[6] AI基础设施演进 - Docker Model Runner可实现本地化GPU推理,加速AI应用落地[12] - Kubetorch在ML模型执行与部署流程中展现高效性与可调试性[12] - RAGFlow通过开源手段解决数据质量差、语义匹配低等难题,提升企业级RAG系统表现[13] - WGML基于Rust与WebGPU构建轻量化、高性能的GPU推理框架[13] AI应用与智能体发展 - OAKS架构以知识图谱和AI记忆系统为核心,强调开放式生态对智能体成长的意义[16] - OpenManus通过增强推理规划和跨环境运行能力,为LLM智能体应用拓展新可能性[16] - CAMEL框架深入研究智能体社群行为与协作机制[17] - Agentic Search为智能体的信息获取与决策提供新思路[17] 具身智能前沿进展 - Unitree开源G1类人机器人的运行数据集,支持多种开源解决方案[19] - 将语言模型接入机器人,通过手势、声音与表情实现人工共情[20] - 新型数据采集框架支持跨任务、跨环境的机器人泛化学习[20] - "大脑-小脑协同"框架融合高层认知推理与快速低延迟运动响应[20] 开源模型实践案例 - Qwen系列模型在多语言理解与生成任务中实现能力突破[9] - LUCIE-7B模型实现从训练代码到数据集全开放[10] - MiniCPM展示小模型在效率和性能上的平衡优势[10] - Llama 4在具身智能场景中展现自主决策与人机协作潜力[28] PyTorch生态创新 - TorchCodec优化解码流程,使视频和音频数据高效转换为PyTorch张量[27] - vLLM扩展大语言模型推理,借助多加速器部署与量化技术提升性能[27] - DeepSpeed在极大规模模型训练的计算、通信和I/O优化方面发挥作用[30] - Lightning Thunder将PyTorch代码编译为优化的分布式代码[30]