寒武纪AI芯片
搜索文档
十篇论文,揭秘寒武纪AI芯片崛起之路
半导体行业观察· 2025-10-23 09:01
文章核心观点 - 寒武纪的崛起是一条典型的"硬核"技术路线,其发展脉络和战略抉择均清晰地体现在其从2014年至2025年间公开发表的十篇关键学术论文中 [5] - 公司从最初探索专用硬件加速器可行性,逐步进化到构建指令集、优化稀疏计算、设计专为AI训练的新架构,最终实现对新兴AI应用(如神经场景表征)的算法与硬件深度协同优化 [5][26][36][57][59] - 公司的核心竞争力源于其深厚的学术底蕴和对计算架构的颠覆性创新,其技术演进展示了从学术研究到商业产品,再到构建独立生态的完整路径 [5][7][37] 奠基时代:"DianNao"系列的一鸣惊人 - 寒武纪的诞生源于陈云霁与陈天石兄弟在中科院计算所的学术研究,他们拥有深厚的处理器设计学术背景 [7] - "DianNao"系列是全球最早、最系统化的深度学习处理器架构研究之一,开创性地提出针对神经网络的专用硬件加速器,通过软硬件协同设计实现性能和能效的数量级提升 [7] - 2014年的"DianNao"论文验证了专用硬件加速器路线的可行性,该加速器在3.02平方毫米面积、485毫瓦功耗下实现452 GOP/s性能,比128位2GHz SIMD处理器快117.87倍,能耗降低21.08倍 [11][12] - 同年的"DaDianNao"面向数据中心,采用多芯片设计,在64芯片系统中相比GPU实现450.65倍加速,能耗降低150.31倍,是后续云端芯片思想的雏形 [14] - 2015年的"PuDianNao"扩展了加速器的通用性,支持K-Means、SVM等七种机器学习算法,在65纳米工艺下比NVIDIA K20M GPU能效提高128.41倍,体现了对算法快速迭代的适应性思考 [17][19][20] - 2015年的"ShiDianNao"专为视觉应用设计,将计算单元靠近传感器以消除DRAM访问,能效比当时最先进的神经网络加速器高60倍,为终端AI芯片设计埋下伏笔 [24][25] 商业化序章:从指令集到IP核的进化 - 公司正式成立后,意识到构建生态的重要性,核心举措是提出了首个专门针对深度学习的指令集"Cambricon ISA",实现了上层应用与底层硬件的解耦 [26] - 2016年的"Cambricon"指令集论文是公司的"立司之本",该指令集综合了标量、向量、矩阵等指令,比x86、MIPS等通用指令集代码密度更高,基于该指令集的加速器能灵活覆盖10种不同的神经网络 [27][29][30] - 同年的"Cambricon-X"论文专注于稀疏神经网络加速,通过硬件优化利用模型稀疏性,平均比当时最先进的神经网络加速器实现7.23倍加速和6.43倍节能,进入精细化场景优化阶段 [31][34][35] 转型生态构建:软硬件一体化的产品矩阵 - 2017年公司迎来关键商业突破,其Cambricon-1A处理器被集成于华为麒麟970芯片,成为全球首款搭载独立AI单元的手机SoC [37] - 2019年后,面对重要客户转向自研,公司加速自有品牌"思元"云端芯片迭代,并大力投入NeuWare全栈软件平台建设,以构建独立生态 [37] - 2019年的"Cambricon-F"提出专为AI计算的"分形冯诺依曼架构",通过同构多层设计显著提高编程生产力,其实例相比GPU性能提升最高5.14倍,能效平均提升11.39倍 [38][41][42][43] - 2021年的"Cambricon-Q"是针对高效量化训练的定制混合架构,结合ASIC和近数据处理引擎,在DNN训练中相比GPU能效提升6.41倍,性能提升4.20倍,且精度损失不超过0.4% [44][47][48] - 2024年的"Cambricon-C"针对4位低精度计算,提出将矩阵乘法"原始化"为计数操作的新范式,能效比传统脉动阵列提升1.95倍,为超低精度LLM时代提供了颠覆性解决方案 [50][52][53] - 2025年的"Cambricon-SR"展示了算法与硬件的深度协同,通过新型稀疏编码表算法和定制硬件,在神经场景表征训练中相比A100 GPU实现1259倍加速和1139倍能耗降低 [54][56][57]
智谱正式发布并开源新一代大模型GLM-4.6 寒武纪、摩尔线程完成适配
每日经济新闻· 2025-09-30 15:42
公司产品发布 - 智谱公司于9月30日正式发布并开源新一代大模型GLM-4-6 [1] - GLM-4-6在Agentic Coding(代理式编码)等核心能力上实现大幅跃升 [1] 技术合作与适配 - GLM-4-6已在寒武纪AI芯片上实现FP8+Int4混合量化推理部署,为首次在国产芯片上投产的FP8+Int4模型—芯片一体化解决方案 [1] - 该方案在保持模型精度不变的前提下大幅降低了推理成本 [1] - 摩尔线程基于vLLM推理框架完成了对GLM-4-6的适配,其新一代GPU可在原生FP8精度下稳定运行模型 [1] - 摩尔线程的MUSA架构及全功能GPU在生态兼容性和快速适配能力方面得到验证 [1] 行业生态意义 - 寒武纪与摩尔线程完成对GLM-4-6的适配,标志着国产GPU已具备与前沿大模型协同迭代的能力 [1] - 此次合作加速了构建自主可控的AI技术生态的进程 [1] - GLM-4-6搭配国产芯片的组合将率先通过智谱MaaS平台面向企业与公众提供服务 [1]
又一家科技企业「砸钱」搞激励,追觅单月发近4000万奖金,多名员工获6位数奖励;某车企暂停自研电池并裁员;京东官宣进军团播
雷峰网· 2025-08-27 08:34
华为汽车技术 - 余承东在发布会上强调华为汽车稳定性优于某些玩漂移的竞品 暗示其底盘技术领先[2] - 华为自主研发iDVP平台实现传感器分层解耦 途灵平台感知协同件数量达传统底盘三倍[2] - 余承东曾称部分车企产品不符合华为质量标准却仍在海量发货 并提及"看完一身冷汗"[3] 追觅科技激励机制 - 公司6月发放额外奖金超2200万元 7月奖金近4000万元[3][4] - 过去三个月有3个团队获百万奖金 多名员工个人获6位数奖励[4] - 截至Q2季度26支团队瓜分888万现金 75位员工获"直升机奖"人均月薪加1.2万元[4] - 员工数量2024年超4500人 2025年近7000人 2024年营收达150亿元(海外超80亿元) 估值200亿元[4] 京东直播创新 - 七夕期间试水团播模式 采用男团女团PK形式探索直播带货[7] - 2024年网络表演行业营收规模达2126.4亿元 预计2025年团播市场规模达150亿元 团播间数量达5000-7000个[7] - 此次试水与全球购业务"百亿千品新增长计划"相关 显示对跨境电商重视[7] 360财务表现 - 2025年上半年营收38.27亿元 较上年同期36.92亿元增长3.67% 结束持续下滑态势[11] - 互联网广告及服务收入21亿元 智能硬件收入3.53亿元 互联网增值服务收入9亿元 安全业务收入2.54亿元[11] - 研发费用15.65亿元 占营业收入比例40.89%[11] 寒武纪市值表现 - 截至8月25日收盘股价1384.93元/股 单日涨幅11.40% 5日涨幅超45% 市值达5794亿元[14] - 创始人陈天石持有29.63%股份 市值1541亿元 成为南昌首富[14][15] - 公司从创立到IPO用时不到五年 发行价64.39元/股对应市值257.62亿元[15] 保时捷电池战略调整 - 暂停自主研发高性能电动车电池项目 因市场增长低于预期及缺乏经济可行性[23] - Cellforce部门将缩减运营规模 预计裁员约200人(原部门约300人) 剩余员工或转至大众PowerCo[23] - 原计划德国工厂年产能1吉瓦时(供1万辆Taycan) 现计划搁置[23] 特斯拉法律纠纷 - 拒绝6000万美元和解方案后 被判赔2.425亿美元(约17.4亿元人民币)[24] - 陪审团认定特斯拉在2019年致命车祸中承担1/3责任 需支付1.29亿美元补偿性赔偿及2亿美元惩罚性赔偿[24][25] - 事故原因系Autopilot在不适用路段被激活且未充分警示驾驶员分心[25] 人机交互设备竞争 - vivo进军MR领域 荣耀研发MR设备 小米推出首款AI眼镜 华为/OPPO涉足AR/AI眼镜[22] - 苹果MR头显曾销量遇冷且停产 小米AI眼镜遭遇退货潮[22] - 手机行业布局新赛道反映增长焦虑 旨在抢占人机交互下半场机遇[22] OpenAI市场扩张 - 向印度教师学生免费发放50万个ChatGPT Plus账号 为迄今最大教育举措[26] - 推出印度专属订阅套餐月费399卢比 支持UPI支付[27] - 与印度电子和信息技术部合作启动OpenAI Academy 向50家初创企业提供10万美元API credits支持[27] - 全球3亿月活用户中印度学生占比显著 新德里办公室将于年内启用[26][27] 百度AI产品动态 - 正式上线AI搜索应用"梯子AI" 主打无广告智能搜索 整合多模型能力[21] - 考虑发行点心债融资约40亿元人民币(5.59亿美元) 最终规模不超45亿元 含3.5年期债券[21] 腾讯光子工作室扩张 - 日本大阪开设第二分部 由卡普空30年老将伊津野英昭领衔[22] - 约40名员工中三分之一来自卡普空 含多位《鬼泣》《街头霸王》核心开发者[22] - 正开发一款"3A动作游戏"[22] 手机厂商功能竞争 - OPPO ColorOS适配铁路12306服务 支持流体云/负一屏等功能[20] - 苹果/华为/OPPO/vivo均已适配 荣耀/魅族/小米官宣近期接入[20][21] - OPPO设计总监透露有厂商因未及时上线服务遭用户差评[20]
全国机器人产业竞速:深圳领航,多城崛起
AI研究所· 2025-05-31 01:18
机器人领域赛事与技术进展 - 2025年全球首个人形机器人半程马拉松在北京举行,北京人形机器人创新中心的"天工Ultra"以2小时40分42秒夺冠,检验了行走、奔跑和全身协同能力 [1] - 宇树科技人形机器人G1在机甲格斗擂台赛展现29自由度和强大膝关节扭矩,完成直拳、勾拳、侧踢等高难度动作 [1] - 赛事验证机器人平衡、控制和机械强度进步,但暴露实时感知和空间智能大模型缺失问题 [3] 机器人产业链全景 上游核心零部件 - 伺服系统占机器人动力驱动核心,汇川技术占国内市场份额32.5% [7] - 减速器领域绿的谐波、双环传动突破技术瓶颈,打破国外垄断 [7] - AI芯片企业寒武纪、地平线在机器人视觉识别、语音交互发挥重要作用 [8] 中游整机制造 - 工业机器人领域埃斯顿焊接机器人市占率超15%,新松机器人AGV进入特斯拉供应链 [10] - 服务机器人领域科沃斯扫地机器人全球市占率第一,石头科技洗地机器人国内市占率超30% [10] - 系统集成领域瑞松科技新能源汽车电池组装线集成市占率超40% [10] 下游应用 - 工业机器人聚焦焊接、装配、检测等劳动力替代场景,特斯拉Optimus验证人形机器人在复杂产线协同潜力 [11] 深圳机器人产业 - 2024年深圳机器人企业数量达74032家,产业链总产值2012亿元,同比增长12.58% [13] - 上游核心零部件集群显著,人形机器人硬件成本60%-70%来自深圳及周边企业 [13] - 深圳谐波减速器模组成本仅800元,远低于波士顿动力3万元采购价 [13] - 2024年深圳机器人专利申请20531件,授权7575件,同比增长超35% [14] - 南山区形成"机器人谷",集聚优必选、奥比中光等企业及南方科技大学等研究机构 [16] - 深圳市政府设立百亿元人工智能和机器人产业基金 [17] 其他城市机器人产业 北京 - 超2万家智能机器人企业,海淀、大兴、通州三区占总量37.8% [19] - 北京人形机器人创新中心"天工Ultra"在半程马拉松夺冠 [19] 上海 - 傅利叶发布开源人形机器人Fourier N1,聚焦"以人为中心"的康复场景 [20] - 智元机器人发布灵犀X2,强调构建二次开发平台生态 [20] 南京 - 埃斯顿机器人2025年Q1销量增长20%,市场份额达10.3%登顶国产榜首 [20] - 出台《南京市促进机器人产业高质量发展行动计划》打造完整生态链 [21] 苏州 - 乐聚机器人"夸父"人形机器人全流程在苏州完成,产业链协同优势显著 [22] 合肥 - 科大讯飞推出机器人多模态交互套件、大模型离线交互模组等核心产品 [23] 行业挑战与前景 - 具身智能算法环境感知能力仅达GPT-2水平,多模态交互协同未成熟 [25] - 2024年全球人形机器人市场规模10.17亿美元,2030年预计达150亿美元,复合增长率56% [26]