后摩漫界M50芯片 - 财报，业绩电话会，研报，新闻

后摩漫界M50芯片

搜索文档

主题投资月度观察（2025年第7期）：AI革命浪潮与“反内卷”共振-20250803

国信证券· 2025-08-03 23:15

海外科技映射 - OpenAI发布ChatGPT Agent，实现端到端交互，内置工具自主选择能力，HLE测试得分41.6%（工具辅助）[2][8] - xAI推出Grok-4模型，Grok 4 Heavy在HLE测试中达44.4%，优化策略后创50.7%新纪录[2][13] - 美国《天才法案》签署生效，确立联邦稳定币监管框架，限定银行主导发行权，强制储备透明化[2][16] - 2025世界人工智能大会（WAIC）聚焦十大方向，首发3000项成果，中国提出全球AI治理行动计划[2][19] - ChatGPT推出"学习模式"，适用于所有版本用户[2][22] - 英伟达H20芯片恢复在华销售，7月中旬获美出口许可，月底因安全漏洞被网信办约谈[2][27] 国内热门主题 - 雅鲁藏布江水电工程开工，总投资1.2万亿元，装机量达3个三峡规模[2][33] - 药品集采规则革新，第十一批集采实行"N-3"竞价、两类复活机制，打破"最低价中标"逻辑[2][36] - 京东开源JoyAgent智能体，业内首个100%开源企业级产品，内部部署超2万个，GitHub三日获2000星标[2][41] - 后摩智能发布存算一体芯片漫界M50，支持70B大模型推理，10W超低功耗[2][43] - 智谱GLM-4.5开源，全球首个原生融合推理/编码/智能体三能力的模型，API成本低至0.8元/百万tokens[2][49] - 香港《稳定币条例》生效，8月1日全面监管落地，京东/蚂蚁等争抢首批牌照[2][52] - 暑期档票房寒潮，2025年暑期档总票房56亿元，同比下降21%[2][56] 政策关注 - 《育儿补贴制度实施方案》发布，2025年起每孩每年3600元[2][60] - 《中华人民共和国价格法修正草案（征求意见稿）》发布，严打"内卷式"低价倾销[2][64] - 《支持创新药高质量发展的若干措施》发布，医保局16条措施支持研发准入[2][67] - 《人民币跨境支付系统业务规则（征求意见稿）》发布，适应人民币跨境支付175万亿年规模（同比增42.6%）[2][72] - 《关于加快推进普惠托育服务体系建设的意见》发布，2025年目标每千人托位数4.5个[2][75]

三天超150亿！WAIC 2025上海收官；M50芯片 10W功耗干翻英伟达；OpenAI深夜引爆学习革命｜混沌AI一周焦点

混沌学园· 2025-08-01 20:06

中国AI开源浪潮 - 中国AI巨头智谱、Qwen、腾讯混元等在Hugging Face榜单包揽前10名，全部为开源模型 [2] - 近一个月密集发布超10款创新模型，包括GLM-4.5登顶、Qwen占5席 [2] - 开源浪潮推动全球AI生态向中国倾斜，对比海外闭源涨价趋势，重塑产业竞争规则 [2] OpenAI教育功能革新 - OpenAI推出ChatGPT学习模式，通过交互式提示和个性化支持引导学生主动探索知识 [3] - 该功能免费开放所有用户，或将重塑教育科技竞争格局 [3] - 采用提示词工程构建，强调元认知培养，挑战传统教育辅助工具 [5] Anthropic估值暴涨 - Anthropic获得50亿美元融资，公司估值飙升至1700亿美元，较四个月前增长近三倍 [6] - 预计其2027年营收将达350亿美元并超越OpenAI [6] - 此举将颠覆AI竞争格局，推动主权基金加速入场 [6] WAIC 2025盛会成果 - WAIC 2025吸引800余家企业参展，展区面积达7万平方米，参观人次突破35万 [7] - 现场签约31个项目，投资总额超150亿元 [7] - 展示人工智能从"参数竞赛"向生产力落地的转变，具身智能与智能体应用成为焦点 [7] Surge AI数据标注领先 - Surge AI以120人团队实现10亿年营收，未融资状态下反超ScaleAI [8] - 成为OpenAI、谷歌、Anthropic核心数据供应商 [8] - 创始人提出"高质量人类数据＞合成数据"的颠覆性观点 [8] 微软浏览器AI升级 - 微软推出Edge浏览器"Copilot模式"，实现跨标签页情境感知、语音控制及自动分组功能 [9] - 该AI智能体可同时分析9个网页内容，支持复杂操作 [9] - 限时免费开放预示浏览器付费时代来临 [9] 智谱模型开源突破 - 智谱开源旗舰模型GLM-4.5，专为Agent应用打造 [10] - 以MoE架构达到开源模型SOTA性能（全球第三/国产第一） [10] - API成本低至输入0.8元/百万tokens，输出速度最高可达100 tokens/秒 [10] AI芯片能效创新 - 后摩智能发布第二代存算一体芯片M50，以10W超低功耗实现160TOPS@INT8算力 [11] - 自研天璇架构最高可提供160%加速效果 [11] - 推出全场景硬件矩阵，颠覆边缘计算领域 [11] AI设计工具革新 - Lovart推出全球首款AI设计Agent"ChatCanvas"，实现设计全流程自动化 [12] - 支持实时圈选修改、多图融合生成及视频动态化创作 [12] - 软件体验从以界面为中心的UX转向以Agent为核心的AX [12] 营销AI Agent突破 - 钛动科技发布全球首个营销AI Agent产品Navos [13] - 通过多智能体协同大幅降低企业出海营销成本 [13] - 成熟客户ROI提升3倍以上，中小客户ROI飙升50倍，营销周期效率跃升10-50倍 [13][17] 像素绽放融资扩张 - 像素绽放完成B3轮战略融资，加速全球化布局 [15] - 核心产品AiPPT.cn和AiPPT.com合并月访问量达2347万次 [15] - 锁定全球办公市场——存量5000亿、5年7000亿规模 [15]

人工智能

具身智能

智能体

Artificial Intelligence

Artificial Intelligence

GLM - 4.5

ChatGPT学习模式

AI算力集群迈进“万卡”时代超节点为什么火了？

第一财经· 2025-07-30 18:24

超节点技术成为AI算力集群核心解决方案 - 超节点技术通过整合算力芯片资源构建低延迟高带宽算力实体显著提升算力利用效率支撑千亿至万亿参数模型训练[1] - 技术能避免芯片空闲在单颗芯片制程受限时仍可提升集群性能国内厂商已将其作为明显发展趋势[1][4] - 华为展出昇腾384超节点实现384个NPU大带宽低时延互连上海仪电联合曦智科技等发布光跃LightSphere X超节点新华三推出H3C UniPoD S80000超节点[1] 超节点技术兴起的驱动因素 - 大模型参数量迈向万亿级算力集群从千卡扩展到万卡/十万卡规模需解决大规模芯片协同问题[2] - 传统AI服务器横向拓展存在算力性能损失超节点能保证单个节点内性能最优解决"1+1<2"的算力损耗问题[3] - 光互连技术成为主流方向光互连光交换可实现纳秒级切换提供高带宽低延迟通信曦智科技光交换芯片与壁仞科技GPU液冷模组已投入应用[4] 超节点技术的实施路径与优势 - 采用scale out横向拓展与scale up纵向拓展双路线纵向拓展可在单节点内集成多GPU（如64卡/节点）实现一致通讯带宽[3] - 万卡集群需具备多重容错能力包括秒级容错和分钟级故障恢复同时需要调度能力实现并行计算分布[2] - 国内通过超节点方案以量补质弥补国产AI芯片制程差距光芯片可不依赖高制程[5] 国产AI芯片的差异化竞争策略 - 外购芯片市场份额从去年63%降至今年预计49% 国产芯片占比提升[6] - 墨芯人工智能聚焦AI推理场景采用稀疏计算技术 12nm制程即可满足需求针对边缘计算优化功耗[6][7] - 云天励飞聚焦边缘计算与云端大模型推理后摩智能定位端边场景存算一体技术实现160TOPS算力避开与巨头直接竞争[8] 技术路线与生态建设现状 - 英伟达采用封闭生态国内厂商推进开放技术体系各厂商超节点路线存在差异光通信技术全球领先无明显代差[5] - 新华三超节点基于以太协议和PCIe协议适用多种算力芯片华为通过总线技术实现NPU互连[4] - 万亿参数模型训练需超1万张GPU 每个超节点包含几十张GPU 需配置冗余容错机制[2]

半导体芯闻· 2025-07-29 18:29

冯诺依曼架构瓶颈与存算一体技术 - 冯诺依曼架构芯片面临高算力、高带宽和低功耗难以同时实现的矛盾[1] - 存算一体技术通过集成计算和存储单元，从根本上解决数据传输慢、功耗高的问题[1] - 存算一体技术特别适合AI和大模型应用，因其需要算力密集和带宽密集的特点[6] 存算一体技术商业化挑战 - 学术界研究停留在理论层面，量产和软件适配是主要商业化障碍[5][6] - 后摩智能选择存算一体路线基于两个原因：解决功耗/存储墙问题，以及避开与英伟达直接竞争[6] - 公司深耕该技术四年多，2023年起重点研究与大模型的结合[6][7] 后摩漫界M50芯片技术特点 - 采用第二代SRAM-CIM双端口存算架构，支持权重加载与矩阵计算并行[8] - 集成第二代IPU架构"天璇"，最高可提供160%加速效果[8] - 物理算力达160TOPS@INT8、100TFLOPS@bFP16，典型功耗仅10W[10] - 支持最大48GB内存和153.6GB/s带宽，能效比传统架构提升5-10倍[10] - 配备新一代编译器"后摩大道"，支持自动算子优化和原生浮点运算[11][12] 产品矩阵与应用场景 - 力擎LQ50 M.2卡支持7B/8B模型推理超25tokens/s[14] - 力擎LQ50 Duo M.2卡集成双M50芯片，算力达320TOPS[14] - 力谋加速卡最高集成4颗M50芯片，算力达640TOPS[14] - BX50计算盒子支持32路视频分析与本地大模型运行[14] - 应用场景包括消费终端、智能办公、智能工业等离线本地处理需求[16] 公司战略与技术路线图 - 目标成为端边大模型AI芯片领跑者[18] - 已启动下一代DRAM-PIM技术研发，目标突破1TB/s片内带宽[18] - 新技术预计能使能效较现有水平再提升三倍[18] - 愿景是让大模型走出云端，进入终端设备赋能各行各业[18]