Workflow
后摩漫界M50芯片
icon
搜索文档
主题投资月度观察(2025年第7期):AI革命浪潮与“反内卷”共振-20250803
国信证券· 2025-08-03 23:15
海外科技映射 - OpenAI发布ChatGPT Agent,实现端到端交互,内置工具自主选择能力,HLE测试得分41.6%(工具辅助)[2][8] - xAI推出Grok-4模型,Grok 4 Heavy在HLE测试中达44.4%,优化策略后创50.7%新纪录[2][13] - 美国《天才法案》签署生效,确立联邦稳定币监管框架,限定银行主导发行权,强制储备透明化[2][16] - 2025世界人工智能大会(WAIC)聚焦十大方向,首发3000项成果,中国提出全球AI治理行动计划[2][19] - ChatGPT推出"学习模式",适用于所有版本用户[2][22] - 英伟达H20芯片恢复在华销售,7月中旬获美出口许可,月底因安全漏洞被网信办约谈[2][27] 国内热门主题 - 雅鲁藏布江水电工程开工,总投资1.2万亿元,装机量达3个三峡规模[2][33] - 药品集采规则革新,第十一批集采实行"N-3"竞价、两类复活机制,打破"最低价中标"逻辑[2][36] - 京东开源JoyAgent智能体,业内首个100%开源企业级产品,内部部署超2万个,GitHub三日获2000星标[2][41] - 后摩智能发布存算一体芯片漫界M50,支持70B大模型推理,10W超低功耗[2][43] - 智谱GLM-4.5开源,全球首个原生融合推理/编码/智能体三能力的模型,API成本低至0.8元/百万tokens[2][49] - 香港《稳定币条例》生效,8月1日全面监管落地,京东/蚂蚁等争抢首批牌照[2][52] - 暑期档票房寒潮,2025年暑期档总票房56亿元,同比下降21%[2][56] 政策关注 - 《育儿补贴制度实施方案》发布,2025年起每孩每年3600元[2][60] - 《中华人民共和国价格法修正草案(征求意见稿)》发布,严打"内卷式"低价倾销[2][64] - 《支持创新药高质量发展的若干措施》发布,医保局16条措施支持研发准入[2][67] - 《人民币跨境支付系统业务规则(征求意见稿)》发布,适应人民币跨境支付175万亿年规模(同比增42.6%)[2][72] - 《关于加快推进普惠托育服务体系建设的意见》发布,2025年目标每千人托位数4.5个[2][75]
三天超150亿!WAIC 2025上海收官;M50芯片 10W功耗干翻英伟达;OpenAI深夜引爆学习革命 | 混沌AI一周焦点
混沌学园· 2025-08-01 20:06
中国AI开源浪潮 - 中国AI巨头智谱、Qwen、腾讯混元等在Hugging Face榜单包揽前10名,全部为开源模型 [2] - 近一个月密集发布超10款创新模型,包括GLM-4.5登顶、Qwen占5席 [2] - 开源浪潮推动全球AI生态向中国倾斜,对比海外闭源涨价趋势,重塑产业竞争规则 [2] OpenAI教育功能革新 - OpenAI推出ChatGPT学习模式,通过交互式提示和个性化支持引导学生主动探索知识 [3] - 该功能免费开放所有用户,或将重塑教育科技竞争格局 [3] - 采用提示词工程构建,强调元认知培养,挑战传统教育辅助工具 [5] Anthropic估值暴涨 - Anthropic获得50亿美元融资,公司估值飙升至1700亿美元,较四个月前增长近三倍 [6] - 预计其2027年营收将达350亿美元并超越OpenAI [6] - 此举将颠覆AI竞争格局,推动主权基金加速入场 [6] WAIC 2025盛会成果 - WAIC 2025吸引800余家企业参展,展区面积达7万平方米,参观人次突破35万 [7] - 现场签约31个项目,投资总额超150亿元 [7] - 展示人工智能从"参数竞赛"向生产力落地的转变,具身智能与智能体应用成为焦点 [7] Surge AI数据标注领先 - Surge AI以120人团队实现10亿年营收,未融资状态下反超ScaleAI [8] - 成为OpenAI、谷歌、Anthropic核心数据供应商 [8] - 创始人提出"高质量人类数据>合成数据"的颠覆性观点 [8] 微软浏览器AI升级 - 微软推出Edge浏览器"Copilot模式",实现跨标签页情境感知、语音控制及自动分组功能 [9] - 该AI智能体可同时分析9个网页内容,支持复杂操作 [9] - 限时免费开放预示浏览器付费时代来临 [9] 智谱模型开源突破 - 智谱开源旗舰模型GLM-4.5,专为Agent应用打造 [10] - 以MoE架构达到开源模型SOTA性能(全球第三/国产第一) [10] - API成本低至输入0.8元/百万tokens,输出速度最高可达100 tokens/秒 [10] AI芯片能效创新 - 后摩智能发布第二代存算一体芯片M50,以10W超低功耗实现160TOPS@INT8算力 [11] - 自研天璇架构最高可提供160%加速效果 [11] - 推出全场景硬件矩阵,颠覆边缘计算领域 [11] AI设计工具革新 - Lovart推出全球首款AI设计Agent"ChatCanvas",实现设计全流程自动化 [12] - 支持实时圈选修改、多图融合生成及视频动态化创作 [12] - 软件体验从以界面为中心的UX转向以Agent为核心的AX [12] 营销AI Agent突破 - 钛动科技发布全球首个营销AI Agent产品Navos [13] - 通过多智能体协同大幅降低企业出海营销成本 [13] - 成熟客户ROI提升3倍以上,中小客户ROI飙升50倍,营销周期效率跃升10-50倍 [13][17] 像素绽放融资扩张 - 像素绽放完成B3轮战略融资,加速全球化布局 [15] - 核心产品AiPPT.cn和AiPPT.com合并月访问量达2347万次 [15] - 锁定全球办公市场——存量5000亿、5年7000亿规模 [15]
AI算力集群迈进“万卡”时代 超节点为什么火了?
第一财经· 2025-07-30 18:24
超节点技术成为AI算力集群核心解决方案 - 超节点技术通过整合算力芯片资源构建低延迟高带宽算力实体 显著提升算力利用效率 支撑千亿至万亿参数模型训练[1] - 技术能避免芯片空闲 在单颗芯片制程受限时仍可提升集群性能 国内厂商已将其作为明显发展趋势[1][4] - 华为展出昇腾384超节点实现384个NPU大带宽低时延互连 上海仪电联合曦智科技等发布光跃LightSphere X超节点 新华三推出H3C UniPoD S80000超节点[1] 超节点技术兴起的驱动因素 - 大模型参数量迈向万亿级 算力集群从千卡扩展到万卡/十万卡规模 需解决大规模芯片协同问题[2] - 传统AI服务器横向拓展存在算力性能损失 超节点能保证单个节点内性能最优 解决"1+1<2"的算力损耗问题[3] - 光互连技术成为主流方向 光互连光交换可实现纳秒级切换 提供高带宽低延迟通信 曦智科技光交换芯片与壁仞科技GPU液冷模组已投入应用[4] 超节点技术的实施路径与优势 - 采用scale out横向拓展与scale up纵向拓展双路线 纵向拓展可在单节点内集成多GPU(如64卡/节点)实现一致通讯带宽[3] - 万卡集群需具备多重容错能力 包括秒级容错和分钟级故障恢复 同时需要调度能力实现并行计算分布[2] - 国内通过超节点方案以量补质 弥补国产AI芯片制程差距 光芯片可不依赖高制程[5] 国产AI芯片的差异化竞争策略 - 外购芯片市场份额从去年63%降至今年预计49% 国产芯片占比提升[6] - 墨芯人工智能聚焦AI推理场景 采用稀疏计算技术 12nm制程即可满足需求 针对边缘计算优化功耗[6][7] - 云天励飞聚焦边缘计算与云端大模型推理 后摩智能定位端边场景 存算一体技术实现160TOPS算力 避开与巨头直接竞争[8] 技术路线与生态建设现状 - 英伟达采用封闭生态 国内厂商推进开放技术体系 各厂商超节点路线存在差异 光通信技术全球领先无明显代差[5] - 新华三超节点基于以太协议和PCIe协议 适用多种算力芯片 华为通过总线技术实现NPU互连[4] - 万亿参数模型训练需超1万张GPU 每个超节点包含几十张GPU 需配置冗余容错机制[2]
死磕存算一体,后摩智能发布重磅新品
半导体芯闻· 2025-07-29 18:29
冯诺依曼架构瓶颈与存算一体技术 - 冯诺依曼架构芯片面临高算力、高带宽和低功耗难以同时实现的矛盾[1] - 存算一体技术通过集成计算和存储单元,从根本上解决数据传输慢、功耗高的问题[1] - 存算一体技术特别适合AI和大模型应用,因其需要算力密集和带宽密集的特点[6] 存算一体技术商业化挑战 - 学术界研究停留在理论层面,量产和软件适配是主要商业化障碍[5][6] - 后摩智能选择存算一体路线基于两个原因:解决功耗/存储墙问题,以及避开与英伟达直接竞争[6] - 公司深耕该技术四年多,2023年起重点研究与大模型的结合[6][7] 后摩漫界M50芯片技术特点 - 采用第二代SRAM-CIM双端口存算架构,支持权重加载与矩阵计算并行[8] - 集成第二代IPU架构"天璇",最高可提供160%加速效果[8] - 物理算力达160TOPS@INT8、100TFLOPS@bFP16,典型功耗仅10W[10] - 支持最大48GB内存和153.6GB/s带宽,能效比传统架构提升5-10倍[10] - 配备新一代编译器"后摩大道",支持自动算子优化和原生浮点运算[11][12] 产品矩阵与应用场景 - 力擎LQ50 M.2卡支持7B/8B模型推理超25tokens/s[14] - 力擎LQ50 Duo M.2卡集成双M50芯片,算力达320TOPS[14] - 力谋加速卡最高集成4颗M50芯片,算力达640TOPS[14] - BX50计算盒子支持32路视频分析与本地大模型运行[14] - 应用场景包括消费终端、智能办公、智能工业等离线本地处理需求[16] 公司战略与技术路线图 - 目标成为端边大模型AI芯片领跑者[18] - 已启动下一代DRAM-PIM技术研发,目标突破1TB/s片内带宽[18] - 新技术预计能使能效较现有水平再提升三倍[18] - 愿景是让大模型走出云端,进入终端设备赋能各行各业[18]