DeepSeek v3.2
搜索文档
加速了!刚刚,重大突破!发生了什么?
证券时报网· 2025-10-09 13:03
市场整体表现 - 10月9日沪指突破3900点整数关口,为10年来首次,日内涨幅0.58% [1] - 深成指涨超1%,创业板指涨超1%,科创50指数大涨超5% [1] - A50期指大涨超1%,香港市场亦由跌转涨 [1] - 截至上午10时40分左右,上证指数涨幅扩大至1%,创业板指涨超2%,科创50大涨近6% [3] - 两市总成交额达735.15亿 [3] 领涨板块与驱动因素 - 半导体产业链持续大爆发,存储芯片是重要主线 [1][2] - 有色、电子、电力设备行业涨幅居前 [3] - 市场加速突破主因包括融资盘加速回补,节前最后一个交易日两市融资余额减少近338亿元 [1][4] - 节后外围市场普遍造好,人工智能爆款不断,有色金属迭创新高,为市场提供炒作土壤 [1][5] 关键个股表现 - 科创50成分股中,芯原股份涨超15%,芯联集成、中微公司、澜起科技、拓荆科技涨幅居前 [2] - 华虹公司逼近20%涨停,兆易创新冲击涨停并创历史新高 [2] - 对上证指数贡献最大的个股包括工业富联(贡献4.75点,涨幅5.71%)、紫金矿业(贡献2.49点,涨幅6.49%)、海光信息(贡献2.40点,涨幅6.44%) [4] 外围市场与宏观背景 - 国庆中秋假期全球主要股指和商品价格普遍上涨,日本股市、国际铜价涨幅最大 [6] - 美国政府关门扰动、未来降息和衰退预期推动金银等贵金属和比特币价格走高 [6] - 供给短缺和算力革命逻辑下,铜价近期明显走强 [7] - Sora2、DeepSeek v3.2等AI新品发布,英伟达与AMD构筑生态系统 [7] 机构后市观点 - 分析人士认为10月份市场大概率维持震荡向上格局,国庆后市场历史上普遍“涨多跌少” [7] - 东吴证券认为节后需重视量价配合,市场风格或偏向具备催化的远期成长属性更强方向 [7] - 中信建投认为“十五五”规划有望成为市场焦点,预计市场仍将以科技为主线方向 [8] - 政策导向和产业催化有望推动AI、新能源、人形机器人、创新药等行业领涨 [8]
大盘加速突破,发生了什么?
证券时报· 2025-10-09 12:23
市场整体表现 - 10月9日沪指突破3900点整数关口,为10年来首次,日内涨幅0.58% [1] - 深成指涨超1%,创业板指涨超1% [1] - 科创50指数大涨超5%,半导体产业链持续爆发 [1] - A50指数大涨超1%,香港市场由跌转涨 [1] - 截至上午10时40分左右,上证指数涨幅扩大至1%,创业板指涨超2%,科创50大涨近6% [3] 主要股指及成交数据 - 科创50指数开盘1526.92点,昨日收盘1495.29点,指数振幅59.49点或3.98% [3] - 科创50总成交额735.15亿,总成交量1147.4万 [3] - 沪市总市值623,677亿,A股成交额6,154.26亿 [3] - 截至9月30日,上交所融资余额报12,086.18亿元,深交所融资余额报11,623.54亿元,两市合计23,709.72亿元,较前一交易日减少338.54亿元 [4] 领涨板块及个股 - 半导体产业链涨势扩大,芯原股份涨超15%,芯联集成、中微公司、澜起科技、拓荆科技涨幅居前 [2] - 存储芯片是重要主线,华虹公司逼近20%涨停,雅克科技、深南电路、通富微电、赛腾股份、太极实业集体封板,兆易创新冲击涨停创历史新高 [2] - 工业富联、紫金矿业、海光信息、寒武纪、中芯国际对指数贡献最大 [3][4] - 有色、电子、电力设备行业涨幅居前,宁德时代涨近5% [3] 市场上涨驱动因素 - 融资盘加速回补是主因之一,节前最后一个交易日两市融资余额减少近338亿元 [1] - 节后外围市场普遍造好,人工智能爆款不断,有色金属迭创新高,为市场提供炒作土壤 [1][5] - 人工智能各种爆款故事持续演绎,外围存储芯片持续大涨,有色金属不断创新高 [5] - 国庆中秋假期全球主要股指和商品价格普遍上涨,日本股市和国际铜价涨幅最大 [6] 行业与主题催化 - 供给短缺和算力革命逻辑下,铜价近期明显走强 [6] - Sora2、DeepSeek v3.2等AI新品发布,英伟达与AMD构筑生态系统,推动AI基础设施从单一硬件竞争转向系统性生态竞争 [6] - 固态电池、核聚变等技术出现重大突破,为市场提供炒作结构 [5] 机构后市观点 - 10月份市场大概率维持震荡向上格局,国庆后市场普遍呈现"涨多跌少"格局 [7] - 市场风格或偏向具备催化、远期成长属性更强、估值约束更低的方向,以及政策+涨价逻辑支撑的顺周期链条 [7] - "十五五"规划有望成为市场资金关注焦点,预计市场未来仍将以科技为主线方向 [7] - 在经济基本面平稳、增量资金流入、全球流动性宽松背景下,A股有望维持震荡向上趋势 [7]
DeepSeek突然拥抱国产GPU语言,TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配
36氪· 2025-09-30 10:52
TileLang技术特性 - TileLang是一种专门用于开发GPU内核的领域专用语言,性能可对标英伟达CUDA,采用Python式语法并在TVM之上构建编译器基础架构[4][13] - 其核心设计理念是将调度空间与数据流解耦并封装为可自定义的注解和原语,以Tile作为编程模型核心概念,直观控制数据在全局内存、共享内存和寄存器间的流动[15] - 提供三个层次编程接口:硬件无关的高层接口供初学者使用,包含预定义优化操作的Tile Library供有经验开发者使用,以及允许直接操作线程同步等底层特性的线程原语供专家用户使用[15] 性能优势与效率提升 - 使用TileLang只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现[3] - 在FlashAttention算子开发中,代码量从500多行减少至80行,并保持与官方版本持平的性能[5] - 在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当[21] 行业生态适配与合作 - TileLang与国产算力生态适配,华为昇腾在第一时间公告对TileLang的支持[4] - 沐曦集成电路的高级总监董兆华与TileLang团队成员共同讨论沐曦GPU与TileLang的适配[5] - 该语言由北大团队主导开发,核心人物包括王磊、董宇骐以及北大计算机学院副研究员、博士生导师杨智[9] DeepSeek与TileLang的合作关系 - DeepSeek在v3.2中开源TileLang版本算子,其受关注程度超过新稀疏注意力机制DSA[1] - DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能,v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制运行速度远超传统实现[17] - DeepSeek v3.2验证了TileLang确实可以用来训练模型,TileLang发起人王磊发帖致敬DeepSeek敢于使用新编程语言开发核心产品[23]
DeepSeek突然拥抱国产GPU语言!TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配
量子位· 2025-09-30 08:57
TileLang技术特性 - 专门用于开发GPU内核的领域专用语言,性能对标英伟达CUDA[6] - 采用Python式语法,在TVM之上构建底层编译器基础架构[18] - 核心设计理念是将调度空间与数据流解耦,封装为可自定义的注解和原语[19] - 提供三个层次编程接口:硬件无关高层接口、优化过的预定义操作库、线程原语级别控制[20][21][22][23] - 以"Tile"为编程模型核心概念,通过显式Tile抽象控制数据在内存间的流动[19] TileLang性能表现 - 只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现[5] - 在华为昇腾上实现FlashAttention算子开发,代码量从500+行减少至80行,性能与官方版本持平[8] - 在H100上的MLA解码速度与FlashMLA相当[31] - 通过缓存中间数据,比全局内存快得多[28] DeepSeek与TileLang合作 - DeepSeek v3.2开源TileLang版本算子,关注度超过新稀疏注意力机制DSA[2] - DeepSeek团队使用TileLang快速开发原型,后用更底层方法进一步优化性能[26] - TileLang团队成员曾向DeepSeek团队推荐该语言,并以DeepSeek发布的FlashMLA内核作为评测基准[29][31] - DeepSeek v3.2验证了TileLang可用于训练模型[34] 产业生态支持 - 华为昇腾在第一时间公告对TileLang的支持[7] - 沐曦集成电路与TileLang团队讨论GPU适配问题[9] - TileLang由北大团队主导开发,核心人物包括王磊、董宇骐和杨智[15] - GitHub项目获得1.9k星标,172次fork[18]