Seek .(SKLTY)
搜索文档
DeepSeek突然拥抱国产GPU语言,TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配
36氪· 2025-09-30 10:52
TileLang技术特性 - TileLang是一种专门用于开发GPU内核的领域专用语言,性能可对标英伟达CUDA,采用Python式语法并在TVM之上构建编译器基础架构[4][13] - 其核心设计理念是将调度空间与数据流解耦并封装为可自定义的注解和原语,以Tile作为编程模型核心概念,直观控制数据在全局内存、共享内存和寄存器间的流动[15] - 提供三个层次编程接口:硬件无关的高层接口供初学者使用,包含预定义优化操作的Tile Library供有经验开发者使用,以及允许直接操作线程同步等底层特性的线程原语供专家用户使用[15] 性能优势与效率提升 - 使用TileLang只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现[3] - 在FlashAttention算子开发中,代码量从500多行减少至80行,并保持与官方版本持平的性能[5] - 在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当[21] 行业生态适配与合作 - TileLang与国产算力生态适配,华为昇腾在第一时间公告对TileLang的支持[4] - 沐曦集成电路的高级总监董兆华与TileLang团队成员共同讨论沐曦GPU与TileLang的适配[5] - 该语言由北大团队主导开发,核心人物包括王磊、董宇骐以及北大计算机学院副研究员、博士生导师杨智[9] DeepSeek与TileLang的合作关系 - DeepSeek在v3.2中开源TileLang版本算子,其受关注程度超过新稀疏注意力机制DSA[1] - DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能,v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制运行速度远超传统实现[17] - DeepSeek v3.2验证了TileLang确实可以用来训练模型,TileLang发起人王磊发帖致敬DeepSeek敢于使用新编程语言开发核心产品[23]
DeepSeek发新模型;库克确认持有加密货币丨新鲜早科技
21世纪经济报道· 2025-09-30 10:50
AI大模型与开源生态 - DeepSeek发布V3-2-Exp模型并大幅下调API价格超过50% 同时华为云和寒武纪完成模型适配 [2] - 阿里通义7款模型入选全球开源前十 Qwen3-Omni登顶并斩获32项SOTA 模型全球下载量突破6亿次衍生超17万个 [5] - 寒武纪适配DeepSeek-V3-2-Exp并开源大模型推理引擎vLLM-MLU源代码 华为昇腾实现0day支持并开源推理代码 [12][13] 科技巨头战略动向 - 苹果CEO库克确认个人持有比特币和以太坊等加密货币 但明确苹果公司不会接受加密货币支付或投资其2000亿美元现金 [3] - 华为任命余承东为产品投资评审委员会主任 负责重大战略资源投入决策 同时其继续担任终端BG董事长 [6] - 小米17系列无削减订单计划 因新增标准版16GB+1TB版本及Pro系列加单 整体订单较上一代增加 [8][9] 企业合作与资本运作 - 赛力斯支付115亿元完成收购华为持有的引望智能10%股权 已付清第三笔转让价款34.5亿元 [4] - 斯年智驾完成数亿元B+轮融资 资金用于无人驾驶产品研发和市场开拓 [16] - 灵猴机器人完成超亿元A轮融资 资金用于工业自动化及机器人核心零部件研发及产能扩充 [17][18] 新能源汽车与供应链 - 赛力斯2025年上半年归母净利润29.41亿元同比增长81.03% 拟每10股派现3.10元合计5.06亿元占净利润17.22% [14] - 宁德时代计划至2030年在海南投资建设100座换电站 实现核心城区10分钟找站 [10] - 英联股份预计前三季度归母净利润3450万元至3750万元 同比增长1531.13%至1672.97% 受益于易开盖市场占有率提升 [15] 科技应用与监管环境 - 美团无人机在深圳上线夜间配送服务 累计完成超60万单 平均配送时长15分钟效率提升近100% [19] - 国家税务总局重申平台企业不得向外卖员快递员转嫁涉税义务 月收入低于6250元无需预扣税款 [7] - 我国发布首项个人信息跨境安全管理国家标准 将于2026年3月1日实施 [11]
科创芯片ETF指数(588920)涨超2.2%,DeepSeek发布新模型V3.2-Exp
新浪财经· 2025-09-30 10:31
科创板芯片指数及成分股表现 - 上证科创板芯片指数(000685)于2025年9月30日09:52强势上涨2 14% [1] - 成分股佰维存储(688525)上涨7 66% 燕东微(688172)上涨7 10% 乐鑫科技(688018)上涨5 24% 翱捷科技(688220)和澜起科技(688008)等个股跟涨 [1] - 科创芯片ETF(588920)上涨2 30% 最新价报1 65元 [1] 指数构成与权重 - 上证科创板芯片指数从科创板上市公司中选取业务涉及半导体材料和设备 芯片设计 芯片制造 芯片封装和测试的证券作为样本 [2] - 截至2025年8月29日 指数前十大权重股包括寒武纪 海光信息 中芯国际 澜起科技 中微公司等 [2] - 前十大权重股合计占比62 02% [2] 人工智能技术进展与行业影响 - DeepSeek于9月29日更新实验性AI模型DeepSeek-V3 1-Exp 引入名为DeepSeek Sparse Attention(DSA)的稀疏注意力机制 [1] - DSA机制可在长上下文中进行更快 更高效的训练和推理 [1] - 天风证券指出AI存储革命已至 "以存代算"催生核心机遇 可显著节省算力消耗并加速AI推理 [1] - "以存代算"趋势将带动SSD需求增速高于传统曲线 建议关注存储模组厂商和存储芯片 [1]
DeepSeek和智谱都将于近日发布新模型,或将迎来重大突破
搜狐财经· 2025-09-30 10:00
公司动态:DeepSeek - DeepSeek于9月29日发布新模型DeepSeek-V3.2并上传至社区平台HuggingFace [2] - 公司于8月正式发布了DeepSeek-V3.1模型 [2] - DeepSeek-V3.1的主要升级包括采用混合推理架构,一个模型同时支持思考模式与非思考模式 [2] - DeepSeek-V3.1相比DeepSeek-R1-0528能在更短时间内给出答案,思考效率更高 [2] - 新模型通过Post-Training优化,在工具使用与智能体任务中的表现有较大提升 [2] 公司动态:智谱 - 智谱新模型GLM-4.6也将于近日发布,目前部分用户已可通过API接口调用 [2] - 智谱在7月发布了新一代旗舰模型GLM-4.5,专为智能体应用打造的基础模型 [2] - GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合 [2] - 智谱于8月推出全球100B级效果最佳的开源视觉推理模型GLM-4.5V,总参数106B,激活参数12B [2] 行业趋势 - DeepSeek和智谱是中国最为头部的大模型企业,两家公司都有望迎来新的重大进展 [2] - 行业头部公司近期密集进行模型迭代,技术发展迅速 [2]
AI概念股多数走高 DeepSeek新模型成本下降超50% 机构看好AI应用商业化拐点临近
智通财经· 2025-09-30 09:52
华泰证券曾表示,模型降价将吸引更多的开发者开发AI应用,或进一步提振算力需求,提升Super App 出现概率。中银国际认为,AI应用商业化拐点临近。在算力层,推理效率与性价比大幅提升,国产芯 片加速替代;在模型层,通用大模型的能力已逐步达到商用标准;在数据层,行业专属数据的积累与合 成数据技术成熟之下,企业加速实现数据闭环训练与模型微调。三者共同推动AI能力从"单点突破"走 向"体系协同",为AI应用大规模商业化落地创造条件。 AI概念股早盘多数走高,截至发稿,汇量科技(01860)涨4.47%,报19.88港元;迈富时(02556)涨4.33%, 报51.35港元;创新奇智(02121)涨3.65%,报7.95港元;第四范式(06682)涨3.15%,报65.5港元;美图公 司(01357)涨3.26%,报9.16港元。 消息面上,DeepSeek昨日宣布,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。 DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新 的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。 ...
港股异动 | AI概念股多数走高 DeepSeek新模型成本下降超50% 机构看好AI应用商业化拐点临近
智通财经· 2025-09-30 09:52
AI概念股市场表现 - 汇量科技(01860)早盘上涨4.47%至19.88港元 [1] - 迈富时(02556)早盘上涨4.33%至51.35港元 [1] - 创新奇智(02121)早盘上涨3.65%至7.95港元 [1] - 第四范式(06682)早盘上涨3.15%至65.5港元 [1] - 美图公司(01357)早盘上涨3.26%至9.16港元 [1] 行业催化事件 - DeepSeek宣布其官方App、网页端、小程序同步更新为DeepSeek-V3.2-Exp [1] - DeepSeek新模型服务成本大幅降低,官方API价格即刻下调 [1] - 开发者调用DeepSeek API的成本将降低50%以上 [1] - 国家发改委表示将多措并举支持各类企业深度参与人工智能+行动 [1] 机构观点与行业趋势 - 模型降价将吸引更多开发者开发AI应用,或进一步提振算力需求 [2] - 模型降价可能提升Super App出现概率 [2] - AI应用商业化拐点临近,算力层推理效率与性价比大幅提升 [2] - 国产芯片在算力层加速替代 [2] - 通用大模型能力已逐步达到商用标准 [2] - 行业专属数据积累与合成数据技术成熟推动企业实现数据闭环训练与模型微调 [2] - AI能力正从“单点突破”走向“体系协同”,为大规模商业化落地创造条件 [2]
DeepSeek新模型开源,新架构亮了,国产AI芯片集体狂欢
36氪· 2025-09-30 09:15
模型发布与核心创新 - DeepSeek于9月30日宣布开源实验版模型DeepSeek-V3.2-Exp,该模型首次引入DeepSeek Sparse Attention稀疏注意力机制,被定义为迈向新一代架构的中间步骤[1] - 新架构通过Lightning Indexer和细粒度token选择机制,将注意力计算复杂度从传统的二次方降至近似线性水平,大幅提升长文本训练和推理效率[36][38] - 模型在几乎不影响输出效果的前提下显著提升效率,采用了继续预训练+后训练的方式,包括专家蒸馏和混合强化学习等技术创新[36][38] 性能表现与基准测试 - 在各领域公开评测集上,DeepSeek-V3.2-Exp与DeepSeek-V3.1-Terminus表现基本一致:MMLU-Pro均为85.0分,GPQA-Diamond从80.7降至79.9,Humanity's Last Exam从21.7降至19.8[5][39] - 部分领域表现有所提升:BrowseComp从38.5提升至40.1,BrowseComp-zh从45.0提升至47.9,Codeforces-Div1从2046提升至2121[5][39] - 模型完成任务使用的token量大幅减少,但在某些测试中因生成推理token更少导致分数略有下降,使用中间检查点可缩小差距[5][38] 成本优化与市场推广 - DeepSeek执行新的价格政策,API调用成本降低50%以上,输出100万token价格从12元降至3元,降幅达75%[3] - 华为云、PPIO派欧云、优刻得等云平台已宣布上线DeepSeek-V3.2-Exp模型,华为、寒武纪、海光信息等AI芯片厂商完成Day 0适配[5][10][13][15][17] - 华为昇腾设备上实现128K长序列输出,首token输出耗时低于2秒,每token输出耗时低于30毫秒的推理速度[10] 实际应用体验反馈 - 用户测试显示DeepSeek-V3.2-Exp在10万token代码库上速度提升明显,但编写代码更为简短,有时影响功能实现[19][26][27] - 在信息检索任务中生成结果更为简短用词朴素,但推荐内容不符合新手友好要求,存在能力让步现象[29][31] - 用户反馈指出模型在工作记忆、计算精度稳定性方面存在短板,有偷懒倾向和陷入死循环的可能[32][34] 技术影响与行业意义 - 该模型作为实验性版本,主要贡献在于理论层面展示长文本处理中兼顾性能与效率的新路径,DSA机制处于原型期但实用性显著[36][38][44] - 产业界与开发者圈反响热烈,寒武纪在DeepSeek官宣后4分钟即宣布完成适配,可能意味着厂商在模型发布前已启动适配工作[15][21] - 训练曲线与前代模型保持相似稳定性,表明新架构在收敛性上没有额外风险,为未来技术优化奠定基础[42][44]
六部门联合印发,机械行业迎利好;DeepSeek发布新模型丨盘前情报
21世纪经济报道· 2025-09-30 08:45
A股市场表现 - 市场全天震荡走强,三大指数集体上涨,沪指涨0.90%至3862.53点,深成指涨2.05%至13479.43点,创业板指涨2.74%至3238.01点 [2] - 沪深两市成交额2.16万亿元,较上一交易日放量146亿元,全市场超3500只个股上涨 [2] - 大金融板块集体爆发,新能源板块走强,绿色甲醇概念股活跃,储能概念股反弹,有色金属板块全天走高,半导体产业链午后回暖,教育股全天走弱 [2] 全球市场表现 - 纽约股市三大股指上涨,道琼斯指数涨0.15%至46316.07点,标普500指数涨0.26%至6661.21点,纳斯达克指数涨0.48%至22591.15点 [3] - 欧洲三大股指全线上涨,英国富时100指数涨0.16%至9299.84点,法国CAC40指数涨0.13%至7880.87点,德国DAX指数涨0.02%至23745.06点 [3] - 国际油价下跌,纽约轻质原油期货价格跌3.45%至每桶63.45美元,伦敦布伦特原油期货价格跌3.08%至每桶67.97美元 [4] 政策与监管动态 - 国家发展改革委宣布新型政策性金融工具规模共5000亿元,全部用于补充项目资本金,以推动扩大有效投资 [6] - 国家发展改革委将制定新一代智能终端和智能体有关政策指引,围绕技术支撑、应用推广、安全治理等方面提出要求 [6] - 六部门发布《机械行业稳增长工作方案(2025—2026年)》,提出力争机械行业营业收入平均增速达3.5%左右,到2026年营业收入突破10万亿元人民币 [8] 国际贸易与地缘政治 - 美商务部发布出口管制穿透性规则,对被列入美“实体清单”等企业持股超过50%的子公司追加同等出口管制制裁,中方对此坚决反对 [5] - 美国总统特朗普称将对所有在美国以外制作的电影征收100%关税 [8] 行业与公司动态 - DeepSeek发布新版本模型DeepSeek-V3.2-Exp,优化长文本训练和推理效率,同时API调用成本降低超50% [7] - 富临精工拟与宁德时代共同对子公司江西升华增资扩股,预计构成重大资产重组 [10] - 领益智造筹划发行H股股票并在香港联交所上市 [10] - 厦钨新能与中伟股份签署战略合作框架协议,就固态锂电材料等产品原材料供应链建立长期合作伙伴关系 [10] - 赛力斯已支付完毕购买华为持有的引望智能10%股权的全部对价,总金额115亿元 [11] - 百诚医药创新药BIOS-0623-Z4片获得临床试验批准通知书,目前无同靶点且同适应症药品上市 [11] 资金流向 - 主力资金净流入前五大行业为证券(81.52亿元)、互联网服务(24.42亿元)、消费电子(21.71亿元)、汽车零部件(17.35亿元)、软件开发(16.72亿元) [12] - 主力资金净流出前五大行业为半导体(-53.81亿元)、通信设备(-21.96亿元)、化学制药(-11.89亿元)、电源设备(-11.08亿元)、文化传媒(-9.15亿元) [12] - 个股方面,领益智造、东方财富、中信证券、山子高科、指南针为主力资金净流入前五大个股 [12] 机构观点 - 国金证券指出国内大模型加速迭代,算力需求增加、国产链向上,建议关注国内AI算力、超节点服务器及大模型相关供应链 [8] - 中银国际重视国产算力及信创特别是华为链与AI应用和端侧投资机会,指出国产算力、AI应用、AI端侧自2025年4月9日反弹以来涨幅分别为71%、27%、61%,具备较高配置性价比 [10] - 华福证券认为短期美股面临估值调整压力,但中长期在降息周期和AI叙事支撑下仍有上行空间 [10]
国家发改委:推动智能终端和智能体市场扩容 DeepSeek
新浪财经· 2025-09-30 08:07
宏观政策与市场动态 - 国家发改委将适时加力实施宏观政策,从供需两端发力推动智能终端和智能体市场扩容,并制定相关政策指引,同时正积极推进规模5000亿元的新型政策性金融工具并抓紧投入项目[1] - 外交部宣布在普通签证类别下增设青年科技人才签证(K字签证),以促进中外青年科技人才交流与合作[1] - 纳斯达克中国金龙指数收涨2.03%,热门中概股普遍上涨,其中哔哩哔哩、阿里巴巴、新东方涨幅超过4%,理想汽车、京东涨幅超过3%,百度、蔚来涨幅超过2%[1] - 工信部向中国移动颁发卫星移动通信业务经营许可,使其与中国电信、中国联通均可依法开展手机直连卫星等业务,深化应急通信、海事通信等场景应用[3] 人工智能与模型服务 - DeepSeek官方API价格大幅下调,得益于新模型服务成本降低,开发者调用成本将降低50%以上[2] - 寒武纪宣布已完成对DeepSeek-V3.2-Exp的Day 0适配,并开源大模型推理引擎vLLM-MLU源代码,依托新模型的注意力机制可大幅降低长序列场景下的训推成本[4] - 余承东被任命为华为公司IRB主任,此次调整意味着华为将AI置于未来十年发展核心地位,通过IRB机制确保战略资源向AI领域高强度倾斜,以推动AI芯片、大模型等关键领域突破[1][3] 公司订单与战略合作 - 盛美上海公告称公司在手订单总金额为90.72亿元,同比增加34.10%[4][5] - 厦钨新能与中伟股份签署战略合作框架协议,就固态锂电材料等产品原材料供应链建立长期合作伙伴关系,预计至2028年9月30日,双方四氧化三钴产品年供需量约4万吨,三元前驱体产品年供需量约5万吨,碳酸锂/磷酸锂年供需量约1.5万吨,回收料年供需量约1万吨[5] 企业并购与股权投资 - 赛力斯全资子公司已支付完毕购买华为持有的引望智能10%股权的全部对价,总交易金额为115亿元,其中第三笔转让价款为34.5亿元[6] - 恒为科技拟以发行股份及支付现金方式购买AI应用公司数珩科技75%股份,交易完成后公司业务将向下游AI应用领域延伸[7] - 帝奥微正在筹划以发行股份及支付现金方式购买荣湃半导体股权,公司股票已停牌[8] - 概伦电子拟21.74亿元购买锐成芯微100%股权及纳能微45.64%股权,其中锐成芯微交易价格为19亿元,纳能微45.64%股权交易价格为2.74亿元,本次交易构成重大资产重组[9] - 索辰科技拟通过全资子公司收购力控科技60%股权,交易价格为1.92亿元(基于力控科技100%股权定价3.2亿元),本次交易构成重大资产重组[10] 股权转让与药品注册 - 纬德信息股东询价转让初步定价为40.33元/股,参与询价机构17家,有效认购股份502.8万股,认购倍数2.89倍,拟转让174.09万股由7家机构受让[11] - 爱美客全资子公司取得米诺地尔搽剂药品注册证书,规格为2%和5%,用于治疗男性型脱发和斑秃,其中5%规格仅限男性使用[12] 科技前沿与基础设施 - 世界容量最大超重力离心机正式启用,该国家重大科技基础设施由浙江大学牵头建设,包括3台超重力离心机及18台机载实验装置[12] - 中国科学院空天院研发融合AI与遥感技术的新方法,首次在我国北方干旱半干旱流域实现公里尺度上的“最优饲草种植带”精准识别,相关成果发表于《水研究》[12]
9月30日早餐 | DeepSeek发布新模型;OpenAI将发布新版Sora
选股宝· 2025-09-30 08:01
海外市场表现 - 美股主要指数普遍上涨,道指涨0.15%、纳指涨0.48%、标普500涨0.26% [1] - 科技股表现分化,英伟达涨2.05%、亚马逊涨1.09%,而苹果跌0.40%、谷歌A跌1.01% [1] - 美股存储概念股大幅上涨,闪迪涨近17%、西部数据涨逾9%、希捷科技涨逾5%、美光科技涨逾4% [2] - 贵金属及基本金属价格走强,现货黄金涨1.9%站上3820美元创历史新高,白银涨超1.7%,纽约铜涨超2.9% [7] 人工智能与科技动态 - OpenAI宣布第三届年度开发者大会将于10月6日举行,预计吸引1500名开发者,并将发布新版Sora视频生成大模型 [6] - Anthropic推出最新AI模型Claude Sonnet 4.5,号称“全球最佳编码模型” [7] - DeepSeek宣布API价格下调超50%,成本降低50%以上,华为、寒武纪芯片同步适配开源 [10][13] - 阿里通义7大模型霸榜全球开源前十,千问Qwen3-Omni登顶 [13] - 摩尔线程首届MUSA开发者大会将于10月30-31日举行 [13] 国内政策与行业支持 - 国家发改委推出规模5000亿元新型政策性金融工具,支持民营企业等深度参与“人工智能+”行动 [13] - 工信部等六部门印发机械行业稳增长方案,目标2025-2026年营业收入年均增速达3.5%,营业收入突破10万亿元 [11][13] - 方案提出加快推进老旧设备更新和技术改造,组织开展“工业母机+”百行万企产需对接活动 [11] - 工信部向中国移动颁发卫星移动通信业务经营许可 [13] 重点行业发展机遇 - 工业母机行业预计新增千亿元级市场需求,2026年智能数控系统市场规模将突破500亿元,AI工艺优化可提升效率30% [11] - 工业母机与人形机器人核心零部件高度重叠,将共享规模效应带来的成本摊薄 [11] - 玻璃基板行业市场规模持续增长,2023年达333亿元,同比增长7.42% [12] - 特斯拉和苹果正探索引入玻璃基板以提升半导体芯片和数据中心性能 [12] - 超导产业实现技术突破,全超导磁体创造35.1特斯拉中心稳态磁场新世界纪录,关键材料、工艺、制备100%自主可控 [14] 上市公司重要公告 - 概伦电子拟21.74亿元购买锐成芯微100%股权及纳能微45.64%股权 [15] - 赛力斯已支付完毕购买华为持有的引望智能10%股权的全部对价 [15] - 富临精工与宁德时代拟共同对子公司江西升华增资扩股,预计构成重大资产重组 [15] - 英联股份预计前三季度净利润3450万元-3750万元,同比增长1531.13%-1672.97% [16] - 大连重工预计前三季度净利润4.74亿元到5.08亿元,同比增长19.91%到28.52% [18] - 盛美上海在手订单总金额为90.72亿元,同比增加34.10% [18]