寒武纪(688256)
搜索文档
DeepSeek新版本API价格下调 寒武纪:对新模型DeepSeek
中国证券报· 2025-09-30 08:09
模型更新与性能优化 - DeepSeek发布实验性版本DeepSeek-V3.2-Exp 引入稀疏注意力机制以提升长文本训练和推理效率 [1] - 新模型服务成本大幅降低 API价格下调超过50% [1] - DeepSeek-V3.2-Exp已在App、网页端和小程序同步更新 [1] 硬件厂商适配与生态支持 - 寒武纪同步适配DeepSeek-V3.2-Exp并开源大模型推理引擎vLLM-MLU源代码 [1] - 寒武纪通过Triton算子开发和BangC融合算子实现快速适配及性能优化 达成业界领先计算效率水平 [2] - 华为昇腾基于vLLM/SGLang推理框架完成DeepSeek-V3.2-Exp的0day支持 并开源所有推理代码和算子实现 [3] - 华为昇腾在CANN平台完成优化适配 在128K长序列下实现TTFT低于2秒、TPOT低于30毫秒的推理性能 [3] 模型迭代历程 - DeepSeek于8月21日发布V3.1版本 并于9月22日更新至Terminus版本 改进语言一致性问题 [3] - Terminus版本针对用户反馈优化 缓解中英文混杂及异常字符情况 [3]
财经早报:事关新型政策性金融工具、人工智能发展等,国家发改委最新回应丨2025年9月30日
新浪证券· 2025-09-30 07:24
宏观经济与政策 - 国家发展改革委表示将持续发力、适时加力实施宏观政策,并加强经济监测预测预警,有信心实现全年目标任务[2] - 新型政策性金融工具规模共5000亿元,全部用于补充项目资本金[2] - “十四五”以来,中国水利建设完成投资连续3年突破万亿元,2024年达到13529亿元,创历史新高,预计“十四五”时期总投资将达到5.4万亿元[9] - 国家税务总局明确平台企业不得以任何形式将自身涉税义务转嫁给平台内从业人员,并将严查变相收费等违法违规行为[4] - 外交部宣布增设“K字签证”以促进中外青年科技人才交流与合作[8] 行业动态与规划 - 工业和信息化部等六部门联合印发《机械行业稳增长工作方案(2025—2026年)》,力争行业营业收入年均增速达到3.5%左右,2026年营业收入突破10万亿元[7] - 电动汽车及电池产业成为中国与北欧国家经贸合作新热点,湖北省累计设立欧资企业775家,利用欧资40亿美元[5][6] - 绿色甲醇需求未来5年或增百倍,多家上市公司已前瞻性布局[13] - 固态电池板块活跃,多家公司披露新进展[13] 公司战略与产品发布 - 国内AI巨头DeepSeek正式发布DeepSeek-V3.2-Exp模型,该模型引入了稀疏注意力机制以优化长文本处理效率,并同步进行API降价[12] - 华为任命余承东为公司产品投资评审委员会主任,内部分析称其将负责公司人工智能战略[12] - 华友钴业子公司与LGES签订《三元前驱体供应协议》[18] - 湖北能源计划在“十五五”期间于襄阳市清洁能源及产业链上下游投资267亿元[18] - 东华科技的西藏扎布耶盐湖绿色综合开发利用万吨电池级碳酸锂项目将正式投产[18] 资本市场与交易 - 9月29日A股主要指数上涨,上证综指涨0.90%至3862.53点,深证成指涨2.05%至13479.49点,创业板指涨2.74%至3238.01点,能源金属、证券、电池等板块涨幅居前[13] - 港股三大指数上涨,恒生指数涨1.89%重回26500点上方,中资券商股涨幅明显[13] - 美股三大股指连续第二个交易日收高,纳指涨0.48%至22591.15点,英伟达推动科技股上涨[14] - 欧股有望连续第三个季度上涨,斯托克欧洲600指数收盘上涨约0.2%[14] - 多家公司发布回购计划,包括中集集团拟回购3亿元—5亿元A股股份,首钢股份拟回购4000万股—8000万股[18] - 中国中车近期合计签订约543.4亿元重大合同[19]
罕见!DeepSeek、寒武纪同步重磅发布
中国基金报· 2025-09-29 23:59
DeepSeek-V3.2-Exp模型发布 - 公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp 该模型在V3.1-Terminus基础上引入稀疏注意力机制 针对长文本训练和推理效率进行探索性优化和验证 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价 欢迎用户体验测试并提供反馈 [1] - 在新的价格政策下 开发者调用DeepSeek API的成本将降低50%以上 目前API的模型版本为DeepSeek-V3.2-Exp 访问方式保持不变 [2] 寒武纪生态适配与合作 - 寒武纪于同日宣布已同步实现对DeepSeek-V3.2-Exp模型的适配 并开源大模型推理引擎vLLM-MLU源代码 开发者可在寒武纪软硬件平台上体验新模型亮点 [2] - 公司高度重视大模型软件生态建设 支持以DeepSeek为代表的所有主流开源大模型 得以快速实现对新模型的day 0适配和优化 [4] - 通过Triton算子开发和BangC融合算子开发实现快速适配与极致性能优化 基于计算与通信的并行策略 再次达成业界领先的计算效率水平 [4] 产业链协同与竞争优势 - 依托DeepSeek-V3.2-Exp的新稀疏注意力机制 叠加寒武纪的极致计算效率 可大幅降低长序列场景下的训推成本 共同为客户提供极具竞争力的软硬件解决方案 [4] - 同步发布适配动作表明中国AI产业链头部公司正在进行深度协同 可能早在模型发布前 寒武纪就在技术方面与DeepSeek进行沟通并启动相关适配研发工作 [5]
罕见!DeepSeek、寒武纪同步重磅发布
中国基金报· 2025-09-29 23:57
DeepSeek-V3.2-Exp模型发布 - 公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp 作为迈向新一代架构的中间步骤 [2] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行探索性优化和验证 [2] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型 [2] API价格调整 - API模型版本更新为DeepSeek-V3.2-Exp 访问方式保持不变 [4] - 在新的价格政策下 开发者调用DeepSeek API的成本将降低50%以上 [4] 寒武纪生态适配 - 寒武纪于同日同步实现对DeepSeek-V3.2-Exp模型的适配 并开源大模型推理引擎vLLM-MLU源代码 [4] - 公司高度重视大模型软件生态建设 支持以DeepSeek为代表的所有主流开源大模型 [6] - 通过长期活跃的生态建设和技术积累 实现了对新模型架构的day 0适配和优化 [6] 技术协同与优化 - 寒武纪重视芯片和算法联合创新 以软硬件协同方式优化大模型部署性能并降低部署成本 [6] - 针对新模型架构通过Triton算子开发实现快速适配 利用BangC融合算子开发实现极致性能优化 [6] - 基于计算与通信的并行策略 再次达成业界领先的计算效率水平 [6] 产业链协同意义 - 同步发布适配动作表明中国AI产业链头部公司正在进行深度协同 [7] - 可能早在模型发布之前 寒武纪就在技术方面与DeepSeek进行沟通并启动相关适配研发工作 [7] - DeepSeek Sparse Attention机制叠加寒武纪的极致计算效率 可大幅降低长序列场景下的训推成本 [6]
罕见!DeepSeek、寒武纪同步发布相关重要事项
中国基金报· 2025-09-29 23:55
DeepSeek-V3.2-Exp模型发布 - 公司于9月29日18:07正式发布DeepSeek-V3.2-Exp实验性模型,该模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [2] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型,同时API价格大幅降低,欢迎用户体验测试并提供反馈意见 [2] - 在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上,目前API模型版本为DeepSeek-V3.2-Exp,访问方式保持不变 [3] 寒武纪技术适配与生态支持 - 寒武纪于9月29日18:11同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码,开发者可在寒武纪软硬件平台第一时间体验新模型亮点 [3][4] - 公司高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型,借助长期活跃的生态建设和技术积累,实现对新模型架构的day 0适配和优化 [4][5] - 寒武纪通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化,基于计算与通信并行策略达成业界领先计算效率水平 [6] 产业链协同与性能优化 - 寒武纪对DeepSeek系列模型进行深入软硬件协同性能优化,达成业界领先算力利用率水平 [6] - 依托DeepSeek-V3.2-Exp的DeepSeek Sparse Attention机制叠加寒武纪极致计算效率,可大幅降低长序列场景下训推成本,共同为客户提供极具竞争力软硬件解决方案 [6] - 同步发布适配动作表明中国AI产业链头部公司进行深度协同,可能早在模型发布前寒武纪就在技术方面与DeepSeek沟通并启动相关适配研发工作 [6]
重磅!全球投资者布局中国新利器
中国基金报· 2025-09-29 22:34
CNQQ ETF产品概况 - 布局中国科技的ETF CNQQ于9月26日在纳斯达克上市 [1] - 该ETF由美国投资机构锐联投资研究发行 [1] - 底层指数为Solactive华夏转型中国科技指数 该指数由Solactive AG与华夏基金合作开发 [1] - ETF致力于为全球投资人提供布局中国科技与创新领域的新敞口 [1] 指数编制方法与特点 - 指数采用非传统的市值加权法 成份股筛选考虑企业3年研发支出占比 [2] - 根据调整后的总市值选择排名前100位的股票 单只成份股权重上限为10% [2] - 指数涵盖近100家在内地和香港上市的中资企业 [2] - 指数涉及汽车与交通运输、商业与消费服务技术、电子与电气产品、医疗健康技术、工业与制造技术以及数字软件技术五大领域 [2] - 前十大重仓股包括阿里巴巴权重10.94%、腾讯控股权重9.93%、宁德时代权重8.00% [4] 中国科技ETF市场竞争格局 - 美国市场上市的中国股票ETF中 规模最大的为KWEB约96亿美元 [3] - MCHI规模约83.4亿美元 FXI规模约69.4亿美元 ASHR规模22.8亿美元 CQQQ规模21.1亿美元 [3] - 中国香港科技行业基金与中国内地科技行业基金年初以来资金流入幅度在所有单一市场行业基金中分列第一与第七 [8] - 中国香港科技基金已连续13周录得资金净流入 [8] 市场资金流向与投资者情绪 - 截至9月17日的一周 新兴市场股票基金录得今年第二大资金流入 金额达76亿美元 [8] - 中国股票基金在过去五周中有四周实现资金净流入 [8] - 美国科技行业基金年内已累计流出近20亿美元 [8] - 欧洲工业行业基金年初至今资金流入已超70亿美元 为基金资产的470% 在全部行业基金中排名第三 [9] 机构对中国科技板块观点 - 摩根士丹利表示政策醒了、企业醒了、资金醒了 [5] - 2024年6月之后 中国上市公司企业盈利逐渐改善 [5] - 金融、互联网板块、硬核科技、制药、原材料、高端制造、自动化等行业绝大部分上市公司盈利预期调整呈现乐观态势 [5] - 海外投资者对中国的关注聚焦人工智能、创新药等领域 [7]
DeepSeek大模型V3.2亮相!华为、寒武纪芯片同步适配开源,首次自研DSA注意力机制,API价格砍半
华尔街见闻· 2025-09-29 21:53
模型发布与核心特性 - DeepSeek-V3-2-Exp模型于9月29日在Hugging Face平台正式发布并开源[1] - 该版本引入了自研的DeepSeek Sparse Attention稀疏注意力机制,旨在优化长文本训练和推理效率[1] - 新架构能够降低计算资源消耗并提升模型推理效率,华为和寒武纪已完成适配,最大支持160K长序列上下文长度[1] 技术性能评估 - 模型训练设置与前代V3-1-Terminus严格对齐,在各大公开评测集上的表现与V3-1-Terminus基本持平[3] - 在多项基准测试中表现稳定:MMLU-Pro保持85.0分,GPQA-Diamond从80.7微降至79.9,Codeforces-Div1从2046提升至2121[4] - 在AIME 2025数学测试中从88.4提升至89.3,但在HMMT 2025中从86.1降至83.6[4] 商业化与成本优化 - 官方API价格大幅下调超过50%,新价格已即刻生效[4] - 官方App、网页端和小程序均已同步更新至DeepSeek-V3-2-Exp版本[4] - 为便于开发者对比,V3-1-Terminus版本的API访问接口将保留至2025年10月15日,调用价格与V3-2-Exp保持一致[6] 开源生态与产业合作 - 模型在Huggingface和ModelScope平台全面开源,相关论文同步公开[6] - 开源新模型研究中设计的GPU算子,包括TileLang和CUDA两种版本[6] - 寒武纪在模型发布同时宣布完成适配,并开源vLLM-MLU推理引擎源代码,表明双方技术协作早已展开[6][7]
DeepSeek新模型正式发布!寒武纪已实现适配
上海证券报· 2025-09-29 21:28
模型发布与技术升级 - DeepSeek于9月29日正式发布DeepSeek-V3.2-Exp模型,该模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证[1] - 9月22日晚DeepSeek线上模型升级至DeepSeek-V3.1-Terminus版本,8月21日发布的DeepSeek-V3.1实现混合推理架构,同时支持思考模式与非思考模式,具备更高思考效率和更强Agent能力[2] - DeepSeek-V3.1使用UE8M0 FP8参数精度,专门针对即将发布的下一代国产芯片设计[2] 产品服务与市场策略 - DeepSeek官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,新价格政策下开发者调用DeepSeek API成本将降低50%以上[1] - 9月29日更早时候,DeepSeek在开源社区平台Huggingface上架DeepSeep V3.2-base页面但很快删除[1] 行业合作与生态建设 - 寒武纪于9月29日晚宣布已同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码,开发者可在寒武纪软硬件平台体验新模型[1] - 智谱新模型GLM-4.6也将于近日发布,目前已可通过API接口调用[1] 市场反应与行业影响 - DeepSeek-V3.1使用UE8M0 FP8参数精度消息公布后,当日DeepSeek概念板块火热,不少国产芯片产业链企业股价大涨[2]
DeepSeek,新版本
中国证券报· 2025-09-29 20:39
DeepSeek-V3.2-Exp模型发布 - 9月29日DeepSeek发布实验性版本DeepSeek-V3.2-Exp 在V3.1-Terminus基础上引入稀疏注意力机制以优化长文本训练和推理效率 [1] - 新模型服务成本大幅降低使API价格下调超过50% 所有终端平台同步更新 [1] - 华为昇腾实现0day支持并开源推理代码 在128K长序列下保持TTFT低于2秒和TPOT低于30毫秒的推理性能 [3] 寒武纪适配与优化进展 - 寒武纪同步适配DeepSeek-V3.2-Exp并开源vLLM-MLU推理引擎源代码 支持开发者在其软硬件平台体验新模型 [1] - 通过Triton算子开发和BangC融合算子实现快速适配与性能优化 达成业界领先计算效率水平 [2] - 长期支持主流开源大模型生态 此前对DeepSeek系列已实现业界领先算力利用率 [2] 华为昇腾技术部署 - 基于vLLM/SGLang推理框架完成适配部署 开源所有推理代码和算子实现 [3] - 在CANN平台完成BF16模型优化适配 采用大EP并行方案与CP并行策略兼顾时延和吞吐 [3] DeepSeek模型迭代历程 - 8月21日发布DeepSeek-V3.1 9月22日升级至Terminus版本 改进语言一致性问题并缓解中英文混杂及异常字符情况 [3]
强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码
金十数据· 2025-09-29 19:29
产品发布 - 深度求索公司于2025年9月29日发布新一代模型架构DeepSeek-V3.2 实验性版本 该版本在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行探索性优化和验证 [1] - 新模型体量达到671GB 在带宽充足理想条件下仅完成下载就需要耗费约8-10个小时 [2] - 官方App 网页端 小程序均已同步更新为DeepSeek-V3.2-Exp 同时API大幅降价 [1] 技术合作 - 寒武纪同步官宣对DeepSeek-V3.2适配并开源大模型推理引擎vLLM-MLU源代码 [1] - 芯片与大模型适配涉及底层架构优化 算力资源匹配 兼容性调试等复杂工作 需要较长时间完成 [2] - 快速适配响应表明寒武纪在模型发布前就已启动适配研发 双方技术沟通与协作早已展开 [2] 行业影响 - 此次合作体现中国顶尖科技企业深度协同的重要信号 是产业链上下游领军企业的深度协同 [2] - 合作将大幅降低大模型用户在长序列场景下的训推成本 助力AI应用涌现 [2] - 全球AI竞争日趋激烈 中国AI产业需要头部企业深度协同合作才能在国际舞台站稳脚跟并占据优势地位 [2] 开发者资源 - DeepSeek开源模型可通过https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp获取 [3] - vLLM-MLU适配源码可通过https://github.com/Cambricon/vllm-mlu获取 [3]