Workflow
Seek .(SKLTY)
icon
搜索文档
DeepSeek与国产芯片的“双向奔赴”
21世纪经济报道· 2025-10-01 07:14
模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型,实验性引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率 [1] - 新模型发布后,公司同步更新官方App、网页端及小程序,并全面下调API价格,降幅在50%到75%不等 [1] - V3.2-Exp版本在V3.1-Terminus基础上引入稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [7] 国产芯片生态协同 - 新模型发布后4分钟内,寒武纪率先宣布适配DeepSeek-V3.2-Exp,并开源大模型推理引擎vLLM-MLU源代码 [2] - 华为昇腾基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp的0day支持,并向开发者开源所有推理代码和算子实现 [2] - 海光信息表示其DCU已实现对DeepSeek-V3.2-Exp的无缝适配和深度调优,新模型在海光DCU上展现出优异性能 [2] 行业标准与生态建设 - 深度求索公司通过发布DeepSeek-V3.1版本,明确模型将适配下一代“UE8M0”浮点格式的国产芯片,为国产芯片发展指明方向 [6] - 业内高管认为,应由DeepSeek定义国产芯片标准,让芯片厂商跟进,而非让模型去适配芯片,DeepSeek已成为国产开源模型的标杆 [2][5] - 中国本土AI行业对DeepSeek模型的高度共识,使深度求索公司敢于先行先试,组建国产芯片生态 [7] 技术创新与工具链 - DeepSeek-V3.2-Exp采用的稀疏注意力机制,疑似基于深度求索公司今年2月发表论文中的原创机制,公司CEO梁文锋位列作者名单 [7] - 模型在兼容CUDA基础上,使用专为AI算子开发设计的编程语言TileLang进行快速原型开发,该语言由北京大学团队主导开发并于2025年1月开源 [7][8] 云计算厂商的生态参与 - 腾讯云于9月16日宣布已全面适配主流国产芯片,并积极参与开源社区建设 [8] - 阿里云在云栖大会表示推动“一云多芯”战略,验证并深度适配多家国产AI芯片,将其纳入自身算力底座 [8] - 相比英伟达用二十年建立生态,DeepSeek用了不到一年时间飞速完成初步生态追赶 [8]
赋能的美妙:DeepSeek开源背后的商业野心和生态架构
搜狐财经· 2025-10-01 02:48
核心商业模式 - 通过开源AI模型和工具吸引开发者,建立生态,再通过技术支持、私有化部署和API市场分成实现商业转化 [2][3] - 为有更高要求的大企业提供收费的企业级服务,如私有化部署,目前至少98家央企已完成模型部署 [4] - 与硬件厂商和云服务商合作,通过技术分成实现高利润,成本利润率最高可达500%以上 [5][6] 生态构建与行业影响 - 开源策略大幅降低行业准入门槛,使AI应用开发从“重资产投入”转向“轻资产运营”,帮助下游客户以数万至十几万的费用获得过去需百万级定制的能力 [2] - 开源模型在HuggingFace累计下载量超千万次,通过“积分换算力”等机制激励开发者贡献,反哺公司积累行业数据和技术迭代资源 [3] - 开源加剧全球AI模型竞争,迫使闭源巨头如OpenAI在2024至2025年间多轮显著下调API价格,推动技术普及与价格普惠 [9] 技术协同与战略目标 - 与华为昇腾等国产芯片厂商深度技术协同,通过底层优化提升国产芯片推理性能,部分场景下直追英伟达H100,助力国产算力在关键领域规模化落地 [8] - 目标在于改变AI行业玩法,通过赋能构建生态优势,确立“基于DeepSeek技术=高效、低成本”的市场认知,形成难以复制的竞争力 [7][12] - 并非简单开源,而是通过严格的内容审核、安全协议和合规框架构建“护城河”,以开放能力换取生态主导权和可持续长期回报 [13]
智通港股解盘 | 有色金属迈出六亲不认的步伐 DeepSeek再度催化AI
智通财经· 2025-09-30 20:16
港股市场表现 - 恒生指数上涨0.87%至26855点,接近27000点大关 [1] - 有色金属板块表现强势,中国中冶大涨超10%,中国有色矿业、洛阳钼业、江西铜业、赣锋锂业、天齐锂业等均有上涨 [3] - 科技股持续发酵,华虹半导体大涨近11%,商汤上涨超5%,中芯国际涨近4% [3] - AI应用端公司涨幅显著,医渡科技、汇量科技、第四范式等均涨超10%,快手-W涨超7% [4] - 存储芯片供应商宣布涨价,三星电子LPDDR产品价格上升15~30%,美光产品涨幅达20%以上,上海复旦涨超6% [4] - 特斯拉概念股三花智控涨超6%,机器人概念股优必选涨近9% [5] 新股上市表现 - 紫金黄金国际上市首日收于120.6港元,较发行价71.59港元上涨68%,募资总额约250亿港元,为全球黄金开采行业规模最大IPO [6] - 博泰车联上市首日收于157港元,较发行价102.23港元上涨53% [7] - 西普尼上市首日收于106港元,较发行价29.6港元大涨268% [7] 行业动态与公司业绩 - DeepSeek发布V3.2-Exp大模型,训练效率提升,API输入/输出价格降低50%/70%以上 [4] - 特斯拉计划2025年底推出第三代机器人,2030年前目标年产100万台,董事会向马斯克授予最多4.237亿股限制性股票 [5] - 苹果iPhone17系列需求强劲,Pro和ProMax交货周期维持高位,平均交货周期仅缩短2天,远慢于去年 [8] - 哔哩哔哩第二季度营收73.4亿元,同比增长20%,净利润2.2亿元,去年同期亏损6.1亿元 [10] - 哔哩哔哩移动游戏业务上半年收入达33.4亿元,同比增长68.0%,主要得益于《三国:谋定天下》的出色表现 [11] - 哔哩哔哩2025年第一季度平台DAU和MAU达1.07亿/3.68亿,用户日均使用时长108分钟,公司大会员数超2350万人 [11][12]
DeepSeek 与国产芯片开启“双向奔赴”
21世纪经济报道· 2025-09-30 20:13
模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型,实验性引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率 [1] - 得益于技术创新,公司官方App、网页端、小程序同步更新为新模型,并全面下调API价格,降幅在50%到75%不等 [1] - 新版本在V3.1-Terminus基础上引入稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证,所采用机制疑似基于公司2025年2月发表论文中的原创机制 [5] 国产芯片生态协同 - V3.2-Exp版本发布后几乎零时差引发华为昇腾、寒武纪、海光等国产芯片厂商“认领”适配,标志着国产AI软硬件生态协同初具雏形 [1][2] - 寒武纪在模型发布后4分钟即宣布同步完成适配并开源大模型推理引擎vLLM-MLU源代码,华为昇腾表示基于vLLM/SGLang等框架完成0day支持并开源所有推理代码和算子实现,海光信息称其DCU实现无缝适配加深度调优 [2] - 深度求索已成为新的生态建设者,其模型获得国产推理模型大部分份额,成为国产开源模型标杆,由公司定义国产芯片标准或组建生态被视为更合适做法 [2][3] 技术路线与生态发展 - 公司模型在兼容CUDA基础上,使用专为AI算子开发设计的编程语言TileLang进行快速原型开发,该语言由北京大学团队主导开发并于2025年1月开源 [5][6] - 8月下旬发布的V3.1版本明确模型将适配下一代“UE8M0”浮点格式国产芯片,为国产芯片发展指明方向,尽管当时未有企业认领此格式 [4] - 中国本土AI行业对DeepSeek模型形成高度共识,腾讯云、阿里巴巴等云计算大厂积极适配国产芯片并参与开源社区建设,推动“一云多芯”战略 [6] - 相比英伟达用二十年建立生态,DeepSeek用了不到一年时间飞速完成初步生态追赶,业界认为2025年国产芯片发展迅速归功于DeepSeek的横空出世 [3][6]
DeepSeek-V3.2上线国家超算互联网 开发者可免费下载
搜狐财经· 2025-09-30 19:58
模型发布与技术进展 - DeepSeek于9月29日正式发布实验性模型DeepSeek-V3.2-Exp [1] - 新模型在V3.1-Terminus基础上引入DeepSeekSparseAttention稀疏注意力机制 [1] - 该技术针对长文本训练和推理效率进行探索性优化验证 [1] - DeepSeekSparseAttention首次实现细粒度稀疏注意力机制 [1] - 新技术在几乎不影响模型输出效果前提下大幅提升长文本训练和推理效率 [1] 平台接入与开发者服务 - DeepSeek-V3.2-Exp于9月30日上线国家超算互联网AI社区 [1] - 模型依托国产深算智能加速卡及全国一体化算力网运行 [1] - 企业和开发者均可在AI社区免费下载模型文件进行快速开发 [1] - 超算互联网AI社区已汇聚700余款国内外优质开源模型 [2] - 平台提供API调用、Chatbot在线推理对话、国产大模型分布式训练及微调等MaaS服务 [2]
DeepSeek,与国产芯片开启“双向奔赴”
21世纪经济报道· 2025-09-30 19:52
模型发布与技术更新 - 深度求索公司于9月29日晚间发布DeepSeek-V3.2-Exp模型,实验性地引入DeepSeek Sparse Attention稀疏注意力机制,显著降低计算资源消耗并提升推理效率 [1] - 新模型在V3.1-Terminus基础上引入稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证,所采用机制疑似基于公司2025年2月论文中的原创机制 [6] - 公司同步更新官方App、网页端、小程序至新模型,并全面下调API价格,降幅在50%到75%不等 [1] 国产芯片生态协同 - 新版模型发布后迅速获得寒武纪、华为昇腾、海光信息等国产芯片厂商适配,寒武纪在4分钟内率先宣布适配并开源大模型推理引擎vLLM-MLU源代码 [2] - 华为昇腾基于vLLM/SGLang等推理框架完成适配部署,实现0day支持并向开发者开源所有推理代码和算子实现 [2] - 海光信息表示其DCU已实现对模型的无缝适配和深度调优,验证了海光DCU高通用性、高生态兼容度及自主可控的技术优势 [2] 行业标准与生态建设 - DeepSeek已获得国产推理模型大部分份额,成为国产开源模型标杆,行业认为由深度求索定义国产芯片标准或组建国产芯片生态更为合适 [2] - 相比英伟达用二十年建立生态,DeepSeek用了不到一年时间飞速完成初步生态追赶,腾讯云、阿里巴巴等云厂商积极适配国产芯片并参与开源社区建设 [7] - 公司模型在兼容CUDA基础上使用专为AI算子开发设计的编程语言TileLang进行快速原型开发,该语言由北京大学团队主导开发并于2025年1月开源 [6] 技术发展路径 - DeepSeek-V3.1版本明确模型将适配下一代“UE8M0”浮点格式国产芯片,为国产芯片发展指明方向,但当时未有企业主动认领该格式 [5] - 业内专家认为发展顺序应是DeepSeek先定义国产芯片标准,让芯片厂商跟进,而非让模型去适配芯片 [3] - 国产芯片行业本质是“Know-How”行业,只要业界形成共识,芯片与算力生态围绕标准发展的进度将会异常快捷 [3]
PPIO首发上线DeepSeek-V3.2-Exp
证券日报网· 2025-09-30 14:17
模型技术更新 - DeepSeek发布新版本模型DeepSeek-V3-2-Exp 该模型在V3-1-Terminus基础上引入DeepSeek稀疏注意力机制 旨在优化长上下文场景下的训练和推理效率 [1] - 新模型架构在提升训练推理效率的同时 实现了API价格的大幅下降 [1] 产品定价与成本 - PPIO平台对DeepSeek-V3-2-Exp的定价为每百万输入tokens 2元 每百万输出tokens 3元 [1] - 新定价使开发者调用DeepSeek API的成本降低75% [1] 平台服务能力 - PPIO是致力于为企业及开发者提供高性能API的服务平台 拥有丰富的开源模型"超市" [2] - 平台已上线DeepSeek R1/V3、DeepSeek-Prover-V2-671B、MiniMax、Qwen等系列模型 支持仅需一行代码即可调用 [2] - 根据《2025大模型服务性能排行榜》 PPIO在DeepSeek-R1-0528的吞吐测试中排名第一 [2] - 公司通过2024年实践 已实现大模型推理的10倍以上降本 达成推理效率与资源使用的动态平衡 [2]
国产算力适配DeepSeek新模型,AI概念股集体拉升
21世纪经济报道· 2025-09-30 11:44
AI概念股市场表现 - 9月30日早盘AI相关概念股集体拉升,主要分为AI语料和半导体硬件两个方向 [1] - AI语料方向整体上涨2.10%至1353.894点,当虹科技20CM涨停,开普云涨9.72%,拓尔思涨6.51%,值得买涨6.49% [1][2] - 半导体硬件方向整体上涨1.45%至12404.781点,德明利涨停,江波龙涨9.38%,联芸科技涨7.94%,寒武纪等跟涨 [1][3] 关键公司股价变动 - 当虹科技最新价61.32元,涨幅20.00% [2] - 开普云最新价213.85元,涨幅9.72% [2] - 拓尔思最新价22.59元,涨幅6.51% [2] - 德明利最新价204.69元,涨幅10.00% [3] - 江波龙最新价162.28元,涨幅9.38% [3] - 寒武纪-U最新价1370.72元,涨幅3.57% [4] 行业催化剂 - DeepSeek于9月29日晚宣布官方App、网页端、小程序同步更新为DeepSeek-V3.2-Exp,API价格下调使开发者调用成本降低50%以上 [4] - 多家国产芯片厂商宣布完成对DeepSeek-V3.2-Exp的适配,包括寒武纪开源大模型推理引擎vLLM-MLU源代码 [5] - 华为昇腾实现DeepSeek-V3.2-Exp 0day支持并开源推理代码,海光信息宣布该模型在海光DCU上展现优异性能 [5] 机构观点 - 华鑫证券认为国产AI芯片大时代来临,产业链从上游先进制程到下游模型加速迭代已实现全产业链打通 [5] - 中银证券分析AI应用商业化拐点临近,应用端商业化加速催化算力需求,国产算力迎来重要产业突破 [5] - 中信证券预计2025Q3计算机板块收入稳健增长,算力方向保持高景气度,应用领域拐点已至 [6]
DeepSeek发新模型;库克确认持有加密货币丨科技风向标
21世纪经济报道· 2025-09-30 11:07
AI大模型行业动态 - DeepSeek发布V3 2 Exp模型并同步更新官方应用 API调用成本降低50%以上 [2] - 华为云和寒武纪已完成对DeepSeek-V3 2-Exp模型的适配工作 [2] - 智谱新模型GLM-4 6预计近日发布 目前已可通过API接口调用 [2] - 阿里通义7款模型入选Hugging Face全球前十开源模型榜单 其中Qwen3-Omni登顶 [5] - 阿里通义Qwen3-Omni为全模态大模型 音视频能力获32项开源最佳性能SOTA 可处理文本图片语音视频四种数据 [5] - 阿里通义共开源300多个模型 全球下载量突破6亿次 衍生模型超17万个 位居全球第一 [5] - 寒武纪实现对DeepSeek-V3 2-Exp的适配并开源大模型推理引擎vLLM-MLU源代码 [12] - 华为昇腾基于vLLM/SGLang等推理框架完成DeepSeek-V3 2-Exp适配部署 实现0day支持并开源推理代码和算子实现 [13] 科技巨头战略动向 - 苹果CEO库克确认个人持有比特币和以太币等加密货币 但表示苹果公司不会接受加密货币支付或投资加密货币 [3] - 华为任命余承东为公司产品投资评审委员会主任 其仍担任常务董事和终端BG董事长 掌管终端和鸿蒙智行业务 [6] - 小米集团表示小米17系列没有削减订单计划 因新增标准版16GB+1TB版本及Pro系列加单 整体订单较上一代增加 [8][9] - 美团无人机在深圳上线夜间配送服务 为国内首次将无人机融入夜间即时零售场景 平均配送时长约15分钟效率提升近100% [19] - 美团无人机自2021年常态化运营以来累计完成超60万单外卖配送 夜间服务将率先覆盖深圳公园等夜间热点区域 [19] - OpenAI在ChatGPT中推出家长控制功能 允许家长关联青少年账户并进行自定义设置 [20] 企业合作与资本运作 - 赛力斯全资子公司支付完毕115亿元对价 收购华为持有的引望智能10%股权 [4] - 赛力斯公布2025年半年度利润分配预案 每10股派现3 10元 合计派发现金红利5 06亿元 占上半年归母净利润17 22% [14] - 赛力斯上半年归母净利润29 41亿元 同比增长81 03% 问界汽车上半年累计交付超14 7万辆 [14] - 宁德时代与海口市龙华区政府签约 计划至2030年在海南投资建设100座换电站 实现核心城区10分钟找站 [10] - 斯年智驾完成数亿元B+轮融资 资金将用于无人驾驶产品研发和市场开拓 [16] - 灵猴机器人完成超亿元A轮融资 资金将用于工业自动化及机器人核心零部件研发实验室建设和产能扩充 [17][18] 政策与行业标准 - 国家税务总局重申平台企业不得转嫁涉税义务 将严查向外卖员快递员等变相收费行为 [7] - 税务部门明确月收入低于6250元的从业人员无需预扣税款以保护其合法权益 [7] - 我国发布首项个人信息跨境安全管理国家标准《数据安全技术个人信息跨境处理活动安全认证要求》 将于2026年3月1日实施 [11] 上市公司业绩 - 英联股份预计2025年前三季度归母净利润3450万元至3750万元 同比增长1531 13%至1672 97% [15] - 英联股份业绩增长主要得益于快消品金属包装易开盖板块贡献 市场占有率提升及降本增效 [15] - 公司复合集流体项目已进入规模化应用关键时期 [15]
DeepSeek突然拥抱国产GPU语言,TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配
36氪· 2025-09-30 10:52
TileLang技术特性 - TileLang是一种专门用于开发GPU内核的领域专用语言,性能可对标英伟达CUDA,采用Python式语法并在TVM之上构建编译器基础架构[4][13] - 其核心设计理念是将调度空间与数据流解耦并封装为可自定义的注解和原语,以Tile作为编程模型核心概念,直观控制数据在全局内存、共享内存和寄存器间的流动[15] - 提供三个层次编程接口:硬件无关的高层接口供初学者使用,包含预定义优化操作的Tile Library供有经验开发者使用,以及允许直接操作线程同步等底层特性的线程原语供专家用户使用[15] 性能优势与效率提升 - 使用TileLang只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现[3] - 在FlashAttention算子开发中,代码量从500多行减少至80行,并保持与官方版本持平的性能[5] - 在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当[21] 行业生态适配与合作 - TileLang与国产算力生态适配,华为昇腾在第一时间公告对TileLang的支持[4] - 沐曦集成电路的高级总监董兆华与TileLang团队成员共同讨论沐曦GPU与TileLang的适配[5] - 该语言由北大团队主导开发,核心人物包括王磊、董宇骐以及北大计算机学院副研究员、博士生导师杨智[9] DeepSeek与TileLang的合作关系 - DeepSeek在v3.2中开源TileLang版本算子,其受关注程度超过新稀疏注意力机制DSA[1] - DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能,v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制运行速度远超传统实现[17] - DeepSeek v3.2验证了TileLang确实可以用来训练模型,TileLang发起人王磊发帖致敬DeepSeek敢于使用新编程语言开发核心产品[23]