华为昇腾950
搜索文档
高盛:DeepSeek V4对中国AI意味着什么?
华尔街见闻· 2026-04-26 18:43
DeepSeek V4模型的技术突破与效率提升 - 核心意义在于以更低成本支持更复杂的智能体应用落地,从而打开AI应用规模化的新空间 [1] - 通过架构升级实现长上下文窗口的大幅降本,在100万词元场景下,V4 Pro的单词元推理所需浮点运算量仅为V3.2的27%,KV缓存占用仅为10% [1][3] - V4 Flash版本效率更优,单词元推理所需浮点运算量降至V3.2的10%,KV缓存压缩至7% [3] - 效率跃升依托三项关键架构创新:引入压缩稀疏注意力与重度压缩注意力的混合架构、引入mHC机制增强训练稳定性、采用Muon作为主训练优化器 [4][5] - 上述效率增益对需要处理大量上下文的长周期代理任务意义尤为显著 [6] 明确的国产芯片战略与成本路径 - 明确押注华为国产芯片,将华为昇腾950超级节点的量产纳入其商业路径 [1][7] - 预计随着华为Ascend 950超级节点在2026年下半年实现大规模供货,V4 Pro版本的API定价将迎来显著下降 [8] - 此举将强化公司的成本竞争力,并为更广泛的应用落地创造条件,同时中国顶尖AI模型向国产算力迁移的趋势得到头部玩家的明确背书 [9] 中国AI模型竞争格局与差异化 - V4的开源发布加速了中国AI模型竞争的白热化,近期竞相推出新模型的玩家包括Kimi、阿里巴巴、腾讯、小米及MiniMax等 [11] - 未来决定各模型定价权的关键差异化因素将集中在编程/任务完成成功率与多模态能力 [12] - 独立AI玩家(如MiniMax)组织效率高、决策链路短,即使基础文本API定价极低,仍能实现40%的毛利率 [13] - 互联网大厂(如字节、腾讯、阿里)核心业务现金流充沛,更适合布局AI基础设施与云赛道,并已设置独立激励方案留存人才 [14] - 腾讯和阿里巴巴正在洽谈以逾200亿美元估值投资DeepSeek,折射出巨头对稀缺顶层AI能力的争夺逻辑 [15] 高盛看好的投资赛道与核心逻辑 - 维持对云计算与数据中心板块的推荐评级,认为这是中国互联网首选子赛道 [1][16] - 核心逻辑在于:AI词元需求的持续增长将驱动云服务采购量上升;企业客户与AI代理的增长正推动云服务定价能力改善;消费级AI助手的持续渗透贡献增量需求 [17] - 在To-B企业云市场,阿里巴巴以最大外部AI云营收规模领跑;在To-C消费市场,字节跳动是AI聊天机器人日均词元用量最大的平台 [18] - 中国AIGC应用的日活跃用户整体保持强劲增长,2026年3月环比增速高达36% [18] - 重点推荐万国数据、世纪互联、阿里巴巴和金山云四只核心标的,作为把握中国AI基础设施扩张红利的核心配置方向 [19]
炸穿天际!美部长急疯了:中国死活不买英伟达,死磕自研要掀桌子
新浪财经· 2026-04-24 23:27
美国对华芯片出口政策与市场反应 - 美国商务部长在国会听证会上承认,中国在2026年第一季度未购买任何英伟达H200芯片 [1] - 美国于2026年1月批准H200对华出口,但中国在随后三个月内订单为零 [1] - 美方在出口芯片时附加了包括25%的销售分成、数量限制、技术检查及使用监控在内的严苛条件 [1] 中国半导体产业的自主发展 - 中国科研团队于2026年4月10日突破二维半导体材料瓶颈,实现了亚5纳米技术的落地 [1] - 国民技术于2026年4月22日发布1.6T光模块主控芯片,打破了海外垄断 [1] - 华为昇腾950芯片即将推出,其算力已接近并在部分领域超越英伟达H200 [1] - 中国半导体产业已在材料、设计、制造、设备和软件等全产业链环节取得进展 [1] 中国市场的战略转向与行业影响 - 中国停止购买英伟达芯片是基于战略自信,旨在将资金投入国产芯片研发 [1] - 行业观点认为,美国的技术封锁反而推动了中国半导体产业的自立与逆袭 [1] - 2026年被部分观点视为中国芯片产业实现突破的关键年份 [1]
DeepSeek和Kimi前后亮剑,联手撕开美国巨头护城河
财联社· 2026-04-24 20:13
中国AI大模型技术协同突破 - 一周内,中国头部AI公司DeepSeek与月之暗面(Kimi)相继发布并开源其旗舰模型DeepSeek-V4和Kimi K2.6,这标志着中国大模型产业正式进入向全球AI技术制高点集体冲锋的全新阶段,旨在协同挑战GPT、Claude、Gemini等美国闭源大模型巨头 [1] - 两家公司的技术突破形成了极强的互补协同效应,DeepSeek-V4聚焦于提升基础模型的核心能力,筑牢了全球开源大模型的性能天花板,而Kimi K2.6则深耕Agent工程化落地,解决长程自主执行的产业痛点,二者“一基一用”,共同构筑起中国大模型的技术护城河 [12] DeepSeek-V4模型核心性能 - DeepSeek-V4系列模型实现了基础能力的全方位突破,核心性能领跑全球开源领域,其搭载百万字超长上下文能力,并在Agent能力、世界知识储备、推理性能三大核心维度实现跨越式升级 [2] - 在Agent能力上,DeepSeek-V4-Pro相比前代模型实现质的飞跃,已成为公司内部员工主力使用的Agentic Coding模型,实测使用体验优于Claude Sonnet 4.5,交付质量已接近Claude Opus 4.6的非思考模式 [2] - 在硬核推理性能上,该模型在数学、STEM、竞赛型代码等专业测评中,超越了所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩 [2] Kimi K2.6模型核心性能 - Kimi K2.6模型在长程复杂任务执行与Agent工程化落地上取得突破性表现,率先实现了对海外闭源旗舰模型的局部赶超 [3] - 在最具产业价值的Agent调度能力上,Kimi K2.6可原生支持最多300个子Agent的派发、调度与结果归并,稳定完成4000步协同任务,调度上限较前代模型提升三倍,并可支持最长5天的持续自主运行,突破了大模型长程任务执行的瓶颈 [3] - 在全球权威基准测试中,Kimi K2.6表现持平或优于GPT-5.4、Claude Opus 4.6和Gemini 3.1 Pro等全球顶尖闭源模型,成为在HLE(含工具)和SWE-Bench Pro两大核心工程化基准上,同时超越三家海外闭源旗舰的开源权重模型 [3] 国产算力适配与突破 - 国产大模型开始战略性向国产算力底座迁移,DeepSeek-V4与华为昇腾950实现“顶级开源模型+头部国产芯片”的强强联合,这是DeepSeek首次在正式文档中将华为昇腾NPU与英伟达GPU并列写入硬件验证清单 [6] - 华为昇腾950通过技术优化,单卡推理性能达到英伟达H20的2.87倍,公司预计在下半年昇腾950超节点批量上市后,V4-Pro版本价格将大幅下调,公司还刻意将早期硬件访问权限优先授予华为等国产芯片厂商 [6] - Kimi K2.6的技术突破提供了另一套弹性思路,其发布的《Prefill-as-a-Service》论文显示,来自谷歌、亚马逊、华为及阿里平头哥等更多类型的芯片可切实用于大语言模型推理,通过分离预填充与解码阶段,有望推动异构计算规模化落地,为国产芯片大规模参与模型推理打开大门 [7] - DeepSeek与Kimi在国产算力上的布局形成互补,一个做“深”,将单一国产芯片潜力压榨到极致,另一个做“广”,让尽可能多的国产芯片参与推理 [7] 行业影响与全球地位 - 硅谷顶级风投的数据显示,美国创业者路演中使用中国开源AI模型的比例已高达80%,Hugging Face CEO也强调中国开源模型正在成为全球AI技术栈的最大力量 [12] - DeepSeek和Kimi的轮番发布,不仅展示了模型参数和评测分数的提升,更是一种宣言,表明中国开源力量已经具备了从跟随者变为规则制定者的底气 [12]