Ascend 910B芯片

搜索文档
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 20:25
今天大家都在谈MS的这篇DeepSeek R2分析的报告,提前曝光了R2的性能和参数,我们简单总结一 下这个报告的核心内容: DeepSeek R2 使用了多达 1.2 万亿个参数,采用了新颖的架构,实现了运行成本的显著降低。其采用 混合专家混合(MoE)架构,有 780 亿个活跃参数。 并且R2 使用华为的 Ascend 910B 芯片进行训练,而非 NVIDIA 的芯片。 R2 增强了多语言覆盖能 力,能流畅处理非英语语言;扩展了强化学习,利用更大的数据集,使模型能够进行更具逻辑性和 更像人类的推理;增加了多模态功能,能够处理文本、图像、语音和视频数据;实现了推理时的缩 放,通过采用通用奖励模型(GRM),在推理过程中增加计算资源,从而提高了输出质量。 R2 具有高成本效益,输入成本为每百万代币 0.07 美元,输出成本为每百万代币 0.27 美元,而 R1 的 输入成本为 0.15-0.16 美元,输出成本为 2.19 美元。 由于这篇报告讲的人已经很多了,我们就不赘述了,而且报告也放到了星球中,有兴趣的朋友可以 到星球中看原文。 今天这篇文章来看另一篇AI的分析,Artificial Analysis ...
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 20:25
DeepSeek R2分析 - 采用1.2万亿参数混合专家架构(MoE),活跃参数达780亿,显著降低运行成本[1] - 使用华为Ascend 910B芯片训练,非NVIDIA方案[1] - 多语言处理能力增强,支持文本、图像、语音和视频多模态功能[1] - 推理成本优化:输入成本降至每百万代币0.07美元(R1为0.15-0.16美元),输出成本0.27美元(R1为2.19美元)[1] 2025年AI六大趋势 1 AI持续进步 - OpenAI的o4-mini和o3、Google Gemini 2.5 Pro、xAI Grok 3领跑智能水平,开源模型如DeepSeek R1接近专有模型性能[3] - Google通过TPU加速器至Gemini模型的垂直整合形成优势[3] 2 中国AI崛起 - DeepSeek、阿里巴巴等中国实验室开源模型智能水平媲美美国,缩小全球竞争差距[4] 3 推理模型 - 通过生成中间token提升逻辑性,Gemini 2.5 Pro可解决复杂问题如蒙提霍尔问题,非推理模型GPT-40因简化处理而错误[5] 4 AI代理 - 多LLM串联实现端到端任务自主处理,减少人工干预[6] 5 效率与MoE架构 - 小模型智能提升+硬件迭代推动推理成本下降,MoE架构通过部分参数激活提高效率[7] 6 多模态AI - **图像生成**:GPT-40设视觉质量标杆,Google Veo 2超越OpenAI Sora[8] - **语音处理**:OpenAI和ElevenLabs领跑语音转文本,MiniMax Speech-02-HD接近人类对话水平[9] 竞争格局与基准 - 开源模型(DeepSeek R1、Meta Llama 3.1)与专有模型(o4-mini、Gemini 2.5 Pro)智能差距缩小[14] - 美国与中国实验室竞争加剧,模型发布周期缩短至3个月[14] - 推理模型在Artificial Analysis智能指数(MMLU-Pro等7项评估)中表现更优,但消耗更多token[21][31] 成本与架构 - 高性能模型推理价格持续下降,DeepSeek R1成本显著低于前代[34] - MoE架构模型(如DeepSeek R1)在效率与性能平衡上优于密集架构[36] 产业链关键玩家 - **基础模型**:OpenAI、Google、DeepSeek、阿里巴巴[16] - **多模态领域**:OpenAI(语言/图像)、ElevenLabs(语音)、Midjourney(图像)[18] - **硬件**:NVIDIA主导,华为Ascend 910B等挑战者涌现[37]
做空英伟达的时机到了么?
美股研究社· 2025-05-02 18:26
长按即可参与 到现在为止,大多数人可能都听说过中国人工智能初创公司 DeepSeek,因为它当时几乎在所有平台 都爆红。但我们认为因为 DeepSeek( DEEPSEEK )而抛售英伟达股票是不合理的,至少没有达 到那种程度。 但让我们仔细分析一下市场为何会有如此反应,这有助于我们理解如果Deepseek R2人工智能模型 的发布是否会重演这一幕。在R1发布之前,人们普遍认为中国在人工智能领域落后多年,没有机会迎 头赶上。 谷歌前首席执行官埃里克·施密特 (Eric Schmidt)曾在 2024 年 5 月表示,美国在人工智能领域领先 中国 2-3 年,原因有三:由于芯片禁令,中国更难获得英伟达芯片;获取培训材料更困难,互联 网上的信息更多是英文;最后,投资较少。领先两三年意味着中国现在的水平与 ChatGPT 的第 一个版本相同。然而,事实并非如此。 顺便说一句,DeepSeek 之前也发布过一些模型,但由于性能不佳,它们从未声名鹊起,也鲜有人使 用。然而,R1 的发布改变了一切,并表明使用更少、更老旧的 GPU 也能开发出最先进的模型。开 发人员运用了多种优化策略来实现这一点。然而,黄仁勋表示,在他看 ...