Ascend 910B芯片 - 财报，业绩电话会，研报，新闻

Ascend 910B芯片

搜索文档

人工智能分析2025年第一季度AI现状

傅里叶的猫· 2025-06-05 20:25

DeepSeek R2分析 - 采用1.2万亿参数和混合专家架构（MoE），活跃参数达780亿，显著降低运行成本 [1] - 使用华为Ascend 910B芯片训练，增强多语言覆盖和多模态能力（文本、图像、语音、视频） [1] - 成本效益突出：输入成本降至0.07美元/百万代币（R1为0.15-0.16美元），输出成本0.27美元/百万代币（R1为2.19美元） [1] 2025年AI六大趋势 AI持续进步 - OpenAI的o4-mini和o3、Google的Gemini 2.5 Pro、xAI的Grok 3引领智能前沿，开源模型（如DeepSeek R1）性能接近专有模型 [3] - Google通过TPU加速器至Gemini模型的垂直整合占据优势，大型科技公司覆盖全模态，中小型玩家专注特定领域 [3] 中国AI崛起 - DeepSeek和阿里巴巴等中国实验室开源模型智能水平媲美美国，缩小全球竞争差距 [4] 推理模型 - 推理模型通过生成中间token提升准确性，Google Gemini 2.5 Pro在MMLU-Pro等评估中表现优于非推理模型（如GPT-40） [5] - 非推理模型在速度和成本敏感任务中仍具优势 [5] AI代理 - 多LLM串联实现端到端任务自主处理，提升复杂工作流程效率 [6] 效率与MoE - 小型模型智能提升和硬件进步推动推理成本下降，MoE架构通过部分参数激活提高效率 [7] 多模态AI - **图像生成**：GPT-40设视觉质量新标杆，Google Veo 2超越Sora [8] - **语音处理**：OpenAI和ElevenLabs在语音转文本领先，MiniMax Speech-02-HD接近人类对话水平 [9] 竞争格局与基准测试 - OpenAI的o4-mini和Gemini 2.5 Pro仍领先，但开源模型（DeepSeek R1、Llama 3.1）差距缩小 [14] - 美国实验室（OpenAI、Google等）与中国（DeepSeek、阿里巴巴）、欧洲（Mistral）竞争激烈 [14] - 基准测试基于MMLU-Pro等七项评估，推理模型在智能指数中表现更优 [19][24] 成本与性能 - 高性能模型（智能指数≥50）推理成本为64美元/百万代币，低成本模型（如DeepSeek R1）仅0.125美元/百万代币 [29] - 推理模型输出token消耗显著高于非推理模型，但准确性更高 [27] 多模态厂商分布 - 通用实验室（OpenAI、Google）覆盖全模态，专注型厂商（Midjourney、Runway）主攻媒体生成 [34]

傅里叶的猫· 2025-06-05 20:25

DeepSeek R2分析 - 采用1.2万亿参数混合专家架构（MoE），活跃参数达780亿，显著降低运行成本[1] - 使用华为Ascend 910B芯片训练，非NVIDIA方案[1] - 多语言处理能力增强，支持文本、图像、语音和视频多模态功能[1] - 推理成本优化：输入成本降至每百万代币0.07美元（R1为0.15-0.16美元），输出成本0.27美元（R1为2.19美元）[1] 2025年AI六大趋势 1 AI持续进步 - OpenAI的o4-mini和o3、Google Gemini 2.5 Pro、xAI Grok 3领跑智能水平，开源模型如DeepSeek R1接近专有模型性能[3] - Google通过TPU加速器至Gemini模型的垂直整合形成优势[3] 2 中国AI崛起 - DeepSeek、阿里巴巴等中国实验室开源模型智能水平媲美美国，缩小全球竞争差距[4] 3 推理模型 - 通过生成中间token提升逻辑性，Gemini 2.5 Pro可解决复杂问题如蒙提霍尔问题，非推理模型GPT-40因简化处理而错误[5] 4 AI代理 - 多LLM串联实现端到端任务自主处理，减少人工干预[6] 5 效率与MoE架构 - 小模型智能提升+硬件迭代推动推理成本下降，MoE架构通过部分参数激活提高效率[7] 6 多模态AI - **图像生成**：GPT-40设视觉质量标杆，Google Veo 2超越OpenAI Sora[8] - **语音处理**：OpenAI和ElevenLabs领跑语音转文本，MiniMax Speech-02-HD接近人类对话水平[9] 竞争格局与基准 - 开源模型（DeepSeek R1、Meta Llama 3.1）与专有模型（o4-mini、Gemini 2.5 Pro）智能差距缩小[14] - 美国与中国实验室竞争加剧，模型发布周期缩短至3个月[14] - 推理模型在Artificial Analysis智能指数（MMLU-Pro等7项评估）中表现更优，但消耗更多token[21][31] 成本与架构 - 高性能模型推理价格持续下降，DeepSeek R1成本显著低于前代[34] - MoE架构模型（如DeepSeek R1）在效率与性能平衡上优于密集架构[36] 产业链关键玩家 - **基础模型**：OpenAI、Google、DeepSeek、阿里巴巴[16] - **多模态领域**：OpenAI（语言/图像）、ElevenLabs（语音）、Midjourney（图像）[18] - **硬件**：NVIDIA主导，华为Ascend 910B等挑战者涌现[37]