Ascend 910B芯片

搜索文档
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 20:25
DeepSeek R2分析 - 采用1.2万亿参数和混合专家架构(MoE),活跃参数达780亿,显著降低运行成本 [1] - 使用华为Ascend 910B芯片训练,增强多语言覆盖和多模态能力(文本、图像、语音、视频) [1] - 成本效益突出:输入成本降至0.07美元/百万代币(R1为0.15-0.16美元),输出成本0.27美元/百万代币(R1为2.19美元) [1] 2025年AI六大趋势 AI持续进步 - OpenAI的o4-mini和o3、Google的Gemini 2.5 Pro、xAI的Grok 3引领智能前沿,开源模型(如DeepSeek R1)性能接近专有模型 [3] - Google通过TPU加速器至Gemini模型的垂直整合占据优势,大型科技公司覆盖全模态,中小型玩家专注特定领域 [3] 中国AI崛起 - DeepSeek和阿里巴巴等中国实验室开源模型智能水平媲美美国,缩小全球竞争差距 [4] 推理模型 - 推理模型通过生成中间token提升准确性,Google Gemini 2.5 Pro在MMLU-Pro等评估中表现优于非推理模型(如GPT-40) [5] - 非推理模型在速度和成本敏感任务中仍具优势 [5] AI代理 - 多LLM串联实现端到端任务自主处理,提升复杂工作流程效率 [6] 效率与MoE - 小型模型智能提升和硬件进步推动推理成本下降,MoE架构通过部分参数激活提高效率 [7] 多模态AI - **图像生成**:GPT-40设视觉质量新标杆,Google Veo 2超越Sora [8] - **语音处理**:OpenAI和ElevenLabs在语音转文本领先,MiniMax Speech-02-HD接近人类对话水平 [9] 竞争格局与基准测试 - OpenAI的o4-mini和Gemini 2.5 Pro仍领先,但开源模型(DeepSeek R1、Llama 3.1)差距缩小 [14] - 美国实验室(OpenAI、Google等)与中国(DeepSeek、阿里巴巴)、欧洲(Mistral)竞争激烈 [14] - 基准测试基于MMLU-Pro等七项评估,推理模型在智能指数中表现更优 [19][24] 成本与性能 - 高性能模型(智能指数≥50)推理成本为64美元/百万代币,低成本模型(如DeepSeek R1)仅0.125美元/百万代币 [29] - 推理模型输出token消耗显著高于非推理模型,但准确性更高 [27] 多模态厂商分布 - 通用实验室(OpenAI、Google)覆盖全模态,专注型厂商(Midjourney、Runway)主攻媒体生成 [34]
人工智能分析2025年第一季度AI现状
傅里叶的猫· 2025-06-05 20:25
DeepSeek R2分析 - 采用1.2万亿参数混合专家架构(MoE),活跃参数达780亿,显著降低运行成本[1] - 使用华为Ascend 910B芯片训练,非NVIDIA方案[1] - 多语言处理能力增强,支持文本、图像、语音和视频多模态功能[1] - 推理成本优化:输入成本降至每百万代币0.07美元(R1为0.15-0.16美元),输出成本0.27美元(R1为2.19美元)[1] 2025年AI六大趋势 1 AI持续进步 - OpenAI的o4-mini和o3、Google Gemini 2.5 Pro、xAI Grok 3领跑智能水平,开源模型如DeepSeek R1接近专有模型性能[3] - Google通过TPU加速器至Gemini模型的垂直整合形成优势[3] 2 中国AI崛起 - DeepSeek、阿里巴巴等中国实验室开源模型智能水平媲美美国,缩小全球竞争差距[4] 3 推理模型 - 通过生成中间token提升逻辑性,Gemini 2.5 Pro可解决复杂问题如蒙提霍尔问题,非推理模型GPT-40因简化处理而错误[5] 4 AI代理 - 多LLM串联实现端到端任务自主处理,减少人工干预[6] 5 效率与MoE架构 - 小模型智能提升+硬件迭代推动推理成本下降,MoE架构通过部分参数激活提高效率[7] 6 多模态AI - **图像生成**:GPT-40设视觉质量标杆,Google Veo 2超越OpenAI Sora[8] - **语音处理**:OpenAI和ElevenLabs领跑语音转文本,MiniMax Speech-02-HD接近人类对话水平[9] 竞争格局与基准 - 开源模型(DeepSeek R1、Meta Llama 3.1)与专有模型(o4-mini、Gemini 2.5 Pro)智能差距缩小[14] - 美国与中国实验室竞争加剧,模型发布周期缩短至3个月[14] - 推理模型在Artificial Analysis智能指数(MMLU-Pro等7项评估)中表现更优,但消耗更多token[21][31] 成本与架构 - 高性能模型推理价格持续下降,DeepSeek R1成本显著低于前代[34] - MoE架构模型(如DeepSeek R1)在效率与性能平衡上优于密集架构[36] 产业链关键玩家 - **基础模型**:OpenAI、Google、DeepSeek、阿里巴巴[16] - **多模态领域**:OpenAI(语言/图像)、ElevenLabs(语音)、Midjourney(图像)[18] - **硬件**:NVIDIA主导,华为Ascend 910B等挑战者涌现[37]