Workflow
人工智能分析2025年第一季度AI现状
傅里叶的猫·2025-06-05 20:25

DeepSeek R2分析 - 采用1.2万亿参数和混合专家架构(MoE),活跃参数达780亿,显著降低运行成本 [1] - 使用华为Ascend 910B芯片训练,增强多语言覆盖和多模态能力(文本、图像、语音、视频) [1] - 成本效益突出:输入成本降至0.07美元/百万代币(R1为0.15-0.16美元),输出成本0.27美元/百万代币(R1为2.19美元) [1] 2025年AI六大趋势 AI持续进步 - OpenAI的o4-mini和o3、Google的Gemini 2.5 Pro、xAI的Grok 3引领智能前沿,开源模型(如DeepSeek R1)性能接近专有模型 [3] - Google通过TPU加速器至Gemini模型的垂直整合占据优势,大型科技公司覆盖全模态,中小型玩家专注特定领域 [3] 中国AI崛起 - DeepSeek和阿里巴巴等中国实验室开源模型智能水平媲美美国,缩小全球竞争差距 [4] 推理模型 - 推理模型通过生成中间token提升准确性,Google Gemini 2.5 Pro在MMLU-Pro等评估中表现优于非推理模型(如GPT-40) [5] - 非推理模型在速度和成本敏感任务中仍具优势 [5] AI代理 - 多LLM串联实现端到端任务自主处理,提升复杂工作流程效率 [6] 效率与MoE - 小型模型智能提升和硬件进步推动推理成本下降,MoE架构通过部分参数激活提高效率 [7] 多模态AI - 图像生成:GPT-40设视觉质量新标杆,Google Veo 2超越Sora [8] - 语音处理:OpenAI和ElevenLabs在语音转文本领先,MiniMax Speech-02-HD接近人类对话水平 [9] 竞争格局与基准测试 - OpenAI的o4-mini和Gemini 2.5 Pro仍领先,但开源模型(DeepSeek R1、Llama 3.1)差距缩小 [14] - 美国实验室(OpenAI、Google等)与中国(DeepSeek、阿里巴巴)、欧洲(Mistral)竞争激烈 [14] - 基准测试基于MMLU-Pro等七项评估,推理模型在智能指数中表现更优 [19][24] 成本与性能 - 高性能模型(智能指数≥50)推理成本为64美元/百万代币,低成本模型(如DeepSeek R1)仅0.125美元/百万代币 [29] - 推理模型输出token消耗显著高于非推理模型,但准确性更高 [27] 多模态厂商分布 - 通用实验室(OpenAI、Google)覆盖全模态,专注型厂商(Midjourney、Runway)主攻媒体生成 [34]