行业投资评级 - 报告对DeepSeek-V3的投资评级为高投资价值,认为其强大的性能与开源策略显著提升了市场竞争力 [12] 核心观点 - DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破,其在多项评测中超越多款顶尖模型,且成本极具竞争力 [3] - DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值,生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升 [8] - DeepSeek-V3采用FP8训练并开源原生FP8权重,得到开源社区的广泛支持,模型权重可通过Hugging Face平台下载,进一步促进了本地部署和多样化应用 [2] - DeepSeek-V3为自主研发的MoE架构,拥有6710亿参数和37亿激活参数,在14.8万亿token上进行了预训练,在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美 [12] 技术生态发展 - DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性,推动了技术生态发展 [2] - DeepSeek提供从FP8到BF16的转换脚本,方便社区进行适配和拓展应用场景 [2] 市场竞争力 - DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力,具备高投资价值 [12] - DeepSeek调整了API服务的价格,新的定价为每百万输入tokens 0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens 8元,高性价比有望为DeepSeek带来了更大市场份额和收入增长 [8] 性能表现 - DeepSeek-V3在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色 [12] - DeepSeek-V3的生成吐字速度从每秒20次提升至60次,实现了3倍的性能提升 [8]
国君计算机|国产大模型性能领先,场景应用加速落地
国泰君安·2025-01-02 16:03