国君计算机|国产大模型性能领先,场景应用加速落地

行业投资评级 - 报告对DeepSeek-V3的投资评级为高投资价值，认为其强大的性能与开源策略显著提升了市场竞争力 [12] 核心观点 - DeepSeek-V3的发布标志着国产AI在规模、效率和成本方面实现重大突破，其在多项评测中超越多款顶尖模型，且成本极具竞争力 [3] - DeepSeek-V3的生成速度提升和灵活的API定价策略为用户带来更高的使用价值，生成吐字速度从每秒20次提升至60次，实现了3倍的性能提升 [8] - DeepSeek-V3采用FP8训练并开源原生FP8权重，得到开源社区的广泛支持，模型权重可通过Hugging Face平台下载，进一步促进了本地部署和多样化应用 [2] - DeepSeek-V3为自主研发的MoE架构，拥有6710亿参数和37亿激活参数，在14.8万亿token上进行了预训练，在多个评测中超越了Qwen2.5-72B和Llama-3.1-405B等开源模型，性能与顶尖闭源模型GPT-4o和Claude-3.5-Sonnet相媲美 [12] 技术生态发展 - DeepSeek-V3的开源权重和本地部署能力增强其社区支持和应用扩展性，推动了技术生态发展 [2] - DeepSeek提供从FP8到BF16的转换脚本，方便社区进行适配和拓展应用场景 [2] 市场竞争力 - DeepSeek-V3的强大性能与开源策略显著提升了其市场竞争力，具备高投资价值 [12] - DeepSeek调整了API服务的价格，新的定价为每百万输入tokens 0.5元（缓存命中）/2元（缓存未命中），每百万输出tokens 8元，高性价比有望为DeepSeek带来了更大市场份额和收入增长 [8] 性能表现 - DeepSeek-V3在知识类任务、长文本处理、代码编写和数学竞赛等方面表现出色 [12] - DeepSeek-V3的生成吐字速度从每秒20次提升至60次，实现了3倍的性能提升 [8]