【兴证计算机】DeepSeek（深度）：加速迭代的开源大模型引领者

公司概况与战略定位 - 深度求索（DeepSeek）于2023年7月成立，由幻方量化设立，是一家坚持长期主义、不以短期商业利益为导向的AI公司 [1] - 公司引领开源模型生态，其模型打破了国外模型的垄断地位，加速了AI技术平权，深刻影响了全球AI产业格局 [1] - 公司组织架构扁平，团队规模不到140人，核心技术人员主要来自国内顶尖高校 [1] - 截至2025年9月30日，公司估值预计达到1.05万亿元，且至今未进行过外部融资 [1] 模型技术迭代与成本优势 - DeepSeek-V3：于2024年12月推出，训练成本仅557万美元，性能表现比肩GPT-4 [2] - V3模型采用了自研MoE架构、多头潜在注意力（MLA）机制、FP8混合精度技术、多token预测等核心技术，大幅降低了训练及推理成本 [2] - DeepSeek-R1：于2025年1月20日发布推理模型正式版，推理性能对齐OpenAI o1 [1][2] - R1模型凭借更低的训练成本以及领先的模型能力，可以低成本私有化部署，推动了金融、医疗、政务等垂直场景以及端侧AI的应用落地 [1][2] - 公司持续推动模型训推成本优化，在算力资源有限的情况下突破模型的数学、代码、复杂推理能力上限 [2] 未来展望与模型规划 - 根据The Information报道，公司有望在2月中旬发布新一代旗舰模型V4 [3] - 内部测试显示，V4的代码生成和处理能力超越了Claude和GPT系列模型 [3] - 预计后续模型有望在成本下降、参数规模扩大、长上下文窗口、AI编程、多模态理解、Agent能力等方面进一步突破 [3] - 基于近期对mHC、Engram、DeepSeek OCR-2等技术的更新，公司模型能力将持续进化 [3] 商业化与应用生态 - AI竞赛正从比拼模型能力转向在现实世界中大规模部署落地，判断公司后续的商业化有望加速 [3] - 基于其开源策略、领先模型能力和更低部署成本，公司有望成为AI通用基础设施，后续有望嵌入到海量B端和C端AI应用产品中 [3] - 目前，公司已全面接入云厂商、三大运营商，并与办公、手机、汽车、金融、医疗等行业客户广泛开展合作 [3] - 生态能力被判断为大模型商业化的核心壁垒 [3] 行业投资机会 - 随着以DeepSeek为代表的国产大模型持续迭代，建议关注AI应用、算力的投资机会 [4] - AI应用相关公司包括：卓易信息、汉得信息、合合信息、新大陆、中控技术、税友股份、金山办公、科大讯飞、福昕软件、慧辰股份、同花顺 [4] - 算力相关公司包括：海光信息、寒武纪、中科曙光、首都在线、神州数码、宏景科技、网宿科技 [4]