【兴证计算机】DeepSeek(深度):加速迭代的开源大模型引领者
兴业计算机团队·2026-02-15 20:43

公司概况与战略定位 - 深度求索(DeepSeek)于2023年7月成立,由幻方量化设立,是一家坚持长期主义、不以短期商业利益为导向的AI公司 [1] - 公司引领开源模型生态,其模型打破了国外模型的垄断地位,加速了AI技术平权,深刻影响了全球AI产业格局 [1] - 公司组织架构扁平,团队规模不到140人,核心技术人员主要来自国内顶尖高校 [1] - 截至2025年9月30日,公司估值预计达到1.05万亿元,且至今未进行过外部融资 [1] 模型技术迭代与成本优势 - DeepSeek-V3:于2024年12月推出,训练成本仅557万美元,性能表现比肩GPT-4 [2] - V3模型采用了自研MoE架构、多头潜在注意力(MLA)机制、FP8混合精度技术、多token预测等核心技术,大幅降低了训练及推理成本 [2] - DeepSeek-R1:于2025年1月20日发布推理模型正式版,推理性能对齐OpenAI o1 [1][2] - R1模型凭借更低的训练成本以及领先的模型能力,可以低成本私有化部署,推动了金融、医疗、政务等垂直场景以及端侧AI的应用落地 [1][2] - 公司持续推动模型训推成本优化,在算力资源有限的情况下突破模型的数学、代码、复杂推理能力上限 [2] 未来展望与模型规划 - 根据The Information报道,公司有望在2月中旬发布新一代旗舰模型V4 [3] - 内部测试显示,V4的代码生成和处理能力超越了Claude和GPT系列模型 [3] - 预计后续模型有望在成本下降、参数规模扩大、长上下文窗口、AI编程、多模态理解、Agent能力等方面进一步突破 [3] - 基于近期对mHC、Engram、DeepSeek OCR-2等技术的更新,公司模型能力将持续进化 [3] 商业化与应用生态 - AI竞赛正从比拼模型能力转向在现实世界中大规模部署落地,判断公司后续的商业化有望加速 [3] - 基于其开源策略、领先模型能力和更低部署成本,公司有望成为AI通用基础设施,后续有望嵌入到海量B端和C端AI应用产品中 [3] - 目前,公司已全面接入云厂商、三大运营商,并与办公、手机、汽车、金融、医疗等行业客户广泛开展合作 [3] - 生态能力被判断为大模型商业化的核心壁垒 [3] 行业投资机会 - 随着以DeepSeek为代表的国产大模型持续迭代,建议关注AI应用、算力的投资机会 [4] - AI应用相关公司包括:卓易信息、汉得信息、合合信息、新大陆、中控技术、税友股份、金山办公、科大讯飞、福昕软件、慧辰股份、同花顺 [4] - 算力相关公司包括:海光信息、寒武纪、中科曙光、首都在线、神州数码、宏景科技、网宿科技 [4]

【兴证计算机】DeepSeek(深度):加速迭代的开源大模型引领者 - Reportify