公司技术发布与进展 - 2025年1月27日,DeepSeek团队发布并开源DeepSeek-OCR 2模型,采用创新的DeepEncoder V2方法,使AI能根据图像含义动态重排图像部分,更接近人类视觉编码逻辑[1] - DeepSeek-OCR 2的发布距离第一版模型问世约4个月,其核心创新在于将文本信息“绘制”为视觉图像,再通过视觉模型实现高效理解,旨在解决大模型处理长文本时的计算挑战[1] - 2025年8月21日,公司正式发布DeepSeek-V3.1,主要升级包括:采用混合推理架构,一个模型同时支持思考与非思考模式;相比DeepSeek-R1-0528,思考效率更高,能在更短时间内给出答案;通过Post-Training优化,在工具使用与智能体任务中的表现有较大提升[2] - 2025年年底,公司发布小更新V3.2版本及其长思考增强版DeepSeek-V3.2-Speciale,官方数据显示,在公开推理基准测试中,其推理能力达到GPT-5水平,与Gemini-3.0-Pro接近,相比Kimi-K2-Thinking,输出长度大幅降低,显著减少了计算开销与用户等待时间[3] - 2025年1月20日,公司推出大模型R1,在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版,但其推理成本仅为29.4万美元,加上约600万美元的基础模型训练开销,整体成本远低于国外巨头[3] - 有从业者认为DeepSeek-OCR 2本质上是模拟人脑的遗忘机制,其核心构件视觉encoder的高效解码,为光计算和量子计算在LLM领域的引入提供了明确的技术路径[2] 公司发展历程与市场影响 - 公司由梁文锋控制的幻方量化于2023年4月宣布成立,幻方量化当时公告将集中资源和力量全力投身人工智能技术,成立新的独立研究组织探索AGI本质,随后成立了深度求索(DeepSeek)公司[3] - 公司凭借超强的性能和极低的训练成本强势崛起,在全球科技圈受到广泛关注[3] - 2025年1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,同日,在中国区应用商店免费榜也位列第一[4] - 《黑神话:悟空》制作人冯骥表示DeepSeek可能是个国运级别的科技成果[4] - 自2024年底发布V3模型后,公司的下一代旗舰模型仍未发布,此前有报道称公司将于2月发布新一代旗舰模型DeepSeek V4,但公司未对此进行回应[2] 行业与资本市场反应 - A股迎来“DeepSeek时刻”,中国资产被重估,A股算力租赁、云计算等指数在春节后飙涨逾40%[4] - 相关概念股表现强劲:新炬网络走出10连板,杭钢股份实现17天13板,路桥信息、每日互动等概念股年内最高涨幅均超300%[4]
赶在农历新年前后,DeepSeek又发大模型,DeepSeek-OCR 2来了!更接近人类视觉编码逻辑