Workflow
Engram模块
icon
搜索文档
DeepSeek新模型曝光?“MODEL1”现身开源社区
上海证券报· 2026-01-22 05:31
DeepSeek技术进展与开源动态 - 公司于2025年2月启动“开源周”,计划以每日解锁形式逐步公开5个代码库,首个开源项目为Flash MLA [4] - Flash MLA通过优化Hopper GPU的内存访问和计算流程,显著提高可变长度序列的处理效率,其核心设计包括动态内存分配机制和并行解码策略,可减少冗余计算并提升吞吐量,尤其适用于大语言模型的推理任务 [4] 疑似新一代模型“MODEL1”的线索 - 近日,DeepSeek官方在GitHub更新FlashMLA代码,涉及的114个文件中,有数十处提到了此前未公开的“MODEL1”大模型标识符 [3] - 在某些文件中,“MODEL1”与已知的现有模型“V32”(即DeepSeek-V3.2)并列提及,行业分析认为,“MODEL1”或许代表一个不同于现有架构的新模型,可能正是公司还未对外发布的下一代模型(R2或者V4) [4] - 此前有市场消息称,公司计划在2025年2月春节前后发布新一代AI模型DeepSeek V4,该模型是2024年12月发布的V3模型的迭代版,具备强大的编程能力 [4] 近期技术研究成果 - 2026年1月以来,公司已陆续发布两篇技术论文,分别介绍了名为“优化残差连接(mHC)”的新训练方法,以及一种受生物学启发的“AI记忆模块(Engram)” [5] - 1月12日,公司与北京大学合作发表新论文,提出了条件记忆(conditional memory)及其实现方案Engram模块,该模块不仅有助于知识检索,同时在一般推理和代码/数学领域方面取得了更大的进步 [5] 公司研发的资金支持背景 - 公司创始人梁文锋旗下的私募幻方量化2025年的收益均值达56.55%,在中国管理规模超百亿的量化私募业绩榜中位列第二,仅次于以73.51%收益均值登顶的灵均投资 [5] - 目前,幻方量化管理规模已超700亿元,其较高的收益率为DeepSeek的研发提供了更多支持 [5] 模型性能表现 - 公司内部的初步测试显示,其新一代模型V4在编程能力上超过了目前市场上的其他顶级模型,如Anthropic的Claude和OpenAI的GPT系列 [4][5]
砸完你的 砸你的
Datayes· 2026-01-21 18:54
市场整体表现 - 2026年1月21日,A股三大指数集体上涨,沪指涨0.08%,深成指涨0.70%,创业板指涨0.53% [18] - 三市成交额26240.00亿元,较上一交易日缩量1804.27亿元,三市超3000只个股上涨 [18][34] - 市场共计91股涨停,16股封板,9股连板,最大连板数为十六连板 [18] - 主力资金净流入596.56亿元,电子行业净流入规模最大 [36] - 北向资金当日总成交3212.15亿元 [38] 行业与板块热点 - **科技板块集体回暖**:国产芯片板块爆发,CPU概念股大涨,龙芯中科20cm涨停,盈方微、通富微电等十余股涨停 [18] - **芯片与存储**:隔夜美股存储芯片股闪迪大涨9.55%,花旗将其目标股价从280美元上调至490美元 [1] - **CPU涨价与需求**:英特尔和AMD拟于2026年将服务器CPU价格上调10%-15%,高端AI优化型号(如Granite Rapids/Turin)上调15%-20% [2] - **算力硬件走强**:PCB、光通信等方向表现强劲,日本材料巨头Resonac宣布自3月1日起调涨PCB材料售价30%以上 [12][18] - **机器人板块活跃**:锋龙股份晋级十六连板再创历史新高 [19] - **黄金板块走强**:避险情绪与央行增持共振,国际金价持续飙升,现货黄金站上4800美元/盎司,创历史新高 [13][19] - **业绩预增股受追捧**:市场风格转向“业绩为王”,动力新科、久其软件、中熔电气等多只业绩预增股涨停 [19] 资金流向 - **主力资金净流入前五大行业**:电子、有色金属、机械设备、基础化工、汽车 [36] - **主力资金净流入前五大个股**:海光信息、澜起科技、中科曙光、中芯国际、通富微电 [36] - **主力资金净流出前五大行业**:银行、非银金融、食品饮料、公用事业、商贸零售 [36] - **主力资金净流出前五大个股**:特变电工、贵州茅台、信维通信、中国平安、招商银行 [36] - **北向资金买卖活跃个股**:贵州茅台成交额10.20亿元,长电科技、潍柴动力、通富微电等买卖额居前 [38][39] 政策与产业动态 - **免税**:财政部发布通知,在武汉天河国际机场等41个口岸各新设1家口岸进境免税店 [24] - **自动驾驶**:广东省政府印发措施,鼓励企业开展自动驾驶核心技术攻关,推动大模型落地应用,支持扩大高级别自动驾驶应用区域 [25] - **核电**:中核(象山)核能有限公司成立,注册资本2.5亿元,股东包括中国核电、宏润建设、雅戈尔、阿里巴巴旗下公司等 [26] - **存储价格预期**:佰维存储表示,存储产品价格在2026年第一、二季度有望持续上涨 [28] 公司业绩预告 - **巨化股份**:预计2025年归母净利润为35.40亿元到39.40亿元,同比增长80%到101% [27] - **天孚通信**:预计2025年净利润为18.81亿元~21.5亿元,同比增长40.00%~60.00% [27] - **金安国纪**:预计2025年归母净利润为2.80亿元-3.60亿元,同比增长655.53%-871.40% [27] 行业估值与交易热度 - 有色金属、电子、机械设备领涨,银行、煤炭、食品饮料领跌 [45] - 银行、纺织服饰、通信等板块交易热度提升居前 [45] - 非银金融、农林牧渔、食品饮料等板块市盈率(PE)目前处于历史百分位低位 [45] AI Agent与CPU需求研究 - **AI Agent拉动CPU需求**:根据国联证券测算,在AI Agent大趋势下,CPU需求量较2024年全球出货量(3200万片)的倍数,在保守、中性、乐观情景下分别为18343%、36685%、55028% [3] - **CPU可能成为瓶颈**:在AI Agent相关的强化学习中,需要海量CPU构建工具和环境,CPU的效能直接影响GPU利用率、训练稳定性及收敛速度,可能比GPU更早成为瓶颈 [11] - **DeepSeek论文新范式**:DeepSeek论文提出“条件记忆”新范式,通过Engram模块将海量参数存放在性价比更高的CPU内存(RAM)中,实验显示“存算分离”设计让推理速度仅下降2%,实现了千亿级别的知识容量扩展 [11][12] 外围市场动态 - **美股遭遇抛售**:标普500创下10月10日以来最大单日百分比跌幅,纳斯达克跌幅2.4%,“七雄”股总市值单日蒸发6830亿美元 [14] - **市场波动加剧**:VIX波动率指数上涨26.7%至20.09,10年期美债收益率上升6.4个基点至4.294%,美元指数下跌0.8%至98.57 [14] - **“抛售美国”交易再现**:市场策略师认为,贸易政策风险是2026年需要应对的问题,市场抛售是在向政府传递要求恢复平静的信息 [15]