mHC(流形约束超连接)框架
搜索文档
DeepSeek发布最新论文,破解大模型训练拥堵难题
贝壳财经· 2026-01-02 20:44
北京时间2026年1月1日,DeepSeek团队在arXiv(预印本)网站和Hugging Face上同步发布了最新论文, 名为《mHC: Manifold-Constrained Hyper-Connections》,论文的核心观点是提出一种名为"mHC"(直译 为"流形约束超连接")的框架,该框架改进了此前大模型训练中一种名为"HC(Hyper-Connections,超 连接)"的范式,对大规模模型训练提供了切实的性能改进。 贝壳财经记者注意到,DeepSeek创始人梁文锋的名字出现在了这篇论文署名作者的最后一位上。事实 上,虽然DeepSeek在2025年春节因为R1模型的开源发布而全球爆火,但在梁文锋的带领下,这家公司 极其低调,团队一直潜心学术,未做过多的商业化尝试,一心扑在基础模型理论研发之上,梁文锋还在 近期入选了《自然》2025年影响科学发展十大人物。 | | @ Models Datasets | | --- | --- | | Hugging Face Q Search models, datasets, use | | 梁文锋的名字出现在论文作者最后一位。Hugging Face网站截 ...