mHC新架构
搜索文档
AI 系列跟踪(88):AI 芯片厂商密集上市,DeepSeek 提出新架构,AI 产业化进程再加速
长江证券· 2026-01-06 19:10
行业投资评级 - 投资评级为“看好”,并维持此评级 [7] 报告核心观点 - 近期AI领域边际催化加速,AI产业化进程再加速 [2][4] - 看好四个细分赛道:1)受益于AI技术提升创作效率和变现价值的优质IP及AI漫剧赛道;2)具备流量、模型、数据优势的互联网大厂;3)海外商业模式已跑通、国内有望复制的垂直赛道(如广告、电商、教育);4)AI+游戏厂商 [2][10] 事件与动态总结 - **AI芯片厂商密集上市**:壁仞科技于1月2日在港交所成功上市,首日涨幅达75.82% [4][10];同日,百度公告其昆仑芯业务已以保密形式向港交所提交上市申请表格 [4][10] - **技术架构创新**:DeepSeek于1月1日发表新论文,提出mHC(流形约束超连接)新架构,该架构可降低训练先进AI模型的能源和算力需求 [2][4][10];实测在27B参数模型上,采用mHC架构仅增加约6.7%的训练时间开销,即可实现显著性能提升 [10] - **其他市场催化**:大模型公司智谱与MiniMax将分别于1月8日、9日在港交所挂牌上市 [2][10];火山引擎成为总台春晚独家AI云合作伙伴,其AI产品“豆包”将配合上线多种互动玩法 [2][10] 重点公司/业务进展 - **壁仞科技**:具备从高端AI芯片到算力集群的全链路自主可控能力 [10];硬件端自主开发“壁立仞”GPGPU架构及BR106、BR110等芯片 [10];软件端自研BIREN-SUPA平台已完成多款国产大模型适配,并牵头制定智算集群异构混训标准 [10] - **百度昆仑芯**:2025年上半年,其P800的3.2万卡集群正式点亮,能同时支撑多个千亿参数大模型训练 [10];根据规划,计划于2030年将单一集群规模扩展至百万卡级别 [10] - **DeepSeek**:提出的mHC新架构解决了Hyper-Connections结构存在的信号爆炸、梯度异常等问题,实现了架构稳定性重构 [10]
月之暗面计划今年初上线多模态新模型;智元发布一体化具身大小脑系统GenieReasoner丨AIGC日报
创业邦· 2026-01-02 09:09
大模型技术进展 - 月之暗面计划在2024年1月或3月上线多模态新模型,型号可能为K2.1或K2.5 [2] - DeepSeek在元旦发布新论文,提出名为mHC(流形约束超连接)的新架构,旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其性能增益,论文作者包括创始人兼CEO梁文锋 [2] 具身智能与机器人 - 智元具身研究中心于1月1日推出第二代一体化具身大小脑系统GenieReasoner,提出一种支持统一离散化预训练的模型架构,并通过流匹配缓解传统离散Tokenizer的动作精度瓶颈 [2] - 智元同时开源了ERIQ评测基准,用于解耦量化评估VLA(视觉语言动作)模型中具身大脑不同维度的推理能力 [2] AI赋能前沿科技 - 人工智能技术正成为加速可控核聚变迈向商业化的重要推动力,多国政府与企业持续增加投入,多个聚变示范堆计划稳步推进 [2] - 根据世界经济论坛官网报道,聚变能有望在本世纪30年代开始接入电网 [2]