Workflow
国产算力适配
icon
搜索文档
智谱发布GLM-5技术细节:工程级智能,适配国产算力
华尔街见闻· 2026-02-22 19:20
模型能力与定位的转变 - 模型核心思路从比拼参数规模转向比拼系统工程能力,标志着从“追赶”到搭建自有技术体系的转变 [2] - 模型能力实现从“Vibe Coding”(根据指令生成代码片段)到“Agentic Engineering”(自主规划、拆解、执行并完成复杂系统任务)的概念升级 [3] - 模型重点评估指标从单题得分转向工程级智能,包括处理200K上下文、完成跨文件软件工程、长周期任务规划与修正以及多轮交互一致性等复杂能力 [4] - 在衡量长期决策能力的Vending-Bench 2基准测试中,GLM-5在开源模型中排名第一,性能接近Claude Opus 4.5 [4] 核心技术创新:稀疏注意力与训练效率 - 采用创新的DeepSeek稀疏注意力机制,模型拥有7440亿参数,但激活参数为400亿,训练了28.5万亿个token [6] - DSA机制能动态判断关键token,在200K长上下文下将注意力计算量降低1.5至2倍,且实现了无损的性能,未牺牲精度 [7][8][9] - 对强化学习体系进行彻底改造,采用生成与训练解耦的异步架构,大幅提升训练吞吐量,解决了持续数小时的真实软件工程任务的学习稳定性问题 [11][13] - 技术创新实现了在同等算力下支持更长上下文、同等成本下获得更高推理能力、同等硬件下运行更大模型的效果 [12] 国产算力生态深度适配 - GLM-5实现了对国产GPU生态的原生深度适配,已兼容华为昇腾、摩尔线程、海光、寒武纪、昆仑芯、天数智芯、燧原等芯片 [14] - 适配重点在于解决国产芯片的软件栈难点,是面向多种国产算力平台的系统级优化,而非简单的“能跑” [14] - 通过软硬协同极致优化,GLM-5在单台国产算力节点上的性能可媲美由两台国际主流GPU组成的集群,在长序列处理场景下部署成本大幅降低50% [14] 完整的国产AI工程体系形成 - 技术路径形成完整闭环:从模型架构创新、训练效率优化、内存与通信压缩、低精度对接到国产芯片深度适配 [15] - 标志着中国AI产业优势从应用层开始进入架构创新、算法工程、训练系统、芯片适配、推理框架的全栈优化阶段 [15] - 技术报告详细披露训练流程、工程权衡与消融实验,关注GPU利用率、长尾延迟、KV cache复用等工业级系统问题,体现了技术成熟度 [18] - 此次突破的核心意义在于首次展示了中国AI在“体系能力”上的竞争力,实现了从做大模型到打通自有算力适配的跨越 [15][18]
MinerU全面深度适配主流国产算力,10余家国产AI芯片在列
环球网· 2026-02-12 16:45
行业动态:国产算力生态适配进展 - 上海人工智能实验室 OpenDataLab 团队、 DeepLink 团队及多家国产芯片厂家携手,完成了昇腾、平头哥、沐曦、海光、燧原、摩尔线程、天数智芯、寒武纪、昆仑芯、太初元碁、壁仞等10余家主流国产算力的适配 [1] - 此举通过软硬件协同的全栈优化策略,旨在全面提升 MinerU 项目的生态兼容性与适应力,赋能更多开发者与企业高效构建大模型语料基石 [1] - 近期,国内不少主流AI大模型相继推出更新版本,国产AI芯片企业也紧随其后适配新版本大模型 [1] MinerU 项目核心能力 - MinerU 对 PDF 及复杂网页的元素捕捉准确率可达 99%,能够精准还原与结构化提取精密复杂的数学公式和嵌套繁琐的结构化表格 [1] - 其核心价值在于跨行业的普适性与极高的解析精度 [1] - 对于大模型研发,它是高效的语料生产引擎,能够支撑千万级规模文档向 AI-Ready 数据的快速转化 [1] - 对于政企办公及科研领域,它是精准的文档解析工具,极大提升了数字化办公的高质量发展 [1] 国产算力厂商适配成果 - 太初元碁公司表示,截至目前其已完成包括DeepSeek、千问、智谱、MinerU、文心一言等在内的30多个AI大模型的国产算力适配工作 [2] - 适配范围涵盖 Qwen3 Dense/MoE 系列模型、BAAI Embedding / Reranker系列模型、Qwen-VL、LLaVA等多模态理解系列模型 [2] - 适配范围还包括 Stable-Diffusion、FLUX、Wan系列等多模态生成类模型;GLM、Seed-OSS、文心一言等大语言模型;以及MinerU、DeepSeek-OCR 2、Paddle-OCR等主流OCR模型 [2] - 公司表示将持续更新,加速推动智算与产业融合 [2]
新品密集发布+国产算力适配 商汤科技股价早盘拉升8.5%
智通财经· 2025-12-22 13:45
股价表现与市场反应 - 12月22日早盘,公司股价显著拉升,最高涨幅超8.5%,触及2.04港元 [1] 股价上涨驱动因素 - 近期公司技术迭代成果密集落地,展现出以底层创新推动产品体验升级、让实用主义成为AI落地的商业逻辑 [1] 近期产品发布成果 - 在产品发布周期间,公司推出多个基于AI技术创新的新品 [1] - 推出行业首个创编一体、多剧集生成智能体“Seko 2.0” [1] - 推出国内首个原生AI办公智能体“小浣熊3.0” [1] - 推出新一代电商AI增长引擎“如影”营销智能体 [1] - 推出加速国内具身智能生态落地的“大晓机器人” [1] - 推出新一代AI财务助手“咔皮记账” [1] - 推出屡次登顶多国APP Store榜单的AI拍照助手“Kapi相机” [1] 国产芯片适配进展 - 12月15日,寒武纪官宣已完成对公司自研日日新Seko系列模型的适配 [1] - 公司与中科曙光、大晓正式达成战略合作,实现公司大模型与中科曙光scaleX万卡超集群等产品的深度适配 [1] - 公司大装置SenseCore已完成与主流国产AI芯片的全面适配,包括华为昇腾、寒武纪、沐曦、摩尔线程、壁仞等 [2] - 公司与芯片厂商建立了联合优化机制,显著提升了在国产芯片上的实际运行效率 [2] 未来展望 - 随着公司产品落地推进与行业需求进一步释放,其估值修复潜力有望持续释放 [2]