Workflow
Atlas 800 A3
icon
搜索文档
MiniMax最新模型开源,华为、英伟达等芯片厂商齐站台
南方都市报· 2026-04-13 13:56
公司动态:MiniMax M2.7大模型开源与适配 - MiniMax于4月12日晚在全球开源其M2.7大模型 [1] - 开源首日即完成与华为昇腾、摩尔线程、沐曦、昆仑芯、英伟达以及Together AI、Fireworks、Ollama等海内外芯片厂商及推理平台的接入与推理适配工作 [1] - 华为昇腾AI基础软硬件基于vllm-Ascend推理引擎在Atlas 800 A3、Atlas 800I A2系列产品上为模型推理部署提供全流程支持 [4] - 摩尔线程技术团队基于MUSA架构完成深度调优,在MTT S5000上实现高性能推理 [4] - 沐曦曦云C系列GPU凭借全栈自研的MXMACA软件栈,首日完成深度适配,实现“模型发布即算力就绪” [4] - 昆仑芯通过自研架构进行底层算子优化与软硬件协同加速 [4] - 英伟达推理框架TensorRT-LLM为M2.7提供了深度适配与全面优化支持 [4] 模型能力与市场表现 - MiniMax M2.7的一大亮点是自行构建Agent Harness,将思考与执行功能结合,成为业界首个能让AI深度参与迭代自身的模型 [3] - 模型基于Agent Teams、复杂Skills、Tool Search tool等能力,可完成高度复杂的生产力任务 [3] - 基于在真实软件工程、专业办公场景的表现,M2.7已成为Hermes Agent、OpenClaw等全球热门智能体中最受欢迎的模型之一 [3] - 来自海内外的开发者与企业客户的接入需求持续增长,模型调用量快速提升 [3] - 在OpenRouter平台的上周(4月6日至4月12日)最受欢迎模型榜前十名中,国产大模型占一半,包括阿里Qwen3.6 Plus、DeepSeek V3.2、MiniMax M2.7、MiniMax M2.5、小米MiMo-V2-Pro [6] 行业趋势 - 随着行业发展,主流大模型的能力差距正在逐步缩小 [3] - 企业的核心需求已转向如何通过“大模型的脚手架”(包括工具调用、分层上下文工程、长记忆管理、工作流设计等系统工程手段)在不改变模型架构和参数的基础上,最大程度发挥模型能力 [3] - 近期国产大模型密集上新 [4] - 根据OpenRouter数据,上周(4月6日至4月12日)全球模型调用量中,5大模型总共占据调用量5.22T,占总调用量近25% [4]
智谱GLM-5实测逼近Claude Opus 4.5,国产大模型实力再获突破!
财联社· 2026-02-12 11:34
GLM-5模型的技术突破与全球地位 - 智谱AI新一代旗舰大模型GLM-5正式上线,其内测匿名版本“Pony Alpha”此前在海外OpenRouter平台登顶热度榜首,代理式编程单项实测超越Claude Opus位列全球第一 [1] - 在权威评测Artificial Analysis Intelligence Index v4.0中,GLM-5以50分综合成绩并列全球第三,仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5,成为全球排名最靠前的国产模型之一 [1] - GLM-5是国内首个跟上硅谷Agentic Coding前沿趋势的模型,实现从“对话式代码生成”到“端到端系统工程”的突破,在构建高并发电商系统等复杂任务中展现顶尖工程能力 [3] - 在专业评测中,GLM-5取得SWE-bench Verified 77.8分(逼近Opus 4.6的80.9分)、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠,其Coding与Agent能力达到开源SOTA [4] - 模型采用MoE稀疏架构,擅长长程Agent任务与复杂系统设计,可支撑数百次工具调用、长程记忆与复杂指令执行 [4] - 一手实测显示,GLM-5在工业级后端开发、长步骤复杂任务规划等工程化核心场景中,其“聪明程度”已经逼近Claude Opus 4.5 [7][14] - 在代理编程场景得分589,超越Claude Opus 4.5的585分位列全球第一,而完成同等编程任务的推理成本仅0.14美元,不足Opus 4.6(6.39美元)的1/40 [14] GLM-5的工程化能力与生产力价值 - GLM-5在《TerraLive》全栈开发实测中,展现出能独立负责从需求分析到产品落地的资深全栈工程师+3D图形工程师+交互设计师的能力,交付功能完整、体验流畅、视觉精美的3D地球产品 [8][10] - 从一句提示词到可交互应用耗时极短,效率提升是传统开发模式的数倍,被评价为真正意义上的“超级生产力引擎” [10][13] - 智能写作方面,GLM-5可自动拆解复杂分析任务、输出专业垂直报告,并高效提炼信息 [11] - 该模型标志着国产大模型首次在真实工程场景中拥有比肩国际顶尖水平的“系统架构师”,行业竞争重心从通用能力比拼转向垂直场景深度落地与工程化能力 [4] GLM-5的国产算力生态适配 - GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等七家主流国产芯片平台的深度推理适配与算子级优化,能够在国产算力集群上实现高吞吐、低延迟的稳定运行 [5] - 华为昇腾实现Day0全流程适配,在推理侧基于Atlas 800 A3采用W4A8混合精度量化实现744B模型单机高效部署;训练侧在128K长序列下显存减少30G、性能较FA提升8倍 [5] - 摩尔线程在旗舰级AI训推一体GPU MTT S5000上Day-0完成全流程适配与验证;GLM-5在海光DCU平台上已实现高吞吐、低延迟的稳定推理与训练性能 [5] - 此举验证了国产芯片集群对大规模生成式模型的承载能力,成为生态成熟的前夜 [6] 市场反响与资本市场影响 - 匿名模型“Pony Alpha”在海外引爆技术圈,在官方确认其为GLM-5前,已直接驱动相关公司股价连续两日大幅上涨,成为港股AI板块最强催化 [1][16] - 受消息发酵影响,公司股价连续两日强势领涨,公司总市值一度站上1500亿港元,跻身港股科技股前列 [16] - 这是国产大模型首次出现海外技术热度倒逼港股估值的案例,市场交易逻辑已从“跟随者”切换至关注MoE架构、开源SOTA等硬核突破 [17] - 资金押注其技术兑现,验证了市场对国产大模型头部厂商技术迭代与商业化前景的高度认可,意味着资本市场对AI公司的定价权正从财报转向技术预期 [16][17]