Minimax M2.5
搜索文档
中国互联网-AI 模型架构的战略影响-China Internet The strategic implications of AI model architecture
2026-04-01 17:59
**涉及行业与公司** * **行业**:中国互联网行业,特别是人工智能(AI)模型开发与应用领域 [1] * **主要AI公司**:Minimax、Z.ai(智谱)、Alibaba(Qwen系列)[3][8] * **互联网平台/云服务商**:Alibaba(阿里云)、Tencent(腾讯云)、Baidu(百度云)[6][72] * **其他提及公司**:Stepfun、Xiaomi、Kimi、OpenAI、Anthropic、Google、xAI、DeepSeek等 [47][58] **核心观点与论据** **1. AI模型架构的战略选择与市场定位** * **Minimax (M2.5/M2.7)**:采用**小型化、高效率**模型架构,专注于**低成本、代理式AI推理** [3][16] * **模型参数**:M2.5模型总参数量2300亿,但每次激活参数仅100亿 [15] * **定价策略**:通过极低的缓存读取价格(0.03美元/百万令牌)鼓励KV缓存使用,缓存命中率中位数约**70%** [18][41] * **市场定位**:成为OpenClaw等代理式AI应用的首选低成本后端,在OpenClaw模型使用份额中排名靠前 [4][63] * **Z.ai (GLM5)**:采用**大型、高性能**模型架构,专注于**通用推理能力和可靠性** [3][16][20] * **模型参数**:总参数量约7440亿,每次激活参数400亿 [15] * **性能表现**:在2026年初的模型发布浪潮中,在整体智能、编码能力和幻觉控制方面表现领先 [45] * **市场定位**:面向对可靠性要求高的企业用例,管理层背景更偏学术(如清华大学),对标Anthropic [4][21] * **Alibaba (Qwen系列)**:采取**平台化策略**,提供**广泛覆盖**不同规模、模态的模型家族 [8][66] * **战略目标**:最大化捕获AI计算需求,驱动MaaS(模型即服务)和更广泛的计算需求 [8] * **成本优势**:Qwen 3.5是同行中**唯一在智能提升的同时运行成本下降**的模型 [66][69] * **生态协同**:作为主要云服务商,Qwen在计算资源分配和成本上可能享有结构性优势 [67] **2. 竞争格局与长期护城河** * **长期竞争力**:建立在**顶尖通用推理能力和专业任务完成**基础上的市场地位将更具防御性,而**低成本代理后端**市场预计将因更多竞争者进入而变得拥挤 [5][9][47] * **模型商品化风险**:对于广泛的消费者用例,**可靠、快速、廉价地“完成任务”** 可能比底层模型差异化更重要,除非低成本模型嵌入大型面向消费者的生态系统中 [9][27] * **追赶者与蒸馏技术**:Stepfun 3.5-Flash和小米等公司已接近中国前沿水平,表明追赶速度可能很快 [47][57]。随着代理任务链变长,通过蒸馏技术从大模型中提取的小型“学生模型”可能逐渐落后 [48] * **Minimax的战略调整**:其即将推出的M3模型计划更注重前沿推理能力,这可能使其在竞争上更接近Z.ai,但也可能带来更高的训练成本 [5][49] **3. AI计算成本上升与财务影响** * **云服务商提价**:由于AI计算需求激增(尤其是OpenClaw的病毒式成功),阿里云、腾讯云、百度云均已宣布**AI计算产品涨价**,幅度在**5%-34%** 不等,且市场紧张可能支持进一步涨价 [6][72][74] * **第三方服务器租赁成本**:2024-2026年,中国8xH20服务器的月租金报价呈现**上升趋势** [75][76] * **对AI实验室的影响**:AI实验室(如Minimax、Z.ai)在很大程度上是**价格的接受者** [6][67]。计算成本上升将影响其推理利润和训练成本增长 [10] * **研发支出预期过低**:投资者预期的**25-30%** 训练成本增长,在计算成本上升的环境下可能**过于乐观**,预计需要上调 [10][73][80] **4. 技术架构与采用趋势** * **主流架构**:前沿AI模型越来越多地采用**稀疏混合专家模型**架构,以在保持高参数总量的同时,降低每次推理的激活参数和成本 [14] * **KV缓存的作用**:KV缓存是AI模型的短期记忆,可**重用已计算内容**,从而降低内存使用、加速推理并降低延迟 [17]。定价策略(如Minimax对缓存读取大幅打折)反映了开发者对优化特定工作负载的意图 [18] * **采用曲线**:早期采用者群体(重度用户、企业)的广泛使用,相比病毒式传播的消费者OpenClaw采用,更不容易出现“幻灭低谷” [4] * **应用层发展**:未来方向可能包括一对多/多对多智能体集群、跨平台编排,以及安全与权限管理,这些将有助于推动OpenClaw类技术超越早期采用者阶段 [25] **其他重要但易忽略的内容** * **地缘政治影响**:Z.ai被列入美国商务部实体清单,对其在美国等发达市场扩张构成实际限制 [46] * **用户参与度数据**:豆包、Qwen等AI应用的日活跃用户人均每日激活次数保持在**个位数中段**,Qwen在春节奶茶促销后因低参与度用户涌入而数据偏低 [24] * **字节跳动对豆包的定位**:字节跳动高管承认,豆包既是多模态工具,也是**试图颠覆互联网流量入口**的严肃尝试 [24] * **阿里云财务表现**:数据显示,阿里云在将资本支出转化为增量收入方面表现**稳健**,隐含的AI收入增长迅猛(例如2026财年Q4同比增长**200.8%**) [78] * **投资建议**:报告覆盖公司中,腾讯、阿里巴巴(美股和港股)均获得“跑赢大盘”评级,并给出目标价(如腾讯港股790港元,阿里巴巴美股180美元)[7][86][87]
从“吞噬”到“受益”,中国软件有望吃上“龙虾肉” !
硬AI· 2026-03-12 17:04
AI Agent发展带动Token消耗与需求变化 - OpenClaw的出圈带动AI Agent的Token消耗量飙升,其调用量最高可达传统聊天交互的15倍 [3][5] - OpenRouter平台的周度Token调用量在3月2日当周达到14.8万亿,在约两个月内增长了约160% [3][5] - AI应用变现与算力消耗曲线因Token爆发而被同步抬升 [3] 中国AI模型的全球竞争力提升 - 智谱GLM5、Minimax M2.5、月之暗面Kimi K2.5等中国模型凭借性能与成本效益优势,正持续抢占美国大模型的全球Token份额 [11] - 在OpenRouter平台上,2月9日当周排名前9的模型中,中国模型的Token周调用量占比首次超过美国模型 [11] - 在相似用量限制下,中国AI厂商的按月订阅定价约为海外厂商的20%至30%,成本效率成为推动Token迁移的重要变量 [12] 对AI基础设施与IDC需求的影响 - 强劲的Token调用量增长将提升对AI软件基础设施与数据中心(IDC)的需求 [3] - 超融合基础设施(HCI)与软件定义存储(SDS)可能迎来结构性机会 [12] - AI Agent普及带来的计算需求增长,有望推动国内IDC供应商订单增长 [12] AI Agent的产品形态与产业定位 - OpenClaw作为代表性AI Agent,可自动完成软件安装、脚本执行、文件组织和网页监控等任务,GitHub星标数已突破29.9万 [5] - Agent被定位为建立在既有软件、数据与权限结构之上的“智能调用层”与“任务编排层”,核心价值在于提升自动化与流程管理效率 [12][13] - 企业级Agent落地需要深度接入企业数据与权限控制,并设置安全防护,做到可观测、可评估、可审计 [15] 软件板块的价值重估 - 软件板块正迎来价值重估,AI Agent将软件的价值重心从“功能呈现”推向“流程编排、数据与权限治理” [3] - 软件公司正利用原有的流程入口和数据壁垒,快速将Agent产品化,而非被动挨打 [15] - 市场情绪从对“AI吞噬SaaS”的极端悲观叙事中修复,开始评估哪些公司受冲击最小或能在AI化浪潮中受益 [15]
互联网传媒周报:Token出海,谷歌渠道分成下降利好游戏CP-20260308
申万宏源证券· 2026-03-08 22:08
行业投资评级 - 看好 [1] 核心观点总结 - **HALO叙事交易演绎到极致,市场情绪有所平衡**:北美软件指数自2月23日以来反弹14%,港股互联网上周五反弹约4%,市场对AI颠覆叙事与传统软件互联网的悲观预期有所平衡 [2] - **AI颠覆叙事缺乏财务证据,国内互联网估值低但未被市场乐观预期**:报告认为当前AI颠覆叙事更多体现为估值变化,缺乏财务证据;国内互联网公司起点估值低,其用户粘性、生态和数据价值是AI时代分一杯羹的关键,但市场并未对此有乐观预期 [2] - **3月财报与回购将成为交易核心**:预计3月财报发布后盈利将成为交易核心,同时静默期后恢复回购有望提振市场信心 [2] - **哔哩哔哩广告业务受益于AI应用推广,AI投入担忧被高估**:哔哩哔哩25Q4及26年广告业务受益于AI应用行业推广需求提升,尽管市场担心AI投入拉低盈利能力,但报告认为AI广告和AI视频均有望放大其UGC社区价值 [2] - **国产大模型凭借性价比优势实现Token出海**:国产模型如Minimax的M2.5模型更新,凭借性价比优势分享全球Token爆发红利;Minimax的M2系列文本在2026年平均单日Token消耗量已增长至2025年12月的超过6倍,其中coding plan超过10倍,2025年中国内地外收入占比高达75% [2] - **谷歌降低应用抽成比例,利好出海游戏CP及分发平台**:谷歌宣布对Google Play商业模式进行结构性更新,将应用内购(IAP)抽成比例从最高30%调整为“内购服务费(降至20%)+支付结算费(部分地区5%)”的新结构,并开放更多支付方式及引入第三方应用商店注册计划;渠道分成比例下降利好出海游戏CP(如世纪华通、神州泰岳等25H1海外收入占比高的公司)增厚利润,开放第三方应用商店利好心动公司Taptap国际版等出海平台 [2] 重点公司关注列表 - **互联网**:腾讯、快手-w、哔哩哔哩、心动公司、金山云、阿里巴巴、百度;关注网易云音乐、美图、大麦娱乐 [2] - **游戏**:恺英网络、世纪华通、巨人网络、三七互娱、完美世界 [2] - **潮玩新消费**:泡泡玛特 [2] - **高分红**:分众传媒 [2] 重点公司估值与财务预测 根据2026年3月6日收盘市值,部分重点公司财务预测如下(单位:亿元人民币,除特别注明外) [4]: - **腾讯控股 (0700.HK)**:总市值41,710亿;预计25年营收7,556亿(YoY +14%),26年营收8,453亿(YoY +12%);预计25年归母净利润2,602亿(YoY +17%),26年3,007亿(YoY +16%);对应25/26年PE分别为16倍和14倍 [4] - **哔哩哔哩 (9626.HK)**:总市值747亿;预计25年营收303亿(YoY +13%),26年营收332亿(YoY +9%);预计25年归母净利润26亿(24年亏损),26年30亿(YoY +16%);对应25/26年PE分别为29倍和25倍 [4] - **心动公司 (2400.HK)**:总市值312亿;预计25年营收64亿(YoY +28%),26年营收79亿(YoY +23%);预计25年归母净利润15亿(YoY +67%),26年22亿(YoY +52%);对应25/26年PE分别为21倍和14倍 [4] - **世纪华通 (002602.SZ)**:总市值1,343亿;预计25年营收379亿(YoY +68%),26年营收452亿(YoY +19%);预计25年归母净利润62亿(YoY +408%),26年82亿(YoY +33%);对应25/26年PE分别为22倍和16倍 [4] - **神州泰岳 (300002.SZ)**:总市值208亿;预计25年营收59亿(YoY -8%),26年营收68亿(YoY +15%);预计25年归母净利润8亿(YoY -44%),26年13亿(YoY +66%);对应25/26年PE分别为26倍和16倍 [4] - **泡泡玛特 (9992.HK)**:总市值2,455亿;预计25年营收389亿(YoY +198%),26年营收527亿(YoY +36%);预计25年归母净利润136亿(YoY +324%),26年184亿(YoY +35%);对应25/26年PE分别为18倍和13倍 [4] - **阿里巴巴 (9988.HK)**:总市值22,030亿;预计FY26(对应25年)营收10,234亿(YoY +3%),FY27(对应26年)营收11,187亿(YoY +9%);预计FY26归母净利润958亿(YoY -40%),FY27归母净利润1,222亿(YoY +27%);对应FY26/FY27 PE分别为23倍和18倍 [4] - **分众传媒 (002027.SZ)**:总市值969亿;预计25年营收124亿(YoY +1%),26年营收130亿(YoY +5%);预计25年归母净利润29亿(YoY -44%),26年60亿(YoY +108%);对应25/26年PE分别为33倍和16倍 [4]
AI产业进程点评:进击的“龙虾”:OpenClaw使用量背后的意义
国联民生证券· 2026-03-01 20:59
报告投资评级 - 报告未明确给出整体行业的投资评级,但基于其核心观点与投资建议,对AI产业趋势持积极看法 [6] 报告核心观点 - OpenClaw在GitHub上的星标数已超过22.8万个,排名前5%,其单周新增星标数量超过7000个,为全市场第一 [2] - OpenClaw的GitHub星标数在2026年2月24日已超过22.4万,超越Linux内核的21.8万,成为GitHub上星标数排名第14的项目,创下GitHub历史上最快的星标数增长速度 [6] - OpenClaw使用量的里程碑式突破,标志着其影响力可与Linux内核比肩,正成为Agent生态中的重要“事实检验标准” [6] - OpenClaw的定位正从“热门项目”向大量开发者协作的“共识平台”转变,这种共识基础下的生态扩展能力可能成为其“护城河” [6] - OpenClaw所代表的边缘AI,通过开源和按量付费的商业特性,结合边缘AI保护隐私、成本适应性强的特点,使非大型科技公司和个人也具备“自有化AI”能力,推动AI从“少数人拥有的高端能力”变成“多数设备的基础功能” [6] - 在Agent趋势拉动下,Token消耗迎来发展,OpenRouter数据显示截至2月23日当周,其token usage已达12.1T,较一月接近翻倍,其中中国模型如Minimax M2.5、Kimi K2.5、Deepseek V3.2的token消耗量排名居前五 [6] - AI正进入应用落地、需求加速与产业链景气共振的阶段,中国Token消耗量的快速增加暗示算力推理需求快速增长 [6] 投资建议总结 - 建议关注具备模型或应用能力,受益于潜在API调用相关收入加速增长的公司,如【MINIMAX】、【智谱】 [6] - 建议关注具备算力资源、模型能力与应用场景协同的平台型互联网公司,如【阿里巴巴】、【腾讯控股】 [6] - 建议关注算力与Token消耗巨大,有望拉动相关云服务需求的公司,如【金山云】、【百度集团】、【金蝶国际】 [6] - 建议关注具有较强确定性的AI算力硬件层公司,如【天数智芯】、【壁仞科技】、【华虹半导体】、【澜起科技】以及美股算力链公司【SNDK】、【MU】、【NVDA】、【INTC】、【LITE】 [6]
从Kimi不急于上市说起
36氪· 2026-02-27 21:05
公司概况与市场地位 - Kimi是一家未上市的中国AI大模型公司,在不到2个月内完成了12亿美元的融资,估值超过100亿美元[1] - 公司此前凭借“200万字长上下文”功能获得33亿美元的估值,在“六小虎”中位列第一[5] - 公司近期在海外市场获得关注,其OpenClaw模型在调用榜上排名第一,并且海外收入已超过国内收入[10] 融资与估值对比 - 公司12亿美元的融资金额,相当于近期完成港股IPO的Minimax和智谱两家公司的融资金额之和[3] - Minimax和智谱上市40多天后,股价上涨了5倍[3] 技术发展与模型性能 - 公司当前主力模型为Kimi-K2.5,其下一代模型K3被寄予厚望,要求具备“其他模型没有定义过的能力”,以帮助“营收规模实现数量级增长”[3] - Kimi-K2.5在Arena AI编程排行榜上高居开源模型第一[14] - 根据OpenRouter数据,在2月2日当周,K2.5在编程模型调用中排名第一,占比36.7%[14] - 但在2月11日Minimax发布M2.5后,M2.5连续霸榜三周,逆转了调用情况[14] - 字节的Seed模型是Arena AI上排名第一的中国编程模型[16] 商业化战略与挑战 - 公司创始人杨植麟提出在“产品和商业化上聚焦智能体”[11] - 公司推出了“智能体集群”功能,但仅开放给199元/月的高级用户,主要面向B端[23] - 公司曾尝试对标OpenAI,但面临巨头竞争压力,OpenAI背后有微软支持,而谷歌也已重新掌控节奏[5] - 在国内市场,春节期间的AI应用霸榜(豆包、千问、元宝)显示了激烈的C端竞争,断绝了Kimi的国内C端念想[5][9] - 在国内B端市场,公司缺乏资源[9] - 因此,公司选择出海作为重点方向[10] - 公司试图构建“Anthropic + Manus”的叙事,Anthropic是AI独角兽的共同选择,公司曾实现“20天收入超全年”的成绩[13] 定价策略与市场竞争 - 在定价方面,Kimi-K2.5的百万token输出单价为3美元[15] - 相比之下,智谱GLM-5为2.55美元,而Minimax M2.5仅为1.2美元[15] - 具体计费上,Kimi-K2.5每百万token的输入价格(缓存命中)为0.70元人民币,输入价格(缓存未命中)为4.00元人民币,输出价格为21.00元人民币,上下文长度为262,144 tokens[16] - 在DeepSeek影响下,中国AI独角兽普遍选择开源,这使得Anthropic叙事变成了面向小B市场的故事[16] - 大B客户目前更看重性能而非成本,通常会选择大厂产品[16] - 在海外,C端用户主要被ChatGPT等硅谷产品吸引[17] - 海外大B客户同样更信任能提供一站式IT基础设施服务的大厂[19] - 小B客户普遍追求性价比,定价偏高的Kimi主要依靠“OpenClaw的调用第一”作为卖点[19] 上市计划与未来展望 - 创始人杨植麟在2025年末的内部信中谈到“不着急上市”,但公司三大战略均包含对上市的部署[3] - 分析认为,“不以上市为目的”前面应加上“短期”限定,上市是一个现实的好目标[3][25] - 公司手头拥有100亿元人民币现金,足以再支撑三到五年[28] - 但合适的上市窗口不会一直存在,需要把握时机,历史案例(如Affinion公司)显示错过窗口可能导致估值和融资额大幅缩水[28] - 当前的AI泡沫和潜在的美股回调是市场面临的宏观风险[28]
计算机行业周报:大模型融资持续火热,AI应用生态加速落地-20260226
渤海证券· 2026-02-26 15:05
行业投资评级 - 维持计算机行业“中性”评级 [1][27] - 维持对虹软科技(688088)“增持”评级 [1][27] 报告核心观点 - 大模型融资持续火热,AI应用生态加速落地,行业商业化拐点有望提前到来 [1][26][27] - AI算力需求仍处于高速增长阶段,算力产业链具备较为确定的投资机遇 [1][26][27] - 国内模型厂商凭借开源模式与低成本优势,正吸引全球开发者参与生态构建 [1][11][26] - 在模型迭代提速与互联网大厂应用推广的双重驱动下,建议关注应用端具备AI技术落地实力与场景适配优势的头部企业 [1][26][27] 行业要闻总结 - **国产大模型在OpenRouter平台表现领先**:2月24日数据显示,平台前十模型总token量约8.7万亿,中国模型独占5.3万亿,占比61%,调用量前三均为国产模型(Minimax M2.5、Kimi K2.5、GLM-5)[11] - **Kimi连续融资,估值翻倍**:在完成上一轮5亿美元融资后,月之暗面Kimi新一轮超7亿美元融资即将交割,连续两轮融资总额超12亿美元,估值突破100亿美元,为近一年来行业最高融资金额 [1][11] - **Anthropic推出企业插件,嵌入Office**:人工智能公司Anthropic发布企业级AI工具包“Cowork & Plugins for the Enterprise”,将其Claude模型直接嵌入微软Excel和PowerPoint等办公软件,并支持Google Drive、Gmail等平台,向微软和OpenAI发起挑战 [1][12][13] 行业数据总结 - **算力租赁价格保持平稳**:监测期内,不同配置的GPU计算集群在主要云平台价格环比无变化,例如配置为A100-40GB*8的集群在腾讯云价格为161.50元/小时 [14][16] 公司公告总结 - **虹软科技发布2025年度业绩快报**:2025年度,公司实现营业总收入9.23亿元,同比增长13.22%;归母净利润2.58亿元,同比增长45.86%;扣非净利润2.13亿元,同比增长36.85%。移动智能终端与智能汽车业务收入均实现增长 [15] - **开普云终止重大资产重组**:公司决定终止拟通过支付现金及发行股份方式收购深圳金泰克存储产品业务的重大资产重组事项 [1][16][17] 行情回顾总结 - **板块走势**:2月12日至2月25日,沪深300指数上涨0.47%,申万计算机行业指数下跌0.61%。三级子行业中,其他计算机设备上涨1.55%,横向通用软件下跌3.36% [1][18] - **板块估值**:截至2026年2月25日,申万计算机行业市盈率(TTM)为217.97倍,相对沪深300的估值溢价率为1499.98% [19] - **个股表现**:本周部分公司受益于商业航天、AI算力、AIGC等概念影响,涨幅前五位为星环科技、海联讯、佳创视讯、古鳌科技、友车科技;跌幅前五位为*ST立方、开普云、每日互动、国能日新、亚康股份 [22] 本周策略总结 - **AI算力**:海外云计算厂商(亚马逊、谷歌、微软、Meta)2026年资本开支预计维持高速增长,印证全球AI算力需求旺盛 [1][26] - **AI大模型**:近期大模型厂商融资事件密集,有望加速其基础设施建设和模型迭代升级 [1][26] - **AI应用**:海外方面,Anthropic推出企业级AI智能体平台冲击传统软件业务;国内方面,字节跳动、阿里、腾讯、百度四家大厂春节期间累计投入超45亿元,加速AI应用向C端普及渗透 [1][26]
3000亿港元AI巨头发力AI编程 公开GLM-5技术细节
搜狐财经· 2026-02-24 14:00
资本市场表现与市场地位 - 智谱股价在2026年开年表现强劲,单日涨幅超过15%,市值突破3000亿港元 [1] - 春节后港股首个交易日(2月20日),公司市值一度攀升至3232亿港元,超越京东、快手等传统互联网巨头,跃居港股TMT板块市值第一梯队 [1] - 根据OpenRouter最新周度数据,平台前十模型总token调用量约8.7万亿,其中中国模型独占5.3万亿,占比61%,当周token调用量前三的模型均为国产大模型 [1] 技术突破与模型性能 - 智谱发布的GLM-5大模型在真实世界编程任务中展现出前所未有的能力,在处理端到端软件工程挑战方面,全面超越此前所有开源基线模型 [1] - 在全球权威的真实编程任务评测SWE-bench Verified中,GLM-5取得了77.8%的高分,位列开源模型第一,多项指标直接对标闭源天花板Claude Opus系列 [8] - 硅谷顶级风投机构a16z将GLM-5与闭源模型Claude Opus系列对标,并在其行业报告中指出,开源大模型与顶级闭源模型之间的能力差距正在快速收窄 [2][8] 核心技术创新与架构 - GLM-5实现了四大技术突破:Slime异步强化学习基建、AgentRL异步智能体强化学习算法、DSA稀疏注意力机制以及全栈国产芯片适配 [23] - AgentRL是中国原创核心算法,适配复杂长程交互学习,是GLM-5超越开源基线的关键 [23] - DSA稀疏注意力机制结合MoE架构,在保留200K超长上下文能力的同时,大幅降低长序列计算与推理成本 [23] - 模型完成了与华为昇腾、摩尔线程等七大国产算力平台的全栈深度优化,单节点性能媲美双GPU集群,长序列处理成本降低50% [23] 行业范式转变:从氛围编程到智能体工程 - GLM-5的核心定位是推动全球AI编程范式从“Vibe Coding”(氛围编程)全面转向“Agentic Engineering”(智能体工程) [4] - “Agentic Engineering”由前特斯拉AI负责人、OpenAI创始成员Andrej Karpathy提出,正成为全球AI产业的核心竞争赛道,该技术通过标准化工程体系,将具备自主规划、执行、纠错能力的AI智能体转化为可稳定落地的企业级生产力工具 [4] - 行业主流AI编程此前处于“Vibe Coding”时代,AI本质上是程序员主导的辅助工具,难以处理长周期、多步骤的系统性工程任务 [7] - GLM-5将AI推向“Agentic Engineering”新时代,AI能够作为“虚拟工程师”自主承担端到端软件工程,完成需求拆解、架构设计、代码编写、调试迭代、项目维护等全流程开发任务 [7] 实测验证与应用场景 - 记者实测要求GLM-5从0到1创建名为「MonoGlass Gallery」的个人摄影作品集网站,模型在数分钟内便完整生成了适配专业作品集网站的全页面设计与可部署前后端代码 [12][16] - 在企业级MLOps架构规划实测中,GLM-5以资深MLOps架构师身份,完成了云原生编排与传统容器化方案的对比分析,并输出包含工具评估、部署路线、风险评估的Excel工作簿,对复杂技术需求的拆解能力表现突出 [18][20][21] - 在正式发布前,GLM-5的匿名测试版本Pony Alpha已在海外开发者社区OpenRouter登顶热度榜,开发者发现其能在完全无人干预的情况下,自主读取复杂错误日志、跨文件修复底层代码漏洞,甚至耗时数天从零构建出可用的C语言编译器 [7] 行业竞争格局与影响 - 在智能体工程领域,以智谱为代表的国内创业企业已在核心技术与开源生态上形成局部突破,在垂直场景落地方面展现出显著优势 [2] - 中国企业正成为Agentic Engineering领域全球第二大创新极,国内头部互联网大厂已完成全栈技术布局,以智谱为首的多家创业公司在核心技术、开源生态上实现局部突破 [5] - GLM-5的出现改变了全球大模型市场格局,此前只有闭源头部模型敢触碰的Agentic Engineering领域,如今被开源的中国模型率先突破 [8] - Agentic Engineering领域全球产业格局已初步成型,微软、OpenAI、谷歌DeepMind凭借全栈技术布局与行业标准定义权稳居头部,Anthropic、英伟达等企业在细分领域领跑 [4]
智谱GLM-5-VS-Minimax-M2
2026-02-13 10:17
涉及的行业与公司 * 行业:人工智能大模型、生成式AI、AI Agent * 公司:智谱(GLM系列)、Minimax(M系列)、海外模型(如Cloud OPIUS、Codex、OPPOS) 核心观点与论据 **1 模型发布与定位** * 智谱发布GLM-5,是面向复杂工程和代理任务的大版本更新,在长期任务中显著进步,缩小了与Cloud OPIUS 4.5的差距,并在部分测试中超越后者[1][2] * Minimax发布M2.5,是全球首个为Agent场景原生设计的生产级模型,支持Excel处理、深度调研及PPT等生产力场景,但API尚未上线且未公布价格[1][3] **2 功能更新** * 智谱推出三项新功能:特工模式(视角转换、数据分析、AI PPT支持)、数据洞察(数据解析、画图、导出多种格式文件)以及写作功能(支持多种写入模式并导出PDF和Word)[1][2][3] * 在办公场景下,GLM-5和Minimax M2.5均能使用Agent模式进行信息获取并生成演示文稿,并可导出为PDF或PPTX格式文件[2][6] **3 价格策略与变化** * GLM-5的Output定价为每百万Tokens $3.2[1][4] * GLM-4.6和GLM-4.7的API价格从$1.5提升至$2.2,国内价格提升幅度在33%至100%之间,海外市场为67%至100%[1][4] * 智谱Coding Plan国内Light和Max两个季度收费版本分别提高了23%和18%,海外市场分别提高了60%和30%[1][4] * Minimax前代模型M2和M2.1每百万Tokens定价约为$1[2][4] * 智谱最小订阅计划每月49元,用量是Cloud Pro套餐的三倍;Minimax最小订阅计划每月29元,用Props而非Tokens计价[2][4] **4 模型能力对比** * **代码能力**:GLM-5和Minimax M2.5差距不大,仅在物理模拟或多模态案例上有所区别[2][5] * **股价分析任务**:两者均能完整且准确地完成任务,GLM-5在细节处理上稍显优越,而Minimax M2.5在自主思考方面表现突出[2][7] * **复杂网页开发**:两者能力相当,GLM-5因调用多种技能使内容更详实,Minimax M2.5在图片选择上偶有瑕疵[8][9] * **与海外模型对比**:GLM-5的能力已可追上Codex 4.7、Codex 4.8以及OPPOS 4.7等海外模型,在代码及Agent任务方面表现出色,属国内领先水平[2][10] 其他重要内容 * GLM-5的API和Coding Plan已上线,Coding Plan于2月16日正式上线[1][2] * 在交互式粒子实验等物理模拟任务中,Kimi K2.5表现优于GLM-5和Minimax M2.5[5] * 在Z点AI平台上使用相同办公案例时,效果更好,例如营收增长趋势图表能够直接绘制出来[6] * 各模型之间的能力差距正在逐步缩小[10]