Workflow
Agentic Engineering
icon
搜索文档
智谱宣布开源新一代旗舰大模型GLM-5 并宣布GLM Coding Plan涨价
新京报· 2026-02-12 12:57
公司核心产品发布 - 智谱于2月12日开源新一代旗舰大模型GLM-5 [1] - 该模型此前以“Pony Alpha”为名在OpenRouter平台走红 性能强劲受到国外开发者关注 [1] - GLM-5参数规模从355B扩展至744B 激活参数从32B增至40B [1] - 预训练数据从23T提升至28.5T 更大规模算力提升了模型的通用智能水平 [1] - 模型构建了全新的“Slime”框架 支持更大模型规模及更复杂的强化学习任务 提升训练效率 [1] - 提出异步智能体强化学习算法 使模型能够持续从长程交互中学习 激发预训练模型潜力 [1] 产品性能与定位 - GLM-5在编程能力上实现了对齐Claude Opus 4.5 性能超过了Gemini3 Pro [1] - 在编程与智能体能力上 GLM-5取得了开源模型中的技术领先 [2] - 在真实编程场景的使用体感逼近Claude Opus 4.5 擅长复杂系统工程与长程智能体任务 [2] - 公司认为大模型正从“Vibe Coding”变革为“Agentic Engineering” GLM-5是这一变革的产物 [2] 公司业务战略与市场动态 - AI编程是智谱近期尤为重视的发展方向 [1] - GLM Coding Plan市场需求持续强劲增长 用户规模与调用量快速提升 [2] - 为保障高负载下的稳定性与服务质量 公司同步加大算力与模型优化投入 [2] - 公司决定对GLM Coding Plan套餐价格体系进行结构性调整 整体涨幅自30%起 [2] - 具体调整包括取消首购优惠 保留按季按年订阅优惠 已订阅用户价格保持不变 新价格于2026年2月12日生效 [2]
智谱股价再创新高、市值超1700亿港元:GLM-5对齐Opus 4.5,七大国芯护航上线
IPO早知道· 2026-02-12 10:55
公司股价与市场反应 - 智谱(2513.HK)今日开盘上涨超25%,再创历史新高,市值突破1700亿港元 [2] - 摩根大通预计公司2025-2030年营收年复合增长率为127%,并将于2029年实现盈利,目标价较当前股价仍有较大涨幅空间 [8] 新模型GLM-5的核心能力与行业意义 - GLM-5在编程能力上对齐Claude Opus 4.5,在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,性能超过Gemini 3 Pro [2][10] - GLM-5在Agent能力上实现开源SOTA,在BrowseComp、MCP-Atlas和τ²-Bench等多个评测基准中取得开源第一 [15] - 在衡量模型经营能力的Vending Bench 2中,GLM-5获得开源模型第一表现,最终账户余额达到4432美元,经营表现接近Claude Opus 4.5 [17] - GLM-5标志着开源阵营首次在“工程可交付性”上实现对顶尖闭源模型的追赶,为全球开发者提供了首个具备系统工程能力的开源基础模型,改变行业格局 [3] - 模型能力正从“会写”进化到“会做事”,GLM-5能够以极少的人工干预自主完成Agentic长程规划与执行、后端重构和深度调试等系统工程任务,使用体感逼近Opus 4.5,在前端、后端、长程任务等编程开发任务上显著超越GLM-4.7,平均增幅超过20% [12] 公司的技术路线与战略定位 - 摩根大通认为模型能力是决定AI模型开发商长期竞争力的根本要素,智谱已展现出坚实的技术实力,只要能将其自研模型的性能保持在全球顶尖梯队,巨大的AI能力需求叠加中国独特的工程成本优势将支撑公司营收走出强劲增长轨迹 [7] - 公司被摩根大通定义为一个具备显著增长潜能的技术能力驱动型平台,其战略明显向智能体系统、工具增强推理与面向开发者的基础设施倾斜,技术路线图正与全球前沿技术能力维度对齐 [7] - 公司可规模化扩张的云API业务以及正在加速推进的全球开发者生态落地,已成为其增长的重要驱动力 [7] 国产算力适配与生态支持 - GLM-5已完成与华为昇腾、摩尔线程、寒武纪、昆仑芯、沐曦、燧原、海光等国产算力平台的深度推理适配,通过底层算子优化与硬件加速,在国产芯片集群上实现高吞吐、低延迟的稳定运行 [5] - GLM系列模型一直受到全球开发者喜爱,GLM Coding Plan曾全球爆量导致公司启动限售,而GLM-5的上线依托众多国产芯片有力保障了线上服务的稳定和高效 [3]
智谱GLM-5发布:技术全面升级 Agent能力达开源SOTA
智通财经· 2026-02-12 08:26
公司发布新一代旗舰大模型 - 智谱公司正式发布新一代旗舰大模型GLM-5 [1] - 该模型旨在完成复杂系统工程与长程Agent任务,在日常工作场景中展现出开源SOTA级Agentic Engineering能力 [1] - 实际使用体验对标Claude Opus4.5 [1] 行业技术范式转变 - 当前AGI行业正从“Vibe Coding”向“Agentic Engineering”范式转变 [1] - 模型能力从简单对话、快速原型,升级为自主解决现实世界长程系统工程 [1] - GLM-5正是面向这一趋势打造的新一代基座模型 [1] 模型技术参数与架构突破 - GLM-5参数规模扩展至7440亿 [1] - 预训练数据增至28.5万亿tokens [1] - 构建了全新的异步强化学习基础设施“Slime”框架,以充分激发模型潜力 [1] - 首次集成稀疏注意力机制,在保证长文本效果的同时大幅降低部署成本 [1] 模型基准测试表现 - 在编程能力上对齐Claude Opus4.5 [1] - 在SWE-bench-Verified和Terminal Bench2.0中分别获得77.8分和56.2分,为开源模型最高分数 [1] - 性能表现超过Gemini3Pro [1] 模型Agent能力表现 - 具备开源SOTA的Agent能力 [2] - 在BrowseComp(联网检索与信息理解)中取得开源第一表现 [2] - 在MCP-Atlas(工具调用和多步骤任务执行)中取得开源第一表现 [2] - 在τ-Bench(复杂多工具场景下的规划和执行)中取得开源第一表现 [2]
智谱(02513)GLM-5发布:技术全面升级 Agent能力达开源SOTA
智通财经网· 2026-02-12 08:26
公司产品发布 - 智谱公司正式发布新一代旗舰大模型GLM-5 [1] - GLM-5模型能够完成复杂系统工程与长程Agent任务,在实际使用体验上对标Claude Opus 4.5 [1] - GLM-5在编程能力基准测试中与Claude Opus 4.5对齐,在SWE-bench-Verified和Terminal Bench 2.0中分别获得77.8和56.2的开源模型最高分数,性能表现超过Gemini 3 Pro [1] 行业技术趋势 - 当前AGI行业正从“Vibe Coding”向“Agentic Engineering”范式转变,模型能力从简单对话、快速原型升级为自主解决现实世界长程系统工程 [1] - GLM-5是面向“Agentic Engineering”趋势打造的新一代基座模型 [1] 模型技术规格 - GLM-5参数规模扩展至744B,预训练数据增至28.5T [1] - 模型构建了全新的异步强化学习基础设施“Slime”框架 [1] - 模型首次集成稀疏注意力机制,在保证长文本效果的同时大幅降低部署成本 [1] 模型能力表现 - GLM-5具备开源SOTA的Agent能力 [2] - 在BrowseComp(联网检索与信息理解)、MCP-Atlas(工具调用和多步骤任务执行)和τ²-Bench(复杂多工具场景下的规划和执行)基准测试中均取得开源第一表现 [2]
退隐3年后回归,周末写的AI一夜刷屏、一周拿下10万Star增速超Linux,Clawdbot之父首次长谈:如今几乎不看自己发布的代码
AI科技大本营· 2026-02-04 18:07
OpenClaw (Clawdbot) 项目概况 - 项目在不到一周内获得10万颗GitHub Star,Fork数迅速攀升至2.2万,增长曲线超越了Linux内核、Vue、React等经典项目[1] - 项目最初名为WhatsApp Relay,后更名为Clawdbot,因侵权投诉改为Moltbot,最终定名为OpenClaw,并以其“龙虾”Logo闻名[3][5][6] - 该项目几乎完全由一人主导开发,是开发者Peter Steinberger利用周末时间在两个月内构建的个人项目[8] 创始人背景与PSPDFKit创业历程 - 创始人Peter Steinberger曾创办并打造了PSPDFKit,这是一款专业的PDF开发工具套件,被广泛应用于超过10亿台设备[9][16] - 其开发iOS应用的契机源于2009年一次糟糕的移动网页体验,促使他开发了一款交友客户端并上架App Store,第一个月收入约1万美元[19][20][21][24] - 在帮助他人重写一个崩溃的杂志App后,他正式进入PDF阅读器开发领域,并从中抽离出PDF组件进行商业化,最初以每份约200美元的价格售出三份[25][26][27] - PSPDFKit的名字在五分钟内确定,公司运营了13年,其市场策略专注于开发者社区,通过优质产品、技术博客和会议进行推广[30][31] - 公司采用远程优先模式,在创始人出售股份时团队约70人,现已发展至约200人[33] 软件开发理念与商业模式 - 公司认为软件体验比功能数量更重要,致力于像苹果一样用爱和精致打磨产品[29] - 将产品定位在“困难且不有趣”的象限,认为解决开发者不想做的难题才是好的商业利基市场[36][37] - 企业销售采用定制化定价模式,因为不同规模公司(如自由职业者与财富500强)的使用方式和价值不同,统一价格会排除某一方客户[36] - 重视客户支持,采用“list in reverse”策略,力求在五分钟内回复工单,创始人曾亲自花费两个月重构架构以解决客户遇到的性能问题[39] AI赋能下的新开发范式 - 在Claude、Codex等大模型工具加持下,创始人Peter Steinberger在2024年1月一个人提交了超过600次代码[10] - 其工作方式已转变为“智能体工程”,利用AI代理进行开发,自身角色更像“建造者”或“架构师”,关注系统架构而非逐行代码审查[58][63][66] - 开发流程强调“闭环”,即让AI代理能够自己调试、编写测试并验证输出,这被认为是效率大幅提升的关键[68][72] - 使用AI工具后,文档和测试的生成质量非常高,创始人通过向模型阐述设计思路和权衡来让其自动生成文档和测试,这已成为流程的一部分[74] - 在AI辅助下,重构和尝试新方向的成本极低,例如Clawdbot从单Agent、单Provider架构改为多Agent、多Provider架构仅用了约三小时,而手动编码可能需要两周[85][86] Clawdbot的产品愿景与特点 - 项目的核心愿景是创建一个高度个人化、数据本地的AI助手,能够深度理解用户上下文并主动提供帮助,类似于电影《Her》中的概念,被认为是Siri未来形态的雏形[89][90][108] - 产品始于一个简单的“WhatsApp Relay”想法,让用户能通过WhatsApp从手机触发电脑操作,在真实使用中其能力不断扩展,让开发者本人也感到上瘾[92][94] - 项目通过极致的体验设计隐藏技术复杂性,为用户提供“魔法”般的初次体验,包括自动环境检测、引导配置、以及为AI助手创建独特身份和灵魂的启动仪式[114][115][117][118] - 系统支持多种通讯平台(如WhatsApp、Discord、Slack等),并即将支持电话呼叫功能,其背后是一个能够自我更新、修改配置的智能体系统[112][120][135] 对行业及开发模式的深远影响 - 采用当前AI工具,可以用原来30%的资深人员规模运营起类似PSPDFKit这样的公司,但要求人员具备深厚的系统理解能力和“放权”给AI代理的思维[80] - 传统代码审查已经过时,Pull Request更应被视为“Prompt Request”,其价值在于帮助理解功能目标,而非代码本身,合并时经常基于PR的意图由AI代理重新设计和实现[12][124][125] - 大公司难以高效采用AI,因为这不仅是工具升级,更需要彻底重构公司的运作方式和代码库,以适配“对Agent友好”的新范式[122][124] - 未来的优秀工程师需要具备强烈的产品视角、系统级理解能力和架构品味,并通过持续实践(“玩”和“拼命干”)来掌握驾驭AI代理的隐性技能[127][138][139] - 新一代开发者有机会以全新的、未被旧经验束缚的方式使用AI代理,建立系统理解的方式可以是通过AI深度分析复杂的开源项目设计[140]
凌晨三点写代码、10个 Agent 同时跑!ClawdBot 创始人自曝 AI 上瘾史:Claude Code 入坑,Codex 成主力
AI前线· 2026-01-29 16:10
文章核心观点 - AI驱动的开发范式正在发生根本性转变,资深开发者Peter Steinberger通过构建ClawdBot项目,展示了利用AI编程工具(如Claude Code、Codex)进行高效“智能体工程”的实践,其工作流、团队协作和软件架构理念与传统开发方式截然不同 [3][4][46][66] - 软件开发的核心从逐行编写代码,转变为设计可验证的闭环系统、引导AI智能体以及专注于整体架构和产品“品味”,这大幅降低了试错成本并提升了创新速度 [52][69][77][78] - 这一转变对软件行业和组织结构将产生深远影响,可能意味着未来需要更少但能力更全面的“构建者”,而传统大公司因组织边界和流程僵化,难以高效采用这种新模式 [101][102] 创始人背景与创业历程 - Peter Steinberger是PSPDFKit的创始人,该PDF框架被用于超过**十亿台**设备,他经历了严重的职业倦怠后卖掉股份,离开科技圈三年 [2][9][41] - 其技术生涯始于14岁,早期通过开发一款定价**5美元**的交友App,第一个月赚取**一万美元**,并因此决心创业 [13][15] - PSPDFKit起源于一个杂志阅读App的PDF渲染难题,Peter将其抽离为独立组件并销售,最初一周内以**200美元**的价格售出三份,随后价格涨至**600美元、800美元**,其收入很快超过他在旧金山工作的工资 [19][20][21][22] - 创业驱动力并非金钱,而是创造令人惊叹、注重细节和体验的产品,其理念是产品的“感觉”比功能列表更重要 [23][24] - PSPDFKit采用针对开发者的营销策略,通过打造卓越产品、撰写深度技术博客和参加开发者大会来建立口碑,而非侵略式销售 [27] AI编程实践与工作流变革 - Peter在2023年回归后直接使用Claude Code等AI工具,跳过了早期迭代阶段,其体验如同“赌场小老虎机”,对结果感到震撼并迅速上瘾 [46][47][49][50] - 当前工作流核心是“智能体工程”,其角色从编码者转变为“构建者”或“架构师”,同时管理**5到10个**并行运行的智能体,进行系统设计和规划 [54][62][68] - 高效秘诀在于构建“完整闭环”,让智能体能够自行编写测试、调试并验证其输出,从而确保代码质量并信任其结果 [69][70][71] - 使用AI编程要求开发者掌握新的“机器语言”,通过持续对话和反馈来引导模型,这是一种需要练习的技能 [56][75][76] - 开发过程更像迭代式“雕塑”,从一个模糊想法开始,通过快速试错(成本降至分钟级)来塑造产品,而非前期的完美规划 [77][78][79] ClawdBot产品理念与特性 - ClawdBot是一个高度个人化的AI助手,其愿景是成为理解用户上下文、情感和人际关系的“反CRM”式伙伴,类似于电影《Her》中的体验 [80][81] - 产品设计原则是将所有复杂性隐藏到“理所当然”的程度,用户通过自然聊天(如WhatsApp)与助手交互,无需感知后端的多智能体、算力等复杂系统 [84][92][96] - 其技术实现倾向于使用CLI工具而非MCP协议,因为CLI更灵活,允许模型使用如`jq`等工具进行链式组合和过滤,效率更高 [86][87][88][89] - 项目在社交平台爆火,一周内GitHub star数从**100**涨至**3000多**,并合并了**500多个**PR,Peter自嘲为“人肉合并按钮” [90][92] - 产品包含引导和“灵魂”塑造过程,通过对话生成记录用户偏好的文件(如`user.md`, `soul.md`),使交互体验更个性化 [97] 对软件工程与行业的影响 - AI编程可能显著改变公司人员结构,未来或仅需**三成**的现有人员规模,但要求成员具备高自主性、全栈产品视角和系统架构能力 [76][101][102] - 大公司因严格的角色分工和流程,难以有效采用这种新模式,这需要组织层面的深度重构而不仅是工具引入 [101][102] - 代码评审(PR)的意义发生变化,更应被视为“Prompt Request”,讨论重点转向架构决策、设计权衡和代码风格,而非逐行审查 [3][102][110] - 对持续集成(CI)的依赖降低,更重视本地的、由智能体执行的测试闭环(“full gate”),追求快速迭代 [105][107][108] - 未来的理想团队成员是活跃在开源社区、热爱技术“游戏”、具备快速学习和实验精神的全能型“构建者” [113][114][115]