核心观点 - 智谱正式发布全球首个集深度研究与实际操作能力于一体的AI Agent AutoGLM沉思,推动AI进入"边想边干"阶段 [3][5][6] - AutoGLM沉思融合深度思考、感知世界和工具使用三大能力,突破传统AI局限,实现长程推理和任务执行 [7][8][9] - 智谱在AI Agent领域持续创新,从Function Call到智能体编排再到设备操控智能体,保持技术领先 [6] - 公司自主研发全栈大模型技术,包括基座模型、推理模型和沉思模型,将于4月14日开源 [13][14][28] 技术演进 - 技术路径:GLM-4基座模型→GLM-Z1推理模型→GLM-Z1-Rumination沉思模型→AutoGLM模型 [3] - 新版基座模型GLM-4-Air-0414:320亿参数,优化智能体任务能力,32B参数量比肩更大模型 [15] - 新版推理模型GLM-Z1-Air:深度优化通用能力,推理速度提升8倍,成本降低至1/30,可在消费级显卡运行 [17][19][21] - 沉思模型GLM-Z1-Rumination:通过强化学习提升长程推理能力,结合实时搜索、工具调用和深度分析 [24][26] 性能表现 - AutoGLM系列在AgentBench评测中取得SOTA成绩,Phone Use任务成功率提升超20%,Browser Use超越GPT-4o和Claude-3.5-Sonnet [10] - 自研模型GLM-PC(CogAgent)仅9B参数即超越GPT-4o + UGround等更大规模模型 [12] - GLM-Z1-Air在AIME 24/25、LiveCodeBench等基准测试展现强大数理推理能力 [17] 生态布局 - 战略聚焦Agentic GLM研发,推动智能体技术发展,搭建Agentic LLM平台助力生态合作伙伴 [31] - 已携手金融、教育、医疗、政务等领域合作伙伴推进Agentic LLM落地应用 [33][34] - 与多个城市达成合作,推动当地大模型应用生态建设 [34] - 推动中国AI解决方案出海,帮助"一带一路"国家构建自主大模型,发起"自主大模型国际共建联盟" [35]
智谱发布AutoGLM沉思版,背后推理模型媲美DeepSeek-R1:推动AI Agent进入「边想边干」阶段
IPO早知道·2025-03-31 12:07