Seek .-智谱想给DeepSeek来一场偷袭

文章核心观点智谱在3月31日中关村论坛闭幕式现场推出新模型反击DeepSeek，同时公司在商业化布局、技术研发等方面有相应规划和思考，以应对行业变化和挑战 [2][6] 公司动态 - 3月31日智谱在智能体产品和基座模型两大维度分别推出"AutoGLM沉思模型"和推理模型GLM - Z1 - Air，Air用32B参数比肩671B的DeepSeek R1模型，价格仅为其1/30，且将于4月14日正式开源 [2] - 智谱CEO张鹏称公司在为IPO铺路但无具体计划，商业化以端侧为切口渗透七大行业，还宣布与东盟十国及“一带一路”沿线国家共建“自主大模型共建联盟” [6] - 智谱2023年开始在Agent领域投入，现阶段认为进入可大规模应用和落地阶段 [16] - 智谱会对具身智能进行相应布局，但还需时间 [19] 行业现状 - 2025年大模型圈“预训练”难成关键词，大模型六小虎中百川智能大批核心成员离职并砍掉部分业务，零一万物放弃万亿参数赛道转向B端业务 [3] - 自2025年初DeepSeek以“成本优势 + 开源”撕开市场缺口，头部云厂商依托生态优势卡位，大模型创业公司用价格力挽狂澜 [9] - 第一季度资本对大模型初创公司失去耐心，除智谱连续拿到地方产投融资，无市场化资本进入其余大模型企业 [4] - 大模型企业面临商业化难题，预训练未能让基座模型厂商形成护城河 [5][6] 对话问答开源策略与商业化 - 开源是智谱从第一天开始坚持的事，宣布2025年为开源年是考虑DeepSeek对技术生态和认知的影响，公司认为模型即服务（MaaS）会落地，开源与否不是关键问题 [12] 预训练与推理模型 - 预训练仍很重要，是RL等方法的基座模型天花板，其中预训练的架构、数据使用效率等有很多待研究点 [13] - 推理模型在泛用性任务上表现不及预期，但技术改进会产生新可能，其应用受技术发展阶段影响 [14] 融资计划 - 实现AGI路程长，从0到1开拓试错成本高，公司走在前面的部分需加大投入 [15] Agent领域 - Agent核心能力是模型本身能力和感知环境与环境智能交互能力，AutoGLM更早用于手机端，其他端侧也可接入，但存在设备交互方式和硬件适配问题 [17] 战略层面 - 公司定位技术驱动，技术研发和商业化两条腿动态调整，目前核心任务和资源投入仍侧重技术研发 [21] 落地预期 - 去年公司整体实现超100%增长，今年预计市场呈十倍以上增长，公司会保持稳定商业化落地速度和效益 [22]