DeepSeek和智谱都将于近日发布新模型,或将迎来重大突破

据IPO早知道消息,DeepSeek于9月29日发送更新新模型的公告,DeepSeek-V3.2新模型已被上传至社区平台HuggingFace。 另据「IPO早知道」了解,智谱新模型GLM-4.6也将于近日发布,目前部分用户已可通过API接口调用。 国内两家最头部的大模型企业。 本文为IPO早知道原创 作者|Stone Jin 这意味着,DeepSeek和智谱这两家中国最为头部的大模型企业都有望迎来新的重大进展。 往前追溯,DeepSeek于8月正式发布 了DeepSeek-V3.1。本次升级包含以下主要变化:1、混合推理架构:一个模型同时支持思考 模式与非思考模式;2、更高的思考效率:相比 DeepSeek-R1-0528,DeepSeek-V3.1-Think 能在更短时间内给出答案;3、更强的 Agent 能力:通过 Post-Training 优化,新模型在工具使用与智能体任务中的表现有较大提升。 而智谱则在7月新一代旗舰模型 GLM-4.5,专为智能体应用打造的基础模型,其首次在单个模型中实现将推理、编码和智能体能 力原生融合,以满足智能体应用的复杂需求。8月,智谱还推出了全球 100B 级效果最佳 ...