GLM 4.6
搜索文档
最新外国「自研」大模型,都是套壳国产?
36氪· 2025-11-01 13:02
Cursor公司Composer模型发布 - Cursor发布2.0版重大更新,推出首个自家代码模型Composer以及用于并行协作多个智能体的新界面[4] - Composer是使用强化学习训练的大型MoE模型,能够出色处理实际代码且速度非常快[4] - 在内部基准测试中,该模型在编码任务上达到行业前沿水准,生成速度比同类模型快四倍[7] 模型技术来源推测 - 新模型Composer在思考时大量输出中文,行为与国产模型极其相似,引发对其基于中国AI模型开发的猜测[4][9] - 有分析认为Cognition的SWE 1.5模型是基于智谱AI的GLM大模型进行开发和改进的[11] - 网友对SWE 1.5进行“越狱”后,模型直接回答自己是智谱AI开发的GLM大模型[11] - 业界观点认为Cursor的Composer模型和Cognition的SWE-1.5都是基于中国公司智谱的GLM 4.6模型进行定制精调[16] 模型开发策略分析 - 分析指出WindSurf和Cursor的新模型都是经过微调而非从零训练,这对于开源社区是胜利[17] - 从头训练基础模型成本极其高昂,许多资源更雄厚的公司都未能成功,因此后期投资强化学习是合逻辑的选择[17] - Cursor和WindSurf团队被认为没有足够资金建设庞大训练集群,也没有足够数据和团队支持从零建立大模型[18] 中国开源模型市场地位 - 英伟达CEO黄仁勋指出开源模型已变得非常强大,大大加速AI应用进程[21] - 2025年以来,阿里的通义千问模型已占据开源模型大部分市场份额,领先优势持续扩大,衍生模型数量全球第一[21] - 在AI社区HuggingFace趋势榜上,排行前列的模型都出自中国公司,包括MiniMax、DeepSeek、Kimi、百度等[23] - 在第三方基准平台ArtificialAnalysis上,排行前列的也大多数是国产模型[24] 行业格局影响 - 中国开源基础模型已具备足够能力支持西方产品开发,全球AI正进入多极化竞争新格局[20] - 不论在模型技术水平还是全球开发者接受度上,国内开源大模型都已确立领先地位,正在改变全球AI竞争格局[26] - 开源模型推理能力、多模态能力、专业领域能力的提升,使其不仅帮助开发者,甚至已成为初创公司的命脉[23]
最新外国「自研」大模型,都是套壳国产?
机器之心· 2025-11-01 12:22
Cursor和Cognition新模型发布及性能表现 - Cursor发布2.0版重大更新,推出自家代码模型Composer及用于并行协作多个智能体的新界面[5] - Composer是使用强化学习训练的大型MoE模型,在内部基准测试中编码任务达行业前沿水准,生成速度比同类模型快四倍[6][8] - Cognition推出快速智能体模型SWE-1.5,参数量达数千亿,编码性能接近SOTA,比Haiku 4.5快6倍,比Sonnet 4.5快13倍[9][11] 新模型与中国AI模型的关联证据 - 分析发现Cursor的Composer模型思考时讲中文,行为与国产模型极其相似[6] - 对Cognition的SWE-1.5进行"越狱"后,模型直接回答自己是智谱AI开发的GLM大模型[14][15] - 业界分析认为SWE-1.5基于智谱GLM 4.6模型定制,Cursor的Composer也带有中国式推理痕迹[20][21] - Cerebras官宣推出zai-glm-4.6作为新编码模型,进一步证实与中国模型的关联[24] 开源策略与行业影响分析 - 系统架构师指出从头训练基础模型成本极高,Cursor和Windsurf团队选择在后期训练阶段投资强化学习是合理逻辑[24][25] - 许多大型实验室已建立强大规模,独立开发难以成功,基于开源模型微调成为可行路径[25] - 呼吁美国公司回归开源理念,而非发布功能受限的专有模型[27] - 中国开源基础模型已具备支持西方产品开发的能力,全球AI进入多极化竞争新格局[28][29] 中国开源模型的行业地位 - 英伟达CEO黄仁勋表示开源模型已变得非常强大,加速了AI应用进程[30] - 2025年以来阿里通义千问模型占据开源模型大部分市场份额,衍生模型数量全球第一[30] - 在HuggingFace趋势榜上,排行前列的模型都出自国内公司,包括MiniMax、DeepSeek、Kimi、百度等[32] - 在第三方基准平台ArtificialAnalysis上,排行前列的也大多数是国产模型[33] - 国内开源大模型在技术水平和全球接受度上确立领先地位,改变全球AI竞争格局[35][36]