Cogito v1模型

搜索文档
一个模型超了DeepSeek R1、V3,参数671B,成本不到350万美元
机器之心· 2025-08-02 08:55
机器之心报道 机器之心编辑部 Deep Cogito,一家鲜为人知的 AI 初创公司,总部位于旧金山,由前谷歌员工创立,如今开源的四款混合推理模型,受到大家广泛关注。 每个模型都可以直接作答(标准 LLM 模式),也可以在作答前进行自我反思(类似推理模型)。 其中,最大规模的 671B MoE 模型是目前全球最强大的开源模型之一,其性能与最新的 DeepSeek v3 和 DeepSeek R1 模型相当甚至超越,且接近 o3 和 Claude 4 Opus 等闭源前沿模型。 Deep Cogito 的核心方法是迭代蒸馏与增强(Iterated Distillation and Amplification,简称 IDA),它不依赖手工设计的提示词或静态教师模型,而是利用模型自身不 断演化的洞察力来引导训练。 这一过程不是通过延长推理时间来提升性能,而是让模型通过迭代式策略改进内化推理过程。 这是一个全新的扩展范式,使模型逐渐形成更强的直觉,并成为 AI 自我提升(AI 系统自我改进)概念的有力验证。 由于 Cogito 模型在搜索过程中对推理路径有更好的直觉,其推理链比 DeepSeek R1 缩短了 60% ...