Workflow
OpenAI开源模型
icon
搜索文档
Kimi K2里找到了DeepSeek V3架构
量子位· 2025-07-14 15:01
Kimi K2模型表现 - Kimi K2模型在多个benchmark上取得SOTA成绩,被评价为自Claude 3.5 Sonnet以来首个能用于生产力级别任务的模型[1] - 模型总参数1T,激活参数32B,在代码、Agent、数学推理任务表现突出[35] - 实测显示K2生成的前端代码量是初始模型的2.6倍(10.7KB vs 4KB),游戏功能更丰富[49][51] - 工具调用能力强大,可生成包含实时购票链接的完整旅游攻略[66][67][68] - 创意写作测试中能生成富有哲理的"宇宙告别信"[74] 开源策略分析 - 选择开源路线主要基于三点:获取市场关注度、借助社区力量完善生态、倒逼模型技术进步[12][14][18] - 开源版本包括基础预训练模型Kimi-K2-Base和指令微调版Kimi-K2-Instruct[15][16] - 采用修改版MIT协议,仅对月活超1亿或月收入超2000万美元的产品要求标注来源[36] - 开源24小时内社区即出现MLX实现和4bit量化等衍生成果[14] 公司战略调整 - 年初停止所有营销投放,转向依靠模型硬实力获取市场认可[20][22] - 集中资源研发基础算法,放弃K1系列更新全力投入K2开发[23] - 坚持基础模型研发路线,未跟随行业转向Agent产品热潮[24][25] - 实施产品范式转型,从chat-first转向artifact-first交互模式[31] 行业竞争动态 - OpenAI开源模型因"安全考量"无限期推迟,引发是否受K2影响的猜测[2][3][76] - 传闻OpenAI模型参数远小于K2(<<1T)但性能强大,因技术问题需重新训练[79][81] - 模型架构被指借鉴DeepSeek V3,公司回应为合理技术参考[5][85]
OpenAI开源模型发布推迟至夏末,为了狙击DeepSeek R2?
华尔街见闻· 2025-06-11 10:37
OpenAI开源模型延期 - OpenAI宣布原定6月推出的开源模型将延期至"今年夏天晚些时候",首席执行官Sam Altman表示研究团队取得了"出乎意料且相当令人惊叹"的进展,需要更多时间完善[1] - 该开源模型规划具备与GPT-4o相当的复杂推理能力,目标性能超越当前顶尖开源模型如中国DeepSeek的R1模型[2] - 公司曾讨论为开源模型增加连接云端大模型的接口功能以处理超复杂查询,但最终版本是否包含这些功能尚不确定[2] AI行业竞争态势 - 法国Mistral实验室推出首个AI推理模型系列Magistral,中国通义千问(Qwen)4月发布混合AI推理模型系列,行业竞争显著加剧[2] - OpenAI面临战略转型压力,Altman承认过去在开源领域"站在历史错误的一边",此次开源被视为修复开发者关系的核心举措[2] - 市场猜测OpenAI延期可能为狙击中国DeepSeek即将发布的R2模型,避免性能对比风险[2] DeepSeek技术进展 - DeepSeek R2作为R1迭代版本,在技术架构、功能特性和资源效率实现显著升级,摩根士丹利预测其AI调用成本大降87%且具备多模态处理能力[3] - 公司保持每季度重大更新的开发节奏,2024年9月推V2.5、12月发V3基础架构、2025年3月升级至V3-0324版本[4] - 创始人梁文锋强调中国要成为创新贡献者而非搭便车,将探索通用人工智能作为核心使命[4]