Workflow
DeepSeek终于把OpenAI逼急了
阿尔法工场研究院·2025-08-07 08:08

OpenAI发布开源模型GPT-OSS - OpenAI突然发布首个开源语言模型GPT-OSS,包括gpt-oss-120b和gpt-oss-20b两个版本 [5][6][9] - gpt-oss-120b采用MoE架构,拥有1170亿参数,激活参数约51亿,可在单张80GB GPU上运行,性能接近闭源o4-mini [10] - gpt-oss-20b基于MoE架构,有210亿参数,激活参数约36亿,可在16GB内存设备上流畅运行,性能接近o3-mini [11] - 模型训练数据涵盖多语种多领域,且可免费用于商业用途 [14] OpenAI战略转向 - 此前OpenAI一直坚持"闭源+收费"路线,GPT-4和GPT-4o核心模型均未开放 [12] - GPT-OSS的发布标志着公司从闭源独占转向开放协作的模型生态 [16] - 这一战略调整被认为是深思熟虑的结果,而非一时冲动 [16] 中国开源模型的快速发展 - 中国开源模型发展迅猛,DeepSeek凭借R1模型引发行业关注,其V2模型通过结构创新大幅降低成本 [18] - 阿里通义千问(Qwen)近三个月密集迭代,发布6波更新,新增55个以上模型版本 [20] - 中国开源生态蓬勃发展,涌现出Kimi K2、智谱GLM-4.5、腾讯混元HunyuanWorld-1等有影响力的开源模型 [20] - 中国开源模型在编程、数学、多语言等领域正逼近甚至超越OpenAI闭源模型 [20] 行业竞争格局变化 - 中国开源模型的爆发式发展触动了OpenAI和硅谷的神经 [22] - Meta正酝酿策略转向,可能放弃开源策略转而开发闭源模型 [22] - OpenAI与Meta的竞争加剧,OpenAI采取员工信息保护等措施应对 [22]