Workflow
六年来首次!OpenAI新模型开放权重,Altman称为"全球最佳开放模型"
华尔街见闻·2025-08-06 04:05

公司动态 - OpenAI发布六年来首批开放权重模型gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2后首次开放模型权重[1] - 两款模型采用专家混合(MoE)架构,gpt-oss-120b总参数1170亿,每token激活5.1亿参数;gpt-oss-20b总参数210亿,每token激活3.6亿参数[5][6] - 模型支持128k上下文长度,gpt-oss-20b可在16GB内存设备运行,gpt-oss-120b需要约80GB内存[2][6] 技术性能 - gpt-oss-120b在竞赛编码、通用问题求解和工具调用方面超越o3-mini并匹敌o4-mini,在健康查询和竞赛数学方面甚至超过o4-mini[7] - gpt-oss-20b性能达到或超过o3-mini,在竞赛数学和健康领域表现更优[7][8] - 模型采用交替密集和局部带状稀疏注意力模式,支持本地推理无需联网[3][5] 战略合作 - 亚马逊首次在其Bedrock和SageMaker平台提供OpenAI模型[3] - 微软将为Windows设备提供GPU优化版gpt-oss-20b,支持通过VS Code工具包获取[4] - 公司与英伟达、AMD等芯片商合作确保跨平台兼容性,英伟达CEO称赞其开源创新[15] 安全措施 - 模型经过严格安全测试,预训练时过滤化学、生物、放射性和核相关有害数据[11] - 开展50万美元奖金红队挑战赛,鼓励发现安全问题[12] - 采用Apache 2.0许可免费提供,可通过Hugging Face和GitHub下载[11] 市场影响 - 发布被视为对Meta、Mistral AI和中国DeepSeek等竞争对手的回应[1] - 标志公司战略转向,此前多次推迟开放权重模型发布[3] - 开放权重形态介于开源闭源之间,允许用户查看修改模型权重[3]