Workflow
开放权重模型
icon
搜索文档
饭都不香了,奥尔特曼焦虑:美国低估了中国…
观察者网· 2025-08-19 12:07
文章核心观点 - OpenAI新模型GPT-5推出后因批评声浪被迫回退至上一版本 首席执行官奥尔特曼承认失误并称已吸取教训 [1] - 奥尔特曼渲染中国AI风险 认为美国低估中国AI发展的复杂性与严重性 仅靠出口管制无法有效遏制中国AI技术生态构建 [1][2] - 中国对美半导体出口管制态度冷淡 反映其致力于自给自足的半导体供应链和对自身芯片产业进展的信心 [2][3] - 中国AI竞争迫使OpenAI改变模型发布策略 推出开放权重模型以应对中国开源模型的竞争压力 [6][7] OpenAI模型发布与策略调整 - GPT-5推出后遭批评 OpenAI被迫将ChatGPT默认模型恢复至上一版本 [1] - OpenAI推出gpt-oss-120b与gpt-oss-20b两款开放权重模型 免费开放且支持开发者定制 为闭源产品提供更透明的替代方案 [6] - 这是OpenAI自2019年推出GPT-2以来首次发布开放权重模型 也是与微软签署独家云服务协议六年来首批此类模型 [6] - 开放权重模型反响褒贬不一 开发人员认为模型亮点不足且剥离了商业产品的核心功能 [7] - OpenAI团队针对核心应用场景优化模型 支持构建本地运行的编程智能体 [7] 中美AI竞争与半导体管制 - 奥尔特曼称美国在应对中国AI发展问题上存在误判 可能低估其复杂性与严重性 [1] - 中国在推理算力、研究和产品等层面构建完整AI技术生态 使美国管制措施无济于事 [1][2] - 美国对华半导体出口管制不断升级 但奥尔特曼认为仅靠政策手段控制AI发展不切实际 [2] - 英伟达和超威半导体同意向美国政府上缴在华销售芯片收入的15%以换取出口许可证 [2] - 中国对美科技封锁态度冷淡 反映其致力于自给自足的半导体供应链和对自身芯片产业进展的信心 [2][3] - 中国仍对受美国出口管制的更先进AI处理器有需求 尽管在半导体领域取得重大进展 [3] 中国AI发展对OpenAI的影响 - 中国AI竞争迫使OpenAI改变模型发布策略 推出开放权重模型应对中国开源模型竞争 [6] - 中国开源模型如DeepSeek是OpenAI决定推出开放权重模型的重要原因之一 [6] - 奥尔特曼称若不推出开放权重模型 世界AI生态大概率会以中国开源模型为基础构建 [6]
六年来首次!OpenAI新模型开放权重,Altman称为“全球最佳开放模型”
华尔街见闻· 2025-08-06 21:06
开放权重模型发布 - OpenAI六年来首次推出开放权重语言模型gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2以来首次发布此类模型[1] - 两款模型允许开发者定制,但不提供训练数据,被视为对Meta、Mistral AI和DeepSeek等竞争对手的回应[1] - 模型采用专家混合(MoE)架构的Transformer,减少活跃参数数量,支持高达128k的上下文长度[5][6] 模型技术参数 - gpt-oss-120b总参数量1170亿,每token激活5.1亿参数;gpt-oss-20b总参数量210亿,每token激活3.6亿参数[6][7] - gpt-oss-20b可在16GB内存笔记本运行,gpt-oss-120b需要约80GB内存,均支持高级推理、工具使用和思维链处理[2][3] - gpt-oss-120b在竞赛编码、通用问题求解和工具调用方面优于o3-mini,匹敌甚至超越o4-mini[8][9] 战略与市场影响 - 发布标志着OpenAI战略转向重要节点,此前多次推迟开放权重模型发布并进行广泛安全测试[3] - 亚马逊首次向客户提供OpenAI模型,微软将GPU优化版gpt-oss-20b引入Windows设备[3][4] - 竞争压力特别是来自中国DeepSeek的挑战推动OpenAI此次战略转变[16] 生态系统部署 - 模型在Apache 2.0许可下免费提供,可通过Hugging Face和GitHub下载[15] - 与Azure、vLLM、Ollama、AWS等领先部署平台合作,确保广泛可用性[15] - 举办50万美元奖金池的红队挑战赛,鼓励识别新的安全问题[15] 性能与特点 - gpt-oss-120b在健康相关查询和竞赛数学方面表现超过o4-mini[8] - 较小的gpt-oss-20b在同类型评估中匹敌甚至超越o3-mini[9] - 模型可在个人电脑甚至手机上本地运行,无需互联网连接,提供完全控制权和隐私保护[3]
亚马逊云科技宣布接入OpenAI开放权重模型
搜狐财经· 2025-08-06 18:30
亚马逊云科技与OpenAI合作 - 亚马逊云科技宣布通过Amazon Bedrock和Amazon SageMaker AI平台提供OpenAI开放权重模型的访问服务 [1] - 此次合作旨在帮助客户快速构建生成式人工智能应用 [1] OpenAI模型技术特点 - OpenAI发布两款开放权重基础模型gpt-oss-120b与gpt-oss-20b [3] - 模型设计为低成本选项 支持本地运行、工具使用和思维链处理 [3] - 模型适合开发者和研究人员定制应用 [3] 战略意义与行业影响 - 开放权重模型将在生成式AI未来发展中扮演重要作用 [3] - 亚马逊云科技致力于成为运行AI模型的最佳平台 [3] - 合作是亚马逊云科技将前沿AI技术带给全球组织的自然延伸 [3] - 亚马逊云科技广泛的客户基础将为OpenAI先进技术获取方式带来变革性转变 [3]
OpenAI发布低成本模型 与Meta(META.US)和DeepSeek正面竞争
智通财经网· 2025-08-06 09:53
智通财经APP获悉,OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本 模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更易运行和定制的低成 本选项。 当人工智能模型的参数(即训练过程中优化输出和预测能力的要素)公开可用时,该模型即被视为开放权 重。此类模型虽能提供透明度和控制权,但不同于开源模型——后者允许用户完全获取并修改源代码。 近年来,Meta、微软支持的Mistral AI以及中国初创企业DeepSeek等公司也相继发布了开放权重模型。 此次发布备受期待,部分原因是公司曾多次推迟上线。OpenAI CEO萨姆·奥尔特曼七月在X平台发文称 需要更多时间"进行额外安全测试并审查高风险领域",此前六月他也明确表示模型不会当月发布。 OpenAI周二声明已对开放权重模型实施全面安全训练与测试。在预训练阶段清除了有害的化学、生 物、放射性与核武器相关数据,并模拟了恶意行为者可能进行的模型微调。 测试表明,经恶意调优的模型无法达到其"准备框架"设定的高能力阈值——这是该公司衡量和防范危害 的评估体系。OpenAI还透露已邀请三个 ...
六年来首次!OpenAI新模型开放权重,Altman称为"全球最佳开放模型"
华尔街见闻· 2025-08-06 04:05
公司动态 - OpenAI发布六年来首批开放权重模型gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2后首次开放模型权重[1] - 两款模型采用专家混合(MoE)架构,gpt-oss-120b总参数1170亿,每token激活5.1亿参数;gpt-oss-20b总参数210亿,每token激活3.6亿参数[5][6] - 模型支持128k上下文长度,gpt-oss-20b可在16GB内存设备运行,gpt-oss-120b需要约80GB内存[2][6] 技术性能 - gpt-oss-120b在竞赛编码、通用问题求解和工具调用方面超越o3-mini并匹敌o4-mini,在健康查询和竞赛数学方面甚至超过o4-mini[7] - gpt-oss-20b性能达到或超过o3-mini,在竞赛数学和健康领域表现更优[7][8] - 模型采用交替密集和局部带状稀疏注意力模式,支持本地推理无需联网[3][5] 战略合作 - 亚马逊首次在其Bedrock和SageMaker平台提供OpenAI模型[3] - 微软将为Windows设备提供GPU优化版gpt-oss-20b,支持通过VS Code工具包获取[4] - 公司与英伟达、AMD等芯片商合作确保跨平台兼容性,英伟达CEO称赞其开源创新[15] 安全措施 - 模型经过严格安全测试,预训练时过滤化学、生物、放射性和核相关有害数据[11] - 开展50万美元奖金红队挑战赛,鼓励发现安全问题[12] - 采用Apache 2.0许可免费提供,可通过Hugging Face和GitHub下载[11] 市场影响 - 发布被视为对Meta、Mistral AI和中国DeepSeek等竞争对手的回应[1] - 标志公司战略转向,此前多次推迟开放权重模型发布[3] - 开放权重形态介于开源闭源之间,允许用户查看修改模型权重[3]
OpenAI重磅出手:六年来首发“开放权重”模型,微软独家协议迎挑战?
华尔街见闻· 2025-07-10 13:58
微软与OpenAI合作关系 - OpenAI计划最早于下周发布一款"开放权重"AI语言模型 这是公司自2019年GPT-2以来首次推出开放权重模型 也是与微软签署独家云服务协议后的首个开放模型 [1] - 新模型具备与o3 mini相似的推理能力 将在Azure Hugging Face和其他大型云服务商平台上同步发布 [1] - 开放权重意味着企业和政府机构可以自主运行该模型 不同于OpenAI以往的封闭权重模型 [1] 开放权重模型特点 - 开放权重模型是介于开源和闭源方法之间的一种中间形态 权重是AI模型学习和建立连接的方式 [2] - 开放权重模型意味着其权重是公开可用的 用户可以查看这些权重并进行修改 而无需用新数据重新训练模型 [2] - 开放权重模型通常能降低企业的使用成本 并允许他们对模型进行定制 但与开源模型并不相同 [2] 对微软的影响 - 开放权重模型的推出可能削弱微软在AI业务中的独家优势 由于竞争对手云服务商也能托管该模型 部分Azure客户可能转向成本更低的替代方案 [3] - 微软与OpenAI的收入分成协议显示 微软从OpenAI的ChatGPT和API平台收入中获得20%分成 同时向OpenAI分享20%的Azure OpenAI收入 [3] - 微软独家拥有通过Azure云平台销售OpenAI软件工具的权利 并可优先获取OpenAI的技术 微软还被指定为OpenAI的唯一计算资源提供商 [3] 合同谈判情况 - 微软与OpenAI正就后者重组为营利性公司的合同进行重新谈判 讨论范围从20%一直延伸到49% [3] - 当前合同的多个核心条款都在重新谈判中 包括微软通过Azure独家销售OpenAI软件的权利 为OpenAI提供计算基础设施的优先权 以及在达到"通用人工智能"前获得AI知识产权的权限 [4] - OpenAI必须在年底前获得微软对其营利性转换的批准 否则将面临失去包括软银在内的数十亿美元投资者资金的风险 [4]
美媒:OpenAI开放语言模型即将问世
快讯· 2025-07-10 00:22
OpenAI开放语言模型发布 - OpenAI即将发布一款开放权重语言模型 该模型将向公众开放权重参数 与公司通常采用的封闭权重模式不同 [1] - 新模型不仅会登陆OpenAI和微软Azure服务器 还将向其他云服务商开放 [1] - 企业和政府将能够自主部署该模型 这标志着OpenAI商业策略的重大转变 [1] 微软与OpenAI关系变化 - 微软与OpenAI正在重新协商合同 以允许OpenAI重组为营利性公司 [1] - 新模型的发布可能进一步加剧两家公司之间的裂痕 [1] - 此次商业策略调整正值双方关系的关键转折点 [1] 技术细节 - 开放权重模型将在下周发布 由萨姆·奥尔特曼领导的AI实验室开发 [1] - 模型将公开训练参数(权重参数) 这是OpenAI首次采用这种开放模式 [1] - 该举措可能改变AI行业的竞争格局 为其他云服务商提供新的选择 [1]