Workflow
深度推理模型
icon
搜索文档
欢迎OpenAI重返开源大模型赛道,谈一谈我关注的一些要点
36氪· 2025-08-06 15:55
美国西海岸时间2025年8月5日,OpenAI发布了两款开源大模型——GPT-OSS 120B以及GPT-OSS-20B, 目前这两款模型均可以从Hugging Face平台下载,用户可以对其进行修改定制和商业应用。包括亚马逊 AWS、微软Azure在内的主流云平台也已经开始提供基于这两款模型的服务。这是自从2019年11月以 来,OpenAI第一次发布开源大模型。 历史真是讽刺。OpenAI的名称来源,就是"开放""开源",这曾被Sam Altman自诩为AI时代的核心精神 和生存之道。可是从2019年初开始,OpenAI就处心积虑地偏离了开源轨道:那年2月,它以"安全问 题"为借口,拒绝公布GPT-2的全部参数权重,只公布了一个7.74亿参数的"部分模型";直到当年11月, 在GPT-2乏人问津的情况下,它才羞羞答答地公布了全部15亿参数。至于后来大放异彩的GPT-3、GPT- 3.5以及GPT-4系列大模型,则既没有公布过参数权重,也没有公布过技术路线白皮书。 截止昨天,OpenAI成为了当今全球AI大模型基础研发第一集团当中,寥寥几家"没有任何新版开源大模 型"的开发者之一。还有一家是Anthropi ...
深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评
贝壳财经· 2025-06-09 09:24
大模型高考英语作文测评结果 - 讯飞星火X1以平均分19.5分排名第一,内容完整且紧扣主题,语言准确句式多样,结构清晰段落衔接自然 [22][27] - DeepSeek R1以平均分19分排名第二,内容详实建议具体,理由全面语言精准,但超字数限制被扣分 [7][27] - 百度文心X1以平均分18.5分排名第三,内容创新建议详实,理由充分语言优秀,结构合理过渡流畅 [26][27] - 通义千问Qwen3以平均分17分排名第四,内容基本完整建议合理,语言准确表达得体,但理由稍简略 [14][27] - ChatGPT o3以平均分14.5分排名第五,内容覆盖要点但理由浅显,语言有错误句式单调,结构发展不足 [10][27] - 腾讯混元T1以平均分13分排名第六,内容基本相关但理由泛泛,语言口语化句式简单,结构松散结尾随意 [19][27] 大模型英语写作能力分析 - 各模型均能完成写作任务,但在内容细节、逻辑关系、观点表达精准性等方面差异较大 [27] - 部分模型语法句法选词精准到位逻辑清晰,部分模型逻辑性欠缺展开不够具体深入 [28] - AI作文立意创新性强于真实考生,因信息搜索整合能力更强,但句式丰富度不及优秀考生 [28] - 模型内嵌评分标准和写作方向差异明显,内容简繁程度与内部数据库密切相关 [28] 国内大模型近期发展动态 - DeepSeek于5月28日更新R1-0528版本 [29] - 腾讯于5月21日迭代混元T1和混元Turbo S [29] - 阿里巴巴于4月29日开源新一代通义千问Qwen3 [29] - 百度于4月25日发布X1 Turbo [29] - 科大讯飞于4月20日升级讯飞星火X1 [29] - 4-5月国内主流大模型集中进行推理层面更新,带来英语写作等能力进步 [29]