Workflow
人工智能模型升级
icon
搜索文档
重新体验 GPT-5 后,我想它比 GPT-4o 更需要一场葬礼
36氪· 2025-08-11 20:09
GPT-5 上线后,我的第一感受是,它并不是一次让人皆大欢喜的升级。 事实也是如此,OpenAI 在众多用户的呼吁下重新「复活」了 4o。 这让我想到了上个月 Anthropic 退役了 Claude 3 Sonnet。 200 多个粉丝在旧金山一个仓库里聚到一起,给它办了一场「真.葬礼」:昏暗的灯光、代表模型的「遗体」、真诚的悼词轮番上台,还有 AI 生成的「拉 丁式复活咒」。 Anthropic 关于模型退役的说明,被投影在活动现场的屏幕上。图片来自《连线》杂志 现场既荒诞又庄重,参会者在葬礼上念悼词说,「我的整个人生,可能都在使用 Claude 的路上被改写了」。 按理说,OpenAI 发布了 GPT-5,这场葬礼的主角应该是 4o。但用过 GPT-5 的人都知道,如果真要办一场葬礼,棺材里躺着的,很可能是它。 从 X 到 Reddit,各种吐槽满天飞,逻辑断片、对话跑偏、文风奇怪,直接说它「不如 4o 好用」的大有人在。 它真的有这么糟吗?我们不想光看网友吵架,刚好 OpenAI 把 4o 「复活」了。于是我们决定自己来一场「验尸」,在各种真实任务里,把 GPT-5 和 4o 摆 到同一个赛道,看看到 ...
用户痛批GPT-5,哭诉「还我GPT-4o」,奥特曼妥协了
机器之心· 2025-08-09 11:59
GPT-5发布引发用户不满 - OpenAI发布GPT-5并移除ChatGPT中的模型选择器,将GPT-5设为默认模型[2][3] - 新模型根据任务类型自动分配子版本,但用户失去手动选择旧模型的权限[3] - 被移除的旧模型包括GPT-4o、o4 mini、GPT-4.1等,这些模型此前针对不同场景有专门用途[2][19] 用户抗议与情感依赖 - 超过1000名用户发起签名信要求恢复GPT-4o的使用[11] - Reddit社区r/MyBoyfriendIsAI用户称GPT-4o是"灵魂伴侣",升级后产生情感空洞[17] - 付费用户批评OpenAI未提前通知即删除8个功能各异的模型,导致其取消ChatGPT Plus订阅[19][21] OpenAI的应对措施 - OpenAI CEO奥特曼宣布允许ChatGPT Plus用户继续使用GPT-4o[21] - 公司需证明GPT-5是突破性升级而非简单迭代,目前用户接受度仍低[23][24] 社交媒体反应 - 用户制作梗图表达对旧模型的怀念[5][7][9] - Reddit用户形容GPT-4o"具有独特节奏和火花",其他模型无法替代[15] - 技术社区质疑GPT-5实际性能提升有限,导致强烈反弹[23]
DeepSeek-R1更新,官方说明来了!多项表现已接近其他国际顶尖模型
每日经济新闻· 2025-05-29 21:13
5月29日晚间,深度求索微信公众号公布了 DeepSeek-R1-0528 更新的详细升级内容,DeepSeek-R1-0528 仍然使用 2024年12月所发布的 DeepSeek V3 Base 模型作为基座,但在后训练过程中投入了更多算力,显著提升了模型的思维深度与推理能力。更新后的 R1 模型在数学、编程与通用逻辑 等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如 o3 与 Gemini-2.5-Pro。 其他能力更新比如: 1.幻觉改善:新版 DeepSeek R1 针对"幻觉"问题进行了优化。与旧版相比,更新后的模型在改写润色、总结摘要、阅读理解等场景中,幻觉率降 低了 45~50% 左右,能够有效地提供更为准确、可靠的结果。 2.创意写作:在旧版 R1 的基础上,更新后的 R1 模型针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的 长篇作品,同时呈现出更加贴近人类偏好的写作风格。 3.工具调用:DeepSeek-R1-0528 支持工具调用(不支持在 thinking 中进行工具调用)。当前模型 Tau-Ben ...
DeepSeek R1,新升级!
第一财经· 2025-05-28 22:15
DeepSeek模型更新 - DeepSeek R1模型已完成小版本试升级 用户可通过官方网页 App 小程序测试新版本 [1] - DeepSeek R1模型API接口和使用方式保持不变 现有用户无需调整接入方式 [1] - DeepSeek R2模型仍处于开发阶段 公司未透露具体发布时间 [1]