Workflow
Claude 3.7登顶编程竞技场,大幅领先100分!最新布料模拟实测再惊艳网友
量子位·2025-02-27 17:37

西风 发自 凹非寺 量子位 | 公众号 QbitAI 公认的编程开发能力第一! Claude 3.7 Sonnet 刚刚登顶WebDev竞技场榜首 。 大幅甩第二名100多分,在榜单前十的其它相邻模型分差仅为几分、几十分的情况下。 那第二名是谁呢?还是Claude自己——Claude 3.5 Sonnet。 WebDev榜单与我们所熟知Chatbot Arena榜单"同宗同源",也是由LMArena (LMSYS Org) 打造,不过更专注于AI编程、网页应用开发 能力。 值得一提的是,DeepSeek R1作为榜单前十唯一的开源模型排名第三,超越early-grok-3、o3-mini-high、Claude 3.5 Haiku等。 对于Claude 3.7 Sonnet高分登顶,有网友表示并不惊讶。 毕竟,这两天网友们疯狂实测Claude 3.7, 一次又一次被惊艳到,最新实测更是再次刷新网友对Claude 3.7的认知。 Claude 3.7最新实测 比如前两天下面这个Claude 3.7 Sonnet用p5js编写布料模拟效果在网上疯传: 有位学者看到后,还晒出了自己1986年在MIT的硕士论文,主题 ...