Workflow
AI编程“真相”:硬核测试全部0分,AI写代码到底行不行?| 深度
微软微软(US:MSFT) 钛媒体APP·2025-06-27 16:47

图片来源@pixabay AI能力落地是当下最热门的话题,从走下技术神坛,到真正赋能场景和业务,拨开舆论的 重重迷雾,真实情况如何?我们将以"真相"为主线,持续推出系列稿件,理性观察AI技术应 用落地的现状和未来,也欢迎产业各方参与话题讨论。 "AI替代程序员"的言论甚嚣,AI编程(AI Coding)也正被多方共同塑造为"大幅提升企业开发效率潜 力"的形象。但在大厂和创企产品竞赛、企业内部应用不甘落后之外,仍处在探索期的AI编程,自面世 至今备受质疑。 近日,一支由国际算法奥赛金牌得主组成的科研团队推出了 LiveCodeBench Pro 基准测试,结果让人大 跌眼镜:GPT-4o、DeepSeek R1、Claude 3等20个顶级大模型,在来自顶级赛事的最新584道编程赛题上 展开对决,在高难度题目上,所有AI的通过率是——0%。(相关报道《AI替代程序员?一项最新测试 的结果恰恰相反 | 企服国际观察》) 可以说,脱离了网络信息作为训练数据,不能"作弊",AI的编程能力远没有外界吹捧的那么神乎其神。 而且,在关于AI编程的热议中,作为最卷也最容易接受创新事物的程序员群体,随着更多实际应用, 对AI编 ...