动态语言 - 财报，业绩电话会，研报，新闻

动态语言

搜索文档

Claude Code 生成 13 种编程语言代码基准测试：动态语言更快更省成本

AI前线· 2026-04-12 13:33

实验核心发现 - 一项由Ruby代码提交者远藤裕介进行的基准测试评估了Claude Code使用13种编程语言生成可用代码的效率，经过600多次测试运行，结果显示动态语言（尤其是Ruby、Python和JavaScript）在速度、成本和稳定性方面表现更优[2] - 静态类型语言的运行速度比动态语言慢1.4至2.6倍，成本也更高[2] - 实验要求Claude Code（Opus 4.6）用每种语言实现一个简化版Git，任务分为两个阶段（v1和v2），每种语言各运行20次，并使用了自定义哈希算法以消除库依赖差异[2] 具体语言性能数据 - **动态语言表现**：Ruby平均每次运行成本0.36美元，耗时73.1秒；Python成本0.38美元，耗时74.6秒；JavaScript成本0.39美元，耗时81.1秒，这三种语言方差低且全部40次运行均通过测试[3] - **静态语言表现**：从第四名开始成本上升且方差急剧扩大，Go语言平均成本0.50美元，耗时101.6秒，但标准差高达37秒；Rust平均成本0.54美元，耗时跨度最大达54.8秒，并且是仅有的两种出现测试失败的语言之一；C语言成本最高达0.74美元，其生成了517行代码，而Ruby仅生成219行[3] 类型系统对AI生成代码的影响 - 在Python中添加mypy严格类型检查会使其速度降低1.6至1.7倍；在Ruby中添加Steep类型检查则带来更大的性能损耗，速度比纯Ruby慢2.0至3.2倍[4] - TypeScript的成本（平均0.62美元）明显高于JavaScript（平均0.39美元），尽管二者生成的代码行数相近，作者指出开销不仅来自类型注解生成，还可能源于模型在推理类型约束时消耗了更多思考词元[4] 实验的局限性与相关讨论 - 作者坦诚说明了实验的局限性，包括自身作为Ruby代码提交者可能存在的偏向性，以及生成的程序约200行代码属于原型规模，承认静态类型在更大规模代码库中可能更具优势[4] - 该实验仅衡量代码生成的成本与速度，不涉及代码质量、可维护性或运行时性能[5] - 外界质疑基于200行代码的原型规模得出的结论是否可靠，并指出该基准测试未考虑语言生态优势（如完善包生态可减少需生成的代码），以及定性担忧生成代码的后期维护难度可能抵消速度优势[5] - 作者回应了部分观点，认同更大型的基准测试更有价值但设计公平测试难度大，并指出在迭代式AI辅助开发中，等待30秒与60秒的差异对开发者心流状态影响显著，同时解释刻意排除库依赖是为了隔离语言本身的差异[6]