文章核心观点 谷歌Gemini 2.5 Pro是Aider Polyglot(真实世界编码)性能最高的模型且成本低廉,仅比DeepSeek R1成本高一点 [1] 各模型表现数据 准确率 - Gemini 2.5 Pro准确率为72.9% [4] - sonnet - 20250219准确率为64.9% [4] - DeepSeek R1 + claude - 3 - 5准确率为64.0% [4] - o1 - 2024 - 12 - 17准确率为61.7% [4] - claude - 3 - 7 - connat - 20250219准确率为60.1% [4] - o3 - mini (high)准确率为60.4% [5] - DeepSeek R1准确率为56.9% [5] - DeepSeek V3 (0324)准确率为55.1% [5] - Quasar Alpha准确率为54.7% [5] - o3 - mini (medium)准确率为53.8% [5] - Grok 3 Beta准确率为53.3% [5] 使用正确编辑格式的百分比 - Gemini 2.5 Pro使用正确编辑格式的百分比为92.4% [4] - sonnet - 20250219使用正确编辑格式的百分比为97.8% [4] - DeepSeek R1 + claude - 3 - 5使用正确编辑格式的百分比为100.0% [4] - o1 - 2024 - 12 - 17使用正确编辑格式的百分比为91.5% [4] - o3 - mini (high)使用正确编辑格式的百分比为93.3% [5] - DeepSeek R1使用正确编辑格式的百分比为96.9% [5] - DeepSeek V3 (0324)使用正确编辑格式的百分比为99.6% [5] - Quasar Alpha使用正确编辑格式的百分比为98.2% [5] - o3 - mini (medium)使用正确编辑格式的百分比为95.1% [5] - Grok 3 Beta使用正确编辑格式的百分比为99.6% [5] 成本 - Gemini 2.5 Pro成本为6.32美元 [4] - sonnet - 20250219成本为36.83美元 [4] - DeepSeek R1 + claude - 3 - 5成本为13.29美元 [4] - o1 - 2024 - 12 - 17成本为186.5美元 [4] - claude - 3 - 7 - connat - 20250219成本为17.77美元 [4] - o3 - mini (high)成本为18.16美元 [5] - DeepSeek R1成本为5.42美元 [5] - DeepSeek V3 (0324)成本为1.12美元 [5] - o3 - mini (medium)成本为8.86美元 [5] - Grok 3 Beta成本为11.03美元 [5]
谷歌Gemini 2.5 Pro成为Aider Polyglot(真实世界编码)性能最高的模型,并且成本低廉,仅仅比DeepSeek R1成本高一点。(AI寒武纪)