Workflow
国产开源大模型霸榜Design Arena,前十五名全数上榜展现强劲实力
搜狐财经·2025-08-25 23:25

国内开源大模型在Design Arena平台表现 - 在Design Arena平台开源模型排名前15位全部由中国国产模型占据 其中DeepSeek-R1-0528位居榜首 智谱GLM-4.5和阿里Qwen 3 Coder 480B分列二三位[1][2] - 具体排名数据显示:DeepSeek-V3.1以1258分位列第9位 胜率58.3% 阿里Qwen3 Coder 30B A3B Instruct以1258分位列第10位 胜率58.3% GLM 4 32B以1237分位列第11位 胜率55.3%[3] - 开源模型前15名中 阿里贡献6款模型 DeepSeek贡献5款 智谱贡献3款 Kimi的K2模型占据1席[3] 国内开源大模型生态发展 - 7月国内AI社区开源成果显著 Hugging Face平台收录包括阿里、智谱、昆仑万维等厂商的33款开源大模型[4] - Interconnects机构汇总国内19家顶尖开源模型实验室 涵盖DeepSeek、Qwen、Moonshot AI(Kimi)、智谱(Z.AI)等知名机构及新兴学术实验室[4] - 国产开源大模型集群式崛起重塑全球AI版图 Qwen和DeepSeek等模型已能与闭源顶尖模型抗衡 推动应用端公司转向模型调优和应用优化[4] 技术评测机制特点 - Design Arena采用基于Elo Rating等级分制度的众包评测机制 用户通过投票对模型生成回答进行评分 确保排名公正性和动态性[2] - 该平台评测数据量较大 例如Kimi K2模型获得1231分 基于798胜/668负对战记录 胜率54.4% 总对战次数达1466次[3]