全球首个AI投资大赛落幕！阿里Qwen 20%收益夺冠，GPT-5亏到只剩三成

比赛概况 - Alpha Arena是由美国第三方机构Nof1发起的AI实盘投资比赛，历时17天，从10月18日进行至11月4日[8] - 参赛模型包括中美两队的六位选手：阿里千问Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4[8] - 每个大模型获得1万美元初始资金，在Hyperliquid交易所使用相同的提示词和输入数据进行真实市场交易[8][9] - 比赛目标是最大化风险调整后的收益，模型需独立完成识别Alpha机会、决定仓位、判断买卖点和实时风险管理等任务[12][13] 比赛结果 - 阿里千问Qwen以22.32%的收益率获得冠军，账户价值达到12,232美元，总盈利2,232美元[1][24] - DeepSeek位列第二，收益率4.89%，账户价值10,489美元，盈利489.08美元，成为全场唯二盈利的模型[2][24] - 美系四大模型全线亏损：Claude亏损30.81%，Grok亏损45.3%，Gemini亏损56.71%，GPT-5亏损62.66%垫底[3][22][24] - 从交易频率看，Gemini交易最频繁达238次，Grok为47次，Qwen和DeepSeek分别为43次和41次[24] 比赛过程分析 - 初期六大模型均表现克制，互相观望谨慎试水[13] - Qwen和DeepSeek组成"赚钱组"，轮番登顶并始终占据第一梯队[14] - Claude和Grok采取"震荡派"策略，进出频繁但总体亏损[15] - GPT-5和Gemini呈现持续下滑趋势，越挣扎亏损越大[16] - 10月23日Qwen以14,657.43美元账户价值超越DeepSeek的12,220.14美元登顶[20] - Qwen在关键时刻通过紧急避险实现最终反超，以超过20%的收益率问鼎冠军[21] 行业意义 - 在无提示词、无人类兜底、无试错空间的真实交易环境中，中国模型包揽冠亚军显示其复杂任务理解力和执行稳定性[2][26] - 模型应用能力与真金白银的市场表现存在显著差异，实盘交易验证更具参考价值[27] - 这是首次通过真金白银验证的AI交易能力比拼，阿里通义千问成为首家在此类实盘比赛中问鼎的模型[28]