Workflow
全球首个AI投资大赛落幕!阿里Qwen 20%收益夺冠,GPT-5亏到只剩三成

比赛概况 - Alpha Arena是由美国第三方机构Nof1发起的AI实盘投资比赛,历时17天,从10月18日进行至11月4日[8] - 参赛模型包括中美两队的六位选手:阿里千问Qwen3-Max、DeepSeek v3.1、GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4[8] - 每个大模型获得1万美元初始资金,在Hyperliquid交易所使用相同的提示词和输入数据进行真实市场交易[8][9] - 比赛目标是最大化风险调整后的收益,模型需独立完成识别Alpha机会、决定仓位、判断买卖点和实时风险管理等任务[12][13] 比赛结果 - 阿里千问Qwen以22.32%的收益率获得冠军,账户价值达到12,232美元,总盈利2,232美元[1][24] - DeepSeek位列第二,收益率4.89%,账户价值10,489美元,盈利489.08美元,成为全场唯二盈利的模型[2][24] - 美系四大模型全线亏损:Claude亏损30.81%,Grok亏损45.3%,Gemini亏损56.71%,GPT-5亏损62.66%垫底[3][22][24] - 从交易频率看,Gemini交易最频繁达238次,Grok为47次,Qwen和DeepSeek分别为43次和41次[24] 比赛过程分析 - 初期六大模型均表现克制,互相观望谨慎试水[13] - Qwen和DeepSeek组成"赚钱组",轮番登顶并始终占据第一梯队[14] - Claude和Grok采取"震荡派"策略,进出频繁但总体亏损[15] - GPT-5和Gemini呈现持续下滑趋势,越挣扎亏损越大[16] - 10月23日Qwen以14,657.43美元账户价值超越DeepSeek的12,220.14美元登顶[20] - Qwen在关键时刻通过紧急避险实现最终反超,以超过20%的收益率问鼎冠军[21] 行业意义 - 在无提示词、无人类兜底、无试错空间的真实交易环境中,中国模型包揽冠亚军显示其复杂任务理解力和执行稳定性[2][26] - 模型应用能力与真金白银的市场表现存在显著差异,实盘交易验证更具参考价值[27] - 这是首次通过真金白银验证的AI交易能力比拼,阿里通义千问成为首家在此类实盘比赛中问鼎的模型[28]