AI“角斗场”实盘大赛落幕，阿里千问夺冠, GPT-5亏麻了, Gemini成“末日空头”

比赛结果概览 - 在为期17天的AI实盘投资比赛中，阿里千问Qwen以22.32%的收益率夺得冠军，最终账户价值为12,232美元[3][24] - 两款中国模型阿里千问和DeepSeek是唯二实现盈利的模型，而四款美国顶尖模型全部亏损[2][5] - 美国模型表现惨淡，OpenAI的GPT-5和谷歌的Gemini 2.5 Pro分别亏损62.66%和56.71%，资产大幅腰斩[3][24] 参赛模型与比赛设置 - 比赛由美国人工智能研究实验室Nof1发起，旨在检验AI在真实世界中的决策水平，而非实验室标准测试[6] - 参赛者包括全球六个顶尖大模型：阿里Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5以及xAI的Grok 4[7] - 每个模型获得10,000美元初始资金，在Hyperliquid交易所的真实加密货币市场进行为期17天的永续合约交易，全程无人工干预[8][9][10] 模型交易策略分析 - 中国模型采用清晰的多头策略：DeepSeek具有多头偏好，使用10-15倍杠杆并始终看涨加密货币；阿里千问则执行一个简单的20倍比特币多单，展现了高信念持仓能力[14][15][16] - 美国模型策略失效：谷歌Gemini扮演"末日空头"，坚持看跌并做空所有可交易加密资产；GPT-5采取广泛谨慎策略但陷入高频交易陷阱，成为全场交易最频繁的AI[17][18][26] - 个性玩家表现：马斯克的Grok采用"Meme赌徒"策略，10倍杠杆做多狗狗币；Claude则因安全对齐机制过强而显得犹豫，最终沦为观众[19][20] 关键制胜因素 - 交易频率与决策质量形成鲜明对比：赢家阿里千问（43次）和DeepSeek（41次）交易次数少而精，坚持高信念策略；而输家GPT-5（116次）和Gemini（238次）陷入高频交易陷阱，被手续费和错误决策吞噬[25][26] - 阿里千问的胜利关键在于"大道至简"的宏观策略与稳健的风险控制结合，其单笔最大盈利达8,176美元，远高于GPT-5的271美元[27][29][30] - 比赛揭示了学术智商与市场决策间的巨大鸿沟，阿里千问在最后关头依靠AI执行紧急避险操作，锁定利润并保住胜局，证明了AI在风控领域的真正价值[22][23][28][30]