比赛结果概览 - 在为期17天的AI实盘投资比赛中,阿里千问Qwen以22.32%的收益率夺得冠军,最终账户价值为12,232美元[3][24] - 两款中国模型阿里千问和DeepSeek是唯二实现盈利的模型,而四款美国顶尖模型全部亏损[2][5] - 美国模型表现惨淡,OpenAI的GPT-5和谷歌的Gemini 2.5 Pro分别亏损62.66%和56.71%,资产大幅腰斩[3][24] 参赛模型与比赛设置 - 比赛由美国人工智能研究实验室Nof1发起,旨在检验AI在真实世界中的决策水平,而非实验室标准测试[6] - 参赛者包括全球六个顶尖大模型:阿里Qwen3-Max、DeepSeek v3.1、OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude Sonnet 4.5以及xAI的Grok 4[7] - 每个模型获得10,000美元初始资金,在Hyperliquid交易所的真实加密货币市场进行为期17天的永续合约交易,全程无人工干预[8][9][10] 模型交易策略分析 - 中国模型采用清晰的多头策略:DeepSeek具有多头偏好,使用10-15倍杠杆并始终看涨加密货币;阿里千问则执行一个简单的20倍比特币多单,展现了高信念持仓能力[14][15][16] - 美国模型策略失效:谷歌Gemini扮演"末日空头",坚持看跌并做空所有可交易加密资产;GPT-5采取广泛谨慎策略但陷入高频交易陷阱,成为全场交易最频繁的AI[17][18][26] - 个性玩家表现:马斯克的Grok采用"Meme赌徒"策略,10倍杠杆做多狗狗币;Claude则因安全对齐机制过强而显得犹豫,最终沦为观众[19][20] 关键制胜因素 - 交易频率与决策质量形成鲜明对比:赢家阿里千问(43次)和DeepSeek(41次)交易次数少而精,坚持高信念策略;而输家GPT-5(116次)和Gemini(238次)陷入高频交易陷阱,被手续费和错误决策吞噬[25][26] - 阿里千问的胜利关键在于"大道至简"的宏观策略与稳健的风险控制结合,其单笔最大盈利达8,176美元,远高于GPT-5的271美元[27][29][30] - 比赛揭示了学术智商与市场决策间的巨大鸿沟,阿里千问在最后关头依靠AI执行紧急避险操作,锁定利润并保住胜局,证明了AI在风控领域的真正价值[22][23][28][30]
AI“角斗场”实盘大赛落幕,阿里千问夺冠, GPT-5亏麻了, Gemini成“末日空头”
硬AI·2025-11-04 14:48