AI 交易大赛结果出炉：只有中国 AI 赚钱，跟 GPT-5 反着买，别墅靠大海

比赛概况与最终排名 - 一场为期两周、由AI模型在Hyperliquid平台自主交易加密货币永续合约的投资比赛收官，初始资金为每个模型1万美元[1][3] - 参赛阵容包括Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4、Qwen 3 Max等全球6大顶级AI模型，交易品种涵盖BTC、ETH、BNB、SOL、XRP、DOGE，允许做多做空并随意使用杠杆[4] - 胜负标准基于风险调整后的收益，所有AI的思考过程和交易记录完全公开透明，要求完全自主决策，人类不得干预[4] - 最终排名显示，中国AI模型包揽前两名：阿里Qwen 3 Max以账户余额12,232美元（收益率+22.32%）夺冠，DeepSeek V3.1 Chat以账户余额10,489美元（收益率+4.89%）获亚军，它们是仅有的两位盈利选手；而GPT-5亏损62.66%，账户余额仅剩3,734美元，在6个模型中排名垫底[1][5][6][7] 各模型绩效与风险指标 - Qwen 3 Max：总盈利2,232美元，交易43次，胜率30.2%，最大盈利8,176美元，最大亏损1,728美元，夏普比率0.273[5] - DeepSeek V3.1 Chat：总盈利489.08美元，交易41次，胜率24.4%，最大盈利7,378美元，最大亏损1,224美元，夏普比率0.359，为全场最高[5][6] - Claude Sonnet 4.5：亏损3,081美元（收益率-30.81%），交易36次，胜率25%，夏普比率-0.057[5][7] - Grok 4：亏损4,530美元（收益率-45.3%），交易47次，胜率27.7%，夏普比率-0.118[5][7] - Gemini 2.5 Pro：亏损5,671美元（收益率-56.71%），交易238次（为全场最多），胜率25.6%，夏普比率-0.566[5][7] - GPT-5：亏损6,266美元（收益率-62.66%），交易116次，胜率26.7%，夏普比率-0.525[5][7] 模型交易策略与风格分析 - Qwen 3 Max 策略极为简单专注，仅交易BTC一个品种，使用5倍杠杆，现金仅留48美元应急，设好止盈止损后等待信号[8] - DeepSeek V3.1 Chat 属于理性派，基于明确的“失效条件”管理仓位，对每个品种有独立逻辑，对ETH有0.85的高置信度看涨，DOGE空头贡献正收益，虽收益不如Qwen但风险控制最佳[8][10] - GPT-5 在账户亏损62%时仍坚持持有所有仓位，同时持有多空头寸（ETH/SOL/XRP/BTC/DOGE做空，BNB做多）[10] - Gemini 2.5 Pro 选择全仓做空六个币种，完全忽略短期反弹视其为“噪音”，仅当EMA交叉才平仓，纪律性极强，交易过程中展现出类似人类的心理活动[10] - Claude Sonnet 4.5 喜欢在多个品种中寻找机会，重点押注XRP（持仓中表现最佳），对BTC超卖保持乐观[11] - Grok 4 风格谨慎，即便亏损仍保留1,884美元现金，分散持有六个品种且设置紧密止损，主打保留现金弹药等待高确定性机会[12] 行业意义与未来展望 - 主办方nof1.ai认为，金融市场是训练下一代AI的最佳场所，因为市场是动态变化的，会学习、适应并针对策略反向操作，随着AI变聪明市场难度也会提升，这被视为“终极复杂挑战”[12] - 公司计划用市场作为训练场，让AI通过开放式学习和大规模强化学习不断进化，其创始人透露公司不仅在测试第三方模型，也在开发自有模型，准备在第二赛季让自家模型与其他模型竞争[14] - Alpha Arena 1.5赛季已进入倒计时，将带来多项改进：同时测试多个提示词、为每个模型部署多个实例、继续提升挑战难度[14] - 比赛启示在于同样市场环境下，简单专注的策略（Qwen）跑赢了复杂多元的配置，验证了“少即是多”的交易智慧；而稳健派（DeepSeek）虽收益非最高但风险控制出色，是成功的另一种诠释[14][15][16]