比赛概况与最终排名 - 一场为期两周、由AI模型在Hyperliquid平台自主交易加密货币永续合约的投资比赛收官,初始资金为每个模型1万美元[1][3] - 参赛阵容包括Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4、Qwen 3 Max等全球6大顶级AI模型,交易品种涵盖BTC、ETH、BNB、SOL、XRP、DOGE,允许做多做空并随意使用杠杆[4] - 胜负标准基于风险调整后的收益,所有AI的思考过程和交易记录完全公开透明,要求完全自主决策,人类不得干预[4] - 最终排名显示,中国AI模型包揽前两名:阿里Qwen 3 Max以账户余额12,232美元(收益率+22.32%)夺冠,DeepSeek V3.1 Chat以账户余额10,489美元(收益率+4.89%)获亚军,它们是仅有的两位盈利选手;而GPT-5亏损62.66%,账户余额仅剩3,734美元,在6个模型中排名垫底[1][5][6][7] 各模型绩效与风险指标 - Qwen 3 Max:总盈利2,232美元,交易43次,胜率30.2%,最大盈利8,176美元,最大亏损1,728美元,夏普比率0.273[5] - DeepSeek V3.1 Chat:总盈利489.08美元,交易41次,胜率24.4%,最大盈利7,378美元,最大亏损1,224美元,夏普比率0.359,为全场最高[5][6] - Claude Sonnet 4.5:亏损3,081美元(收益率-30.81%),交易36次,胜率25%,夏普比率-0.057[5][7] - Grok 4:亏损4,530美元(收益率-45.3%),交易47次,胜率27.7%,夏普比率-0.118[5][7] - Gemini 2.5 Pro:亏损5,671美元(收益率-56.71%),交易238次(为全场最多),胜率25.6%,夏普比率-0.566[5][7] - GPT-5:亏损6,266美元(收益率-62.66%),交易116次,胜率26.7%,夏普比率-0.525[5][7] 模型交易策略与风格分析 - Qwen 3 Max 策略极为简单专注,仅交易BTC一个品种,使用5倍杠杆,现金仅留48美元应急,设好止盈止损后等待信号[8] - DeepSeek V3.1 Chat 属于理性派,基于明确的“失效条件”管理仓位,对每个品种有独立逻辑,对ETH有0.85的高置信度看涨,DOGE空头贡献正收益,虽收益不如Qwen但风险控制最佳[8][10] - GPT-5 在账户亏损62%时仍坚持持有所有仓位,同时持有多空头寸(ETH/SOL/XRP/BTC/DOGE做空,BNB做多)[10] - Gemini 2.5 Pro 选择全仓做空六个币种,完全忽略短期反弹视其为“噪音”,仅当EMA交叉才平仓,纪律性极强,交易过程中展现出类似人类的心理活动[10] - Claude Sonnet 4.5 喜欢在多个品种中寻找机会,重点押注XRP(持仓中表现最佳),对BTC超卖保持乐观[11] - Grok 4 风格谨慎,即便亏损仍保留1,884美元现金,分散持有六个品种且设置紧密止损,主打保留现金弹药等待高确定性机会[12] 行业意义与未来展望 - 主办方nof1.ai认为,金融市场是训练下一代AI的最佳场所,因为市场是动态变化的,会学习、适应并针对策略反向操作,随着AI变聪明市场难度也会提升,这被视为“终极复杂挑战”[12] - 公司计划用市场作为训练场,让AI通过开放式学习和大规模强化学习不断进化,其创始人透露公司不仅在测试第三方模型,也在开发自有模型,准备在第二赛季让自家模型与其他模型竞争[14] - Alpha Arena 1.5赛季已进入倒计时,将带来多项改进:同时测试多个提示词、为每个模型部署多个实例、继续提升挑战难度[14] - 比赛启示在于同样市场环境下,简单专注的策略(Qwen)跑赢了复杂多元的配置,验证了“少即是多”的交易智慧;而稳健派(DeepSeek)虽收益非最高但风险控制出色,是成功的另一种诠释[14][15][16]
AI 交易大赛结果出炉:只有中国 AI 赚钱,跟 GPT-5 反着买,别墅靠大海
36氪·2025-11-04 11:26