AI投资能力测试
搜索文档
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
机器之心· 2025-11-04 16:52
比赛概况 - 首届nof1 AI模型交易大赛于2025年10月17日至11月3日举行,旨在衡量AI投资能力,被誉为“币圈版的图灵测试”[1] - 参赛者为6款顶级大模型,分别来自DeepSeek、xAI、Google、OpenAI、阿里巴巴和Anthropic,代表中美两国闭源和开源供应商的最新技术水平[1] - 每款模型获得1万美元初始资金,在Hyperliquid上进行加密永续合约交易,交易范围限于BTC、ETH、SOL、BNB、DOGE和XRP六种流行加密货币,全程无人类干预[1][3] 交易规则与设置 - 模型操作空间限制为买入(做多)、卖出(做空)、持有或平仓,进行中低频交易(MLFT),决策间隔为几分钟到几个小时[3] - 选择加密货币市场的实际原因包括市场全天候开放、数据丰富易于获取、Hyperliquid快速可靠易集成以及市场的全球性[3] - 所有交易记录、持仓、决策日志和账户余额变化实时公开,观众可通过Nof1.ai平台查看动态图表,透明度极高[4] 比赛结果排名 - 阿里巴巴的Qwen3 Max排名第一,收益率为22.3%,胜率为30.2%,总盈亏为$2232,总交易次数为43次[5][7] - DeepSeek Chat V3.1排名第二,收益率为4.89%,胜率为24.4%,总盈亏为$489.08,总交易次数为41次[5][7] - 其余模型均大幅亏损,Claude Sonnet 4.5亏损30.81%、Grok 4亏损45.3%、Gemini 2.5 Pro亏损56.71%、GPT 5亏损62.66%[6][7] 模型交易策略分析 - Qwen3 Max整体偏“进攻型”,回报率高达22.32%,尽管费用较高($1654),但凭借30.2%的胜率和最大盈利$8176,展现“高风险高回报”策略,Sharpe值为0.273[13] - DeepSeek Chat V3.1表现稳健,回报率为4.89%,交易费用较低($690),最大盈利高达$7378,Sharpe值为0.359,为所有模型中最高,显示出色的风险控制能力[13] - Gemini 2.5 Pro交易次数达238次为所有模型最高,但胜率仅为25.6%,回报率为-56.71%,Sharpe值为-0.566,反映出过度交易且回报低效[14] - GPT-5表现最差,回报率为-62.66%,总亏损$6266,胜率为26.7%,Sharpe值为-0.525,缺乏有效的市场判断和风险管理[15] 行业影响与关注 - 赛事引发广泛关注,币安创始人赵长鹏公开评论,认为如果所有人都用相同的AI模型交易,可能导致大家在同一时刻买卖,影响市场动态[9] - 赵长鹏预测,由于AI交易表现引起关注,未来可能更多人研究AI在交易中的应用,预计交易量会大幅增加[11] - 总体来看,中国的Qwen3 Max与DeepSeek在风险控制与趋势识别上更为领先,而美国系模型则普遍亏损严重[16]