AI能帮我变成炒币大聪明吗?我们做了个低配版Alpha Arena,让6个模型上场PK炒币|Jinqiu Scan
锦秋集·2025-11-06 20:26

文章核心观点 - 锦秋AI实验室组织了一场AI炒币大赛,使用六款免费大模型的API进行BTC/USDT现货模拟交易,以评估其作为大众理财助手的实际表现[3][4] - 测试结果显示,在下跌行情中,采取全程观望策略的DeepSeek和Qwen(累计收益0.00%)表现最佳,成功保住了初始本金10,000 USDT[8][9][25] - 其余进行交易的AI模型均出现亏损,其中ChatGPT亏损最大(累计收益-2.55%,最终权益9,744.73 USDT),Gemini亏损最小(累计收益-0.25%,最终权益9,975.35 USDT)[9][14][19] - 实验表明当前免费AI模型在实盘交易中表现出明显的保守倾向和执行力不足,虽能制定逻辑完整的策略,但缺乏动态调整和风险偏好的能力[28][30][31] 测评过程 - 测试对象为六款免费大模型API:ChatGPT(openai/gpt-4o-mini)、Claude(anthropic/claude-3.5-sonnet)、Qwen(qwen/qwen-2.5-72b-instruct)、Grok(x-ai/grok-4-fast)、Gemini(google/gemini-2.5-flash)、DeepSeek(deepseek/deepseek-chat)[6][12] - 测试方法为手写程序让AI每30分钟根据实时K线图做出交易决策,可选操作包括BUY(买入)、SELL(卖出)、HOLD(观望)[6] - 要求AI在测试开始时输出核心交易策略,并在每次决策时说明理由,以便分析其思路和决策逻辑[7] 测试结果 - DeepSeek和Qwen表现最佳:两者均采取全程观望策略,累计收益率为0.00%,最终权益保持10,000 USDT初始本金不变[9][18][25] - ChatGPT表现最差:累计收益-2.55%,最终权益9,744.73 USDT,其问题在于一次性全仓买入后不肯减仓,既不敢动作也不敢纠错[9][14] - Claude策略相对稳妥:累计收益-0.84%,最终权益9,915.51 USDT,采用动量策略但未能及时止损,亏损幅度较小[9][16] - Gemini亏损控制最好:在出手的模型中损失最小,累计收益-0.25%,最终权益9,975.35 USDT,主要采取跟趋势、看支撑阻力的少操作策略[9][19] - Grok交易频繁但效果不佳:累计收益-1.30%,最终权益9,870.20 USDT,出现来回折腾的情况,容易把小亏变成实亏[9][22] 各AI模型交易策略分析 - ChatGPT策略:基于市场趋势和技术指标,规则包括价格突破50日均线且成交量放大时买入,跌破时卖出,波动小于5%时观望[13] - Claude策略:采用动量策略,规则包括日线MACD金叉且成交量放大时分3次买入,价格突破前高后量能萎缩时减仓30%,单笔亏损不超过总资金3%[15] - DeepSeek策略:结合趋势跟踪与动量突破,规则包括价格突破20日均线且RSI(14)>50时买入,跌破20日均线或RSI(14)<40时卖出[17] - Gemini策略:专注于识别并跟随市场主要趋势,利用价格行为和关键支撑阻力位进行交易,避免频繁交易[19] - Grok策略:采用趋势跟踪策略,使用50日EMA和200日EMA作为信号线,当50日EMA上穿200日EMA时买入,下穿时卖出[20][21] - Qwen策略:基于长期趋势分析结合短期动量指标,规则包括价格突破200日均线时逐步建仓,14日RSI连续3天超过70时准备减仓[23] 实验总结与行业启示 - 实验定位为面向大众理财者的AI模拟测评而非专业量化系统较量,旨在评估常见AI作为理财助手的实际表现[28] - AI模型展现出强大的推理能力和自洽性,能够在极短时间内制定完整交易逻辑并保持决策一致性,各自呈现不同的"性格"与思维框架[29] - 当前免费AI在实盘交易中存在明显局限:缺乏实时反馈闭环、不懂风险偏好、无法动态调整策略、不具备面对亏损时的情绪弹性[30] - AI在真实市场中表现出类似人性的交易特征:犹豫、保守、怕错、想赢,这种表现为人类投资者提供了清晰的借鉴参考[31] - 实验将继续深入,未来计划使用付费模型和更复杂信号源,测试AI在更多交易品类中的表现[32]