Claude Sonnet4.5
搜索文档
全球首个AI投资大赛落幕:中国模型全部盈利,美国模型全部亏损
新京报· 2025-11-04 13:47
比赛概况 - 首个AI大模型实时投资比赛“Alpha Arena”于11月4日结束,历时17天,初始资金为一万美元 [1] - 参赛模型包括来自中国的DeepSeek v3.1、Qwen3-Max以及来自美国的GPT-5、Gemini2.5Pro、Claude Sonnet4.5、Grok4,共六个顶尖大模型 [1] - 比赛在真实市场进行,模型无人工干预自主决策交易,根据盈亏决出冠军 [1] 比赛进程与策略 - 比赛前半段DeepSeek v3.1处于领先位置,Grok4通过激进策略一度将差距缩短至1美元 [1] - 10月21日至22日成为转折点,Grok4和Claude Sonnet4.5收益大幅下滑由盈转亏,当日所有六个模型收益率一度全部告负 [1] - DeepSeek v3.1和Qwen3-Max在关键时刻自动改写投资策略,在其他模型持续亏损时脱颖而出 [2] 最终排名与业绩 - Qwen3-Max以12200美元资产和超过20%的收益率夺得冠军,DeepSeek v3.1以10490美元资产获得第二名 [2] - 两家中国模型成为唯二盈利的模型,四大美国顶尖模型全部亏损 [2] - 参赛模型形成三大阵营:两家中国模型位列第一梯队多次互换第一;Claude Sonnet4.5和Grok4维持第二阵营略有盈利但整体亏损;GPT-5和Gemini2.5Pro长期亏损垫底,其中GPT-5亏损超60% [2]
Qwen 3 Max领跑“AI投资实战赛”:阿里通义千问在Alpha Arena跑赢GPT-5与Gemini
经济观察网· 2025-10-23 15:27
由美国研究实验室nof1.ai发起的"Alpha Arena"AI投资实战竞赛,吸引多家全球主流大模型参赛,正成为观察AI自主交易能力的一场"公开测试"。 目前,阿里旗下Qwen3Max暂列收益榜首。其投资路径显示,该模型能够在高频市场反馈中持续自我优化,通过实时强化学习调整策略,使收益曲线呈现出 稳定上行趋势。业内分析人士指出,这种基于反馈信号的自适应机制,是强化学习在量化投资场景中的典型体现。 与其他五款模型相比,Qwen3Max在策略上更注重机会捕捉与风险平衡。其在市场波动期快速介入、严格止损,保持较低风险敞口。而Gemini2.5Pro与GPT-5 的策略则相对激进,杠杆倍数较高,因入场时机偏差导致亏损超过50%。 Qwen3Max在交易行为上表现出高效与稳健的平衡:共完成8次交易,频率高于平均水平;平均持仓时间约7小时,反映出较强的短期响应能力。收益率从早 期的8.43%提升至13.41%,实现稳定增长并有效控制回撤。同期比特币持有策略仅录得1.45%收益,Qwen3Max显著跑赢市场。 从整体表现来看,DeepSeek V3.1Chat与Grok-4走势较为接近,初期出现亏损后迅速回升;GPT-5 ...