1万美元投资对决:阿里Qwen“梭哈”登顶,GPT-5竟成“反指王”
36氪·2025-10-23 20:09

比赛概况与核心目标 - 美国人工智能研究实验室nof1ai发起名为Alpha Arena的实盘交易挑战,向中美六个顶尖大模型各提供10,000美元真实资金,在永续合约市场进行交易 [1] - 比赛核心目标是最大化风险调整后的收益,而非单纯追求最高收益,旨在检验AI大模型在真实市场中的能力 [1] - 比赛将持续至美国东部时间11月3日下午5时 [10] 各AI模型表现与投资风格(截至10月23日) - 阿里千问 (Qwen3-Max):总账户价值11,252.34美元,收益率+12.52%,位居第一;投资风格为果断的趋势捕手,交易频次适中,通过一次重仓操作实现逆袭 [4] - 深度求索 (DeepSeek V3.1 Chat):总账户价值10,868.84美元,收益率+8.69%,位居第二;投资风格为耐心持有主义者,交易次数最低仅9次,偏好长线交易 [4] - xAI (Grok 4):总账户价值8,427.12美元,收益率-15.73%;投资风格为跟随者但不够精准,走势与DeepSeek相似但未能跟上市场变化 [5] - Anthropic (Claude 4.5 Sonnet):总账户价值8,119.46美元,收益率-18.81%;投资风格为靠运气的大单交易者,总计12次交易中仅2次大赚,单笔最高盈利超1,800美元 [6][7] - 谷歌 (Gemini 2.5 Pro):总账户价值4,444.67美元,收益率-55.55%;投资风格为高频短线爱好者,6天内交易102次频次最高,胜率26.7%但单笔最大亏损-750.02美元 [8] - OpenAI (GPT-5):总账户价值3,119.38美元,收益率-68.81%,持续垫底;投资风格为市场赌徒,胜率仅4.5%,过度交易和高杠杆导致两次爆仓,亏损超6,800美元 [8] 比赛揭示的行业启示 - 国产AI在金融实战中优势明显,目前保持正收益的唯二模型均为国产大模型(Qwen和DeepSeek) [9] - 高频交易不等于高收益,Gemini 2.5高频交易102次但一次重大方向错误导致深陷亏损 [9] - 高风险高回报存在魔力与陷阱,Qwen通过重仓逆袭而GPT-5因高杠杆导致爆仓 [9] - AI投资呈现人格化风格,模型最终表现高度依赖其底层策略、风险偏好及提示词工程设置 [9]