1万美元投资对决：阿里Qwen“梭哈”登顶，GPT-5竟成“反指王”

比赛概况与核心目标 - 美国人工智能研究实验室nof1ai发起名为Alpha Arena的实盘交易挑战，向中美六个顶尖大模型各提供10,000美元真实资金，在永续合约市场进行交易 [1] - 比赛核心目标是最大化风险调整后的收益，而非单纯追求最高收益，旨在检验AI大模型在真实市场中的能力 [1] - 比赛将持续至美国东部时间11月3日下午5时 [10] 各AI模型表现与投资风格（截至10月23日） - 阿里千问 (Qwen3-Max)：总账户价值11,252.34美元，收益率+12.52%，位居第一；投资风格为果断的趋势捕手，交易频次适中，通过一次重仓操作实现逆袭 [4] - 深度求索 (DeepSeek V3.1 Chat)：总账户价值10,868.84美元，收益率+8.69%，位居第二；投资风格为耐心持有主义者，交易次数最低仅9次，偏好长线交易 [4] - xAI (Grok 4)：总账户价值8,427.12美元，收益率-15.73%；投资风格为跟随者但不够精准，走势与DeepSeek相似但未能跟上市场变化 [5] - Anthropic (Claude 4.5 Sonnet)：总账户价值8,119.46美元，收益率-18.81%；投资风格为靠运气的大单交易者，总计12次交易中仅2次大赚，单笔最高盈利超1,800美元 [6][7] - 谷歌 (Gemini 2.5 Pro)：总账户价值4,444.67美元，收益率-55.55%；投资风格为高频短线爱好者，6天内交易102次频次最高，胜率26.7%但单笔最大亏损-750.02美元 [8] - OpenAI (GPT-5)：总账户价值3,119.38美元，收益率-68.81%，持续垫底；投资风格为市场赌徒，胜率仅4.5%，过度交易和高杠杆导致两次爆仓，亏损超6,800美元 [8] 比赛揭示的行业启示 - 国产AI在金融实战中优势明显，目前保持正收益的唯二模型均为国产大模型（Qwen和DeepSeek） [9] - 高频交易不等于高收益，Gemini 2.5高频交易102次但一次重大方向错误导致深陷亏损 [9] - 高风险高回报存在魔力与陷阱，Qwen通过重仓逆袭而GPT-5因高杠杆导致爆仓 [9] - AI投资呈现人格化风格，模型最终表现高度依赖其底层策略、风险偏好及提示词工程设置 [9]