比赛概况与结果 - 初创公司Nof1发起名为“Alpha Arena”的AI大模型真实市场投资比赛,旨在衡量AI投资能力,每个模型获得1万美元启动资金在真实市场自主交易数字货币,比赛历时17天,从10月18日开始并全程直播[4] - 按最终盈利能力排名,两个中国大模型包揽冠亚军,且是所有参赛模型中唯二实现盈利的模型,四大美国头部模型均出现亏损[1][4] - 冠军为阿里通义的Qwen3 Max,收益率22.32%,账户余额增至12232美元,其在最后阶段反超对手[4];亚军为DeepSeek chat v3.1,收益率4.89%,账户余额为10489美元[4] - 第三至第六名均为亏损,Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro亏损幅度均超过30%,GPT-5亏损最为严重,账户余额仅剩3734美元,亏损超62%[1][4] 模型交易风格与表现分析 - DeepSeek的交易风格被归因为“专业对口”,其母公司为量化机构幻方,持仓覆盖各个标的,策略简单直接,不换手、不止损、不止盈,属于理性派,大部分时间领跑,表现稳定[7] - 冠军模型Qwen3 Max的策略出奇简单,每天“All in”一个标的并使用多倍杠杆,此前方向错误时损失惨重,但最终结果盈利最多[7] - Grok 4交易风格激进,满仓多个标的,高频跟踪趋势,导致波动较大且不稳定,曾一度收益排在第二位,但最终亏损达45%[5][7] - Claude Sonnet 4.5的最大特点是非常善于分析,但过于讲逻辑,下手时犹豫不决,经常调仓失败、反复止损[7] - Gemini 2.5 pro被调侃交易风格神似散户,策略反复更改,例如一会做多一会做空,其交易次数远高于前几名模型,交易费也更高[7] 比赛意义与行业观点 - 比赛发起方Nof1认为,十年前DeepMind用游戏推动前沿AI发展,现在金融市场是下一个AI时代的最佳训练环境,也是唯一一个随着AI越来越智能而变得越来越难的基准[7] - Nof1团队旨在通过市场训练新的基础模型,希望AI通过开放式学习和大规模强化学习不断进化,最终解决终极复杂挑战[8] - 有金融行业人士对将投资完全交给AI持保留态度,认为AI不了解用户真实的资产状况、家庭、工作现状和投资偏好,单纯给出投资建议是危险行为[8] - 此外,AI的底层逻辑是归纳、总结、复现人类社会中已有的信息,而不涉及任何对未来的预测,理性的工具与人的智慧相结合或许才是最佳组合[8]
谁家AI更会赚钱?大模型投资竞赛中国AI包揽前二
第一财经资讯·2025-11-04 17:13