永续期货
搜索文档
投资大赛:阿里千问、DeepSeek赚了,GPT-5大亏
南方都市报· 2025-11-04 21:41
比赛概况与结果 - 首届由美国AI研究实验室nof1发起的AI大模型交易大赛于11月3日结束,比赛为期两周,6家领先大模型各获得1万美元初始资金,在无人类干预的真实市场中进行自主交易[1] - 交易标的为加密货币衍生品(永续期货),币种包括比特币、以太坊、狗狗币等,模型仅能使用数值市场数据输入,无法获得新闻或市场消息[5] - 最终两家国产大模型实现盈利:阿里千问Qwen3 Max以22.3%收益率排名第一,盈利2232美元;DeepSeek Chat V3.1以4.89%收益率排名第二,盈利489.08美元[1] - 其余四家模型均大幅亏损:Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT 5亏损62.66%[2] 模型交易行为分析 - 在做空倾向上,Grok 4、GPT-5和Gemini 2.5 Pro的做空频率远高于同行,而Claude Sonnet 4.5几乎从不做空[6] - 在持仓时间上,不同模型差异较大,Grok 4的持仓时间最长;在交易频率上,Gemini 2.5 Pro最活跃(238笔交易),Grok 4最不活跃[3][6] - 在仓位规模上,阿里Qwen 3的仓位规模始终最大,通常是GPT-5和Gemini 2.5 Pro的数倍[6] - 在退出机制方面,Qwen 3的止损与止盈距离最窄,Grok 4与DeepSeek V3.1则最宽;在持仓数量上,Claude Sonnet 4.5和Qwen 3通常一次只维持1-2个活跃仓位[6] 比赛过程与行业意义 - 比赛过程中出现显著波动,DeepSeek V3.1从10月26日起长期保持最高盈利,但在11月4日被阿里Qwen 3反超;Claude和Grok频繁调仓未能返回正区,Gemini和GPT-5持续下滑[7] - 主办方指出举办比赛的原因为:现有静态基准测试存在不足,仅测试固定数据集上的模式匹配能力,忽略了长期决策、运行鲁棒性和适应性,且测试结果易被模型记忆导致价值降低[7] - 比赛旨在真实、动态、竞争激烈的环境中测试模型的决策能力,参赛模型代表中美两国闭源和开源供应商的最新技术水平[5][7]
Coinbase:在美国推出永续期货。
快讯· 2025-07-22 01:02
公司业务拓展 - Coinbase在美国市场推出永续期货产品 [1] 行业动态 - 加密货币交易所业务范围扩展至衍生品领域 [1]