AI大模型投资 - 财报，业绩电话会，研报，新闻

AI大模型投资

搜索文档

南方都市报· 2025-11-04 21:41

比赛概况与结果 - 首届由美国AI研究实验室nof1发起的AI大模型交易大赛于11月3日结束，比赛为期两周，6家领先大模型各获得1万美元初始资金，在无人类干预的真实市场中进行自主交易[1] - 交易标的为加密货币衍生品（永续期货），币种包括比特币、以太坊、狗狗币等，模型仅能使用数值市场数据输入，无法获得新闻或市场消息[5] - 最终两家国产大模型实现盈利：阿里千问Qwen3 Max以22.3%收益率排名第一，盈利2232美元；DeepSeek Chat V3.1以4.89%收益率排名第二，盈利489.08美元[1] - 其余四家模型均大幅亏损：Claude Sonnet 4.5亏损30.81%，Grok 4亏损45.3%，Gemini 2.5 Pro亏损56.71%，GPT 5亏损62.66%[2] 模型交易行为分析 - 在做空倾向上，Grok 4、GPT-5和Gemini 2.5 Pro的做空频率远高于同行，而Claude Sonnet 4.5几乎从不做空[6] - 在持仓时间上，不同模型差异较大，Grok 4的持仓时间最长；在交易频率上，Gemini 2.5 Pro最活跃（238笔交易），Grok 4最不活跃[3][6] - 在仓位规模上，阿里Qwen 3的仓位规模始终最大，通常是GPT-5和Gemini 2.5 Pro的数倍[6] - 在退出机制方面，Qwen 3的止损与止盈距离最窄，Grok 4与DeepSeek V3.1则最宽；在持仓数量上，Claude Sonnet 4.5和Qwen 3通常一次只维持1-2个活跃仓位[6] 比赛过程与行业意义 - 比赛过程中出现显著波动，DeepSeek V3.1从10月26日起长期保持最高盈利，但在11月4日被阿里Qwen 3反超；Claude和Grok频繁调仓未能返回正区，Gemini和GPT-5持续下滑[7] - 主办方指出举办比赛的原因为：现有静态基准测试存在不足，仅测试固定数据集上的模式匹配能力，忽略了长期决策、运行鲁棒性和适应性，且测试结果易被模型记忆导致价值降低[7] - 比赛旨在真实、动态、竞争激烈的环境中测试模型的决策能力，参赛模型代表中美两国闭源和开源供应商的最新技术水平[5][7]

AI大模型投资

永续期货

Artificial Intelligence

Artificial Intelligence

Grok 4

Gemini 2.5 Pro

GPT 5

全球首个AI投资大赛落幕：中国模型全部盈利美国模型全部亏损

新京报· 2025-11-04 13:54

比赛概况 - 首个AI大模型实时投资比赛“Alpha Arena”于北京时间11月4日结束，由三方机构Nof1于10月18日发起 [1] - 比赛集合六个顶尖大模型，包括中国的DeepSeek v3.1、Qwen3-Max以及美国的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4 [1] - 每个模型拥有1万美元初始资金，在真实市场上无人工干预地自主决策和交易，根据盈亏情况决出冠军 [1] - 比赛历时17天 [2] 比赛进程与策略 - 比赛前半段，DeepSeek v3.1一直处于领先位置 [1] - Grok 4通过激进的投资策略，一度将与DeepSeek v3.1的差距缩短到1美元 [1] - 10月21日至22日成为转折点，Grok 4和Claude Sonnet 4.5收益大幅下滑，由盈转亏，10月22日当日六个大模型收益率一度全部告负 [1] - 在转折点后，DeepSeek v3.1和Qwen3-Max自动改写投资策略，在其他模型持续亏损的情况下脱颖而出 [2] - Qwen3-Max在过程中一度超过DeepSeek v3.1 [2] 最终结果与表现排名 - Qwen3-Max以1.22万美元的最终资产，超过20%的收益率夺得冠军 [2] - DeepSeek v3.1以10.49万美元的最终资产获得第二名 [2] - 两个中国模型成为唯二盈利的模型，而四个美国顶尖模型全部亏损 [2] - 参赛模型分为三大阵营：两家中国模型屡次互换第一，始终位列第一梯队；Claude Sonnet 4.5和Grok 4维持在第二阵营，略有盈利但整体仍亏损；GPT-5和Gemini 2.5 Pro长期亏损垫底 [2] - GPT-5亏损超60%垫底 [2]

全球首个AI投资大赛落幕：中国模型全部盈利，美国模型全部亏损

新京报· 2025-11-04 13:47

比赛概况 - 首个AI大模型实时投资比赛“Alpha Arena”于11月4日结束，历时17天，初始资金为一万美元 [1] - 参赛模型包括来自中国的DeepSeek v3.1、Qwen3-Max以及来自美国的GPT-5、Gemini2.5Pro、Claude Sonnet4.5、Grok4，共六个顶尖大模型 [1] - 比赛在真实市场进行，模型无人工干预自主决策交易，根据盈亏决出冠军 [1] 比赛进程与策略 - 比赛前半段DeepSeek v3.1处于领先位置，Grok4通过激进策略一度将差距缩短至1美元 [1] - 10月21日至22日成为转折点，Grok4和Claude Sonnet4.5收益大幅下滑由盈转亏，当日所有六个模型收益率一度全部告负 [1] - DeepSeek v3.1和Qwen3-Max在关键时刻自动改写投资策略，在其他模型持续亏损时脱颖而出 [2] 最终排名与业绩 - Qwen3-Max以12200美元资产和超过20%的收益率夺得冠军，DeepSeek v3.1以10490美元资产获得第二名 [2] - 两家中国模型成为唯二盈利的模型，四大美国顶尖模型全部亏损 [2] - 参赛模型形成三大阵营：两家中国模型位列第一梯队多次互换第一；Claude Sonnet4.5和Grok4维持第二阵营略有盈利但整体亏损；GPT-5和Gemini2.5Pro长期亏损垫底，其中GPT-5亏损超60% [2]