Workflow
DeepSeek chat v3.1
icon
搜索文档
大模型投资竞赛,中国AI包揽前二,GPT-5亏损超62%垫底
第一财经· 2025-11-04 18:18
2025.11. 04 本文字数:1379,阅读时长大约2分钟 作者 | 第一财经 刘晓洁 历时17天,AI大模型投资比赛"Alpha Arena"结果出炉,两个中国大模型夺得冠亚军,也是所有模型中唯二两个赚钱的,四大美国头部模型均亏损, GPT-5亏损超62%垫底。 | OVERALL STATS | ADVANCED ANALYTICS | | | | | | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | RANK MODEL | | ACCT VALUE J | RETURN % | TOTAL P&L | FEES | WIN RATE | BIGGEST WIN | BIGGEST LOSS | SHARPE | TRADES | | J | > QWEN3 MAX | $12,232 | +22.32% | $2,232 | $1,654 | 30.2% | $8,176 | -$1,728 | 0.273 | 43 | | 2 | DEEPSEEK CHAT V3.1 | $10,489 ...
谁家AI更会赚钱?大模型投资竞赛中国AI包揽前二
第一财经资讯· 2025-11-04 17:13
历时17天,AI大模型投资比赛"Alpha Arena"结果出炉,两个中国大模型夺得冠亚军,也是所有模型中 唯二两个赚钱的,四大美国头部模型均亏损,GPT-5亏损超62%垫底。 这是一场由初创公司Nof1发起的模型投资基准测试,但并非模拟交易,为了衡量AI投资能力,主办方 给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。Alpha Arena直播 整个过程,价格实时波动,并对实时收益进行排名,还可以看到每个模型的交易思路。 参与这次比赛的有六大模型,按最终盈利能力排名,阿里通义的Qwen3 Max在最后阶段反超,排名第 一,收益率22.32%,账户余额 12232 美元。DeepSeek chat v3.1紧随其后,收益率4.89%,余额 10489美 元 。 Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro、GPT 5排在第三至第六位,亏损幅度均超过30%。尤其是 GPT-5亏得最多,账户余额只剩 3734 美元 。 对于这次竞赛,发起方Nof1在博客里提到,十年前 DeepMind 用游戏推动了前沿AI 的快速发展,现在 他们认为金融市场是下一个AI ...
1万美金操盘4天,DeepSeek大赚40%
搜狐财经· 2025-10-23 13:48
比赛概况 - 初创公司Nof1组织了一场名为Alpha Arena的AI炒股大赛,使用真实资金进行交易,每个AI工具获得1万美元本金,比赛为期两周,从美东时间10月18日开始[2][4] - 比赛汇集了国内外顶级AI模型,海外组包括OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、马斯克的Grok 4以及Anthropic的Claude Sonnet 4.5,国内组包括阿里通义Qwen3 Max和幻方量化背景的DeepSeek chat v3.1[4] 当前赛况与排名 - 截至北京时间10月21日晚上22:00,DeepSeek以13%的收益率领先,其最高收益率曾达到惊人的40%[6] - Grok 4以11.7%的收益率排名第二,其最高收益率达到38.15%[8] - Claude Sonnet 4.5以11.45%的收益率位列第三,最高收益率达到28.08%[8] - 阿里通义Qwen3 Max目前处于小幅盈利状态,账户资金为10,326美元,盈利326美元[10] - OpenAI的GPT-5和谷歌的Gemini 2.5 Pro表现不佳,GPT-5亏损高达45.81%,账户剩余5,414美元,Gemini 2.5 Pro亏损50.06%,账户剩余4,994美元[6][10][11] 投资策略分析 - DeepSeek采用激进的全仓做多策略,开盘后迅速以15倍杠杆做多以太坊等多个主流加密货币,并坚定持有,该策略在上涨行情中一度盈利接近40%[12][13] - GPT-5因采取错误的看空策略导致重大亏损,其交易记录显示在以太坊上的空头交易均以亏损告终[14][15] - Gemini 2.5 Pro交易频繁且策略摇摆不定,短短几天交易70次,频繁的“追涨杀跌”操作和高昂手续费导致账户净值大幅缩水[15][16] - Grok 4与DeepSeek类似采用全仓做多策略,但波动较大[16] - Claude Sonnet 4.5表现最为稳健,仓位控制谨慎,交易风格沉稳,倾向于在看准机会后才出手[17] 行业意义与影响 - 此次比赛将AI模型置于真实且不可预测的金融市场中进行测试,超越了传统的静态能力评估榜单[17][18] - 在金融市场中,AI模型需要像真正的交易员一样,不仅分析数据,还要解读市场情绪,面对没有标准答案的不断变化的概率[19] - DeepSeek的出色表现部分归因于其背后幻方量化的支持,幻方量化作为管理规模超千亿人民币的量化巨头,拥有海量的交易数据和策略积累,这与其他互联网背景的AI模型形成对比[12]
谁家AI用一万美元赚翻了?DeepSeek第一 GPT 5垫底
第一财经· 2025-10-21 20:33
比赛概况 - 初创公司Nof1发起名为"Alpha Arena"的真实数字货币投资基准测试[3] - 测试使用真实市场环境,为每个AI模型账户提供1万美元启动资金进行自主交易[3] - 比赛于美东时间10月18日开始,持续两周至11月3日结束[4] - 整个过程实时直播,展示模型交易思路和实时收益排名[3] 参赛模型及当前表现 - 参赛模型包括DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro、GPT 5六家[4] - 经过4天交易,DeepSeek收益率稳定在10%左右排名第一,其收益率曾一度接近40%,盈利超过4000美元[4] - Claude从第三天第三位上升至第二位,收益水平紧跟DeepSeek[6] - GPT 5目前亏损超过40%,亏损金额超过5900美元[6] - Gemini 2.5亏损超过30%,Qwen3 Max亏损超过13%[6] - Grok 4收益在盈亏线徘徊,交易风格激进波动较大[6] 模型交易风格分析 - DeepSeek交易稳定,策略简单直接,18日开盘即全仓持有,采用10-15倍做多,不换手不止损不止盈[8] - Gemini 2.5被形容交易风格神似散户,策略反复更改,交易次数远高于前几名模型,交易费更高[10] - Grok 4交易风格激进,满仓多个标的,高频跟踪趋势,波动较大不稳定[12] - Claude非常善于分析但下手犹豫,经常调仓失败反复止损[12] - Qwen3 Max每天全仓一个标的,使用20倍杠杆,方向错误便损失惨重[12] AI投资价值评估 - AI最大价值在于克服人类情绪化弱点,给出逻辑清晰方案,具备快速整合分析能力[13] - AI能够快速阅读所有报告并理清关系,但无法预测未来,也不了解市场动态信息和未公开信息[13] - 理性的AI工具与人的智慧结合被认为是最佳组合[13] - 有用户通过专业提示词让AI荐股获得可观收益,前提是用户自身具备筛选标准[12]
六大AI模型一万美元投资对决:DeepSeek收益领跑,GPT 5垫底,目前亏损超40%
第一财经· 2025-10-21 20:12
比赛概况 - 初创公司Nof1发起名为“Alpha Arena”的AI投资基准测试 使用真实市场环境进行数字货币交易 每个模型账户获得一万美元启动资金 [5] - 比赛于美东时间10月18日开始 将持续两周 于11月3日结束 实时直播交易过程并展示模型交易思路和收益排名 [5] - 参赛模型包括DeepSeek chat v3 1 Claude Sonnet 4 5 Grok 4 Qwen3 Max Gemini 2 5 pro GPT 5 涵盖三家海外头部模型和两家国内模型 [5] 当前排名与表现 - 截至10月21日比赛进行四天 DeepSeek收益率稳定在10%左右 排名第一 其收益率曾一度接近40% 盈利超过4000美元 但随大盘下跌回吐部分收益 [5][7] - Claude从前期第三位上升至第二位 收益水平紧跟DeepSeek Grok 4前期排名第二 但因交易风格激进 随大盘下跌后在盈亏线徘徊 [7] - GPT 5目前亏损已超过40% 亏损金额超过5900美元 在当日垫底 Gemini 2 5前期亏损超过30% 阿里通义的Qwen3 Max亏损超过13% 大部分时间处于亏损状态 [7] 模型交易风格分析 - DeepSeek交易风格稳定 被归因于其母公司幻方为量化机构 持仓策略为开盘即全仓持有 使用10-15倍做多杠杆 不换手不止损不止盈 [9] - Gemini 2 5交易策略反复更改 交易次数远高于前列模型 交易费用更高 被调侃为“交易风格神似散户” [11] - Grok 4交易风格激进 满仓多个标的并进行高频趋势跟踪 导致波动较大 Claude分析能力强但调仓犹豫 经常调仓失败和反复止损 Qwen3 Max每日全仓单一标的并使用20倍杠杆 方向错误则损失惨重 [13] AI投资价值与局限 - AI在投资中的价值在于克服人类情绪化弱点 提供逻辑清晰方案 并具备快速整合分析能力 如快速阅读报告和理清关系 [14] - AI的局限在于无法预测未来 也不了解市场动态信息和未公开信息 市场并非单纯数字游戏 需要理性工具与人的智慧结合 [14] - AI投资建议的风险在于其不了解用户真实资产状况 家庭工作现状和投资偏好 单纯给出投资建议是危险行为 其底层逻辑是基于归纳总结已有信息 不涉及未来预测 [13]
谁家AI用一万美元赚翻了?DeepSeek第一,GPT 5垫底
第一财经· 2025-10-21 19:24
活动概览 - 初创公司Nof1发起名为"Alpha Arena"的真实数字货币投资基准测试 让AI模型用真实资金进行自主交易[5] - 活动为每个模型账户提供一万美元启动资金 全程直播交易过程及实时收益排名 并可查看每个模型的交易思路[5] - 活动于美东时间10月18日开始 持续两周 于11月3日结束 参与模型包括DeepSeek chat v3 1 Claude Sonnet 4 5 Grok 4 Qwen3 Max Gemini 2 5 pro GPT 5共六个[5] 初期交易表现 - 截至10月21日(活动第4天) DeepSeek收益率稳定在10%左右 排名第一 其收益率曾一度接近40% 盈利超过4000美元[5][7] - Claude从最初的第3位上升至第2位 收益水平紧跟DeepSeek[7] - Grok 4收益曾一度接近DeepSeek排名第2 但其交易风格激进 随大盘下跌后收益在盈亏线徘徊[7] - Gemini 2 5 pro亏损曾超过30% GPT 5当前亏损已超过40% 亏损金额超过5900美元 Qwen3 Max亏损超过13% 大部分时间在盈亏线以下[7] 模型交易风格分析 - DeepSeek交易稳定 策略简单直接 在18日开盘时即全仓持有 使用10-15倍做多杠杆 不换手 不止损 不止盈 其稳定表现被归因于母公司幻方是量化机构[9] - Gemini 2 5 pro被调侃交易风格神似散户 策略反复更改 交易次数远高于前几名模型 交易费更高[11] - Grok 4交易风格激进 满仓多个标的 高频跟踪趋势 导致波动较大[13] - Claude非常善于分析但下手犹豫 经常调仓失败 反复止损[13] - Qwen3 Max每天"All in"一个标的 使用20倍杠杆 方向错误便损失惨重[13] 行业观点 - AI在投资中的最大价值在于克服人类情绪化弱点 提供逻辑清晰的方案 并具备快速整合分析能力 如快速读完所有报告并理清理关系[14] - AI的底层逻辑是归纳 总结和复现人类社会中已有信息 并不涉及任何对未来的预测 也不了解当下市场的动态信息及未公开信息[13][14] - 市场并非单纯的数字游戏 理性的工具与人的智慧结合被认为是最佳组合[14]