DeepSeek chat v3.1
搜索文档
大模型投资竞赛,中国AI包揽前二,GPT-5亏损超62%垫底
第一财经· 2025-11-04 18:18
比赛结果概览 - 一场由初创公司Nof1发起的真实数字货币市场AI投资比赛“Alpha Arena”历时17天,六大模型参与角逐 [2][3] - 最终两个中国大模型包揽冠亚军,是参赛模型中唯二实现盈利的模型,而四大美国头部模型均出现亏损 [2] - 冠军为阿里通义的Qwen3 Max,收益率达+22.32%,账户余额为12,232美元 [3][4] - 亚军为DeepSeek chat v3.1,收益率为+4.89%,账户余额为10,489美元 [3][4] - 排名第三至第六的模型亏损均超过30%,其中GPT-5亏损62.66%垫底,账户余额仅剩3,734美元 [3][5] 模型交易表现细节 - 冠军Qwen3 Max总盈利为2,232美元,手续费为1,654美元,胜率为30.2%,最大盈利8,176美元,最大亏损1,728美元,夏普比率0.273,总交易次数43次 [3] - 亚军DeepSeek总盈利489.08美元,手续费690.30美元,胜率24.4%,最大盈利7,378美元,最大亏损1,224美元,夏普比率0.359,总交易次数41次 [3] - 亏损模型方面,Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT-5亏损62.66% [3][5] 比赛动态与市场特性 - 比赛于10月18日开始,持续约两周,期间排名持续波动,市场不可预测的特性得以体现 [6] - Grok 4曾一度收益排名第二位,但最终亏损45%位列倒数第三 [6] - DeepSeek大部分时间领跑,但在最后阶段被Qwen3 Max反超 [6] 模型交易风格分析 - DeepSeek因其母公司幻方是量化机构,表现稳定理性,策略简单直接,不换手、不止损、不止盈,覆盖各个标的 [8] - Qwen3 Max采用高风险的“All in”策略,每天全仓一个标的使用多倍杠杆,此前方向错误时损失惨重但最终盈利最高 [8] - Grok 4交易风格激进,满仓多个标的,高频跟踪趋势,波动较大 [8] - Claude擅长分析但决策犹豫,经常调仓失败、反复止损 [8] - Gemini 2.5 Pro被调侃交易风格神似散户,策略反复更改,交易次数达238次远高于其他模型,手续费也高达1,331美元 [8][3] 比赛背景与行业意义 - 主办方Nof1认为,十年前DeepMind用游戏推动AI发展,现在金融市场是下一个AI时代的最佳训练环境 [9] - 金融市场是唯一一个随着AI越来越智能而变得越来越难的基准 [9] - 团队旨在通过市场训练新的基础模型,使AI通过开放式学习和大规模强化学习不断进化 [9]
谁家AI更会赚钱?大模型投资竞赛中国AI包揽前二
第一财经资讯· 2025-11-04 17:13
比赛概况与结果 - 初创公司Nof1发起名为“Alpha Arena”的AI大模型真实市场投资比赛,旨在衡量AI投资能力,每个模型获得1万美元启动资金在真实市场自主交易数字货币,比赛历时17天,从10月18日开始并全程直播[4] - 按最终盈利能力排名,两个中国大模型包揽冠亚军,且是所有参赛模型中唯二实现盈利的模型,四大美国头部模型均出现亏损[1][4] - 冠军为阿里通义的Qwen3 Max,收益率22.32%,账户余额增至12232美元,其在最后阶段反超对手[4];亚军为DeepSeek chat v3.1,收益率4.89%,账户余额为10489美元[4] - 第三至第六名均为亏损,Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro亏损幅度均超过30%,GPT-5亏损最为严重,账户余额仅剩3734美元,亏损超62%[1][4] 模型交易风格与表现分析 - DeepSeek的交易风格被归因为“专业对口”,其母公司为量化机构幻方,持仓覆盖各个标的,策略简单直接,不换手、不止损、不止盈,属于理性派,大部分时间领跑,表现稳定[7] - 冠军模型Qwen3 Max的策略出奇简单,每天“All in”一个标的并使用多倍杠杆,此前方向错误时损失惨重,但最终结果盈利最多[7] - Grok 4交易风格激进,满仓多个标的,高频跟踪趋势,导致波动较大且不稳定,曾一度收益排在第二位,但最终亏损达45%[5][7] - Claude Sonnet 4.5的最大特点是非常善于分析,但过于讲逻辑,下手时犹豫不决,经常调仓失败、反复止损[7] - Gemini 2.5 pro被调侃交易风格神似散户,策略反复更改,例如一会做多一会做空,其交易次数远高于前几名模型,交易费也更高[7] 比赛意义与行业观点 - 比赛发起方Nof1认为,十年前DeepMind用游戏推动前沿AI发展,现在金融市场是下一个AI时代的最佳训练环境,也是唯一一个随着AI越来越智能而变得越来越难的基准[7] - Nof1团队旨在通过市场训练新的基础模型,希望AI通过开放式学习和大规模强化学习不断进化,最终解决终极复杂挑战[8] - 有金融行业人士对将投资完全交给AI持保留态度,认为AI不了解用户真实的资产状况、家庭、工作现状和投资偏好,单纯给出投资建议是危险行为[8] - 此外,AI的底层逻辑是归纳、总结、复现人类社会中已有的信息,而不涉及任何对未来的预测,理性的工具与人的智慧相结合或许才是最佳组合[8]
1万美金操盘4天,DeepSeek大赚40%
搜狐财经· 2025-10-23 13:48
比赛概况 - 初创公司Nof1组织了一场名为Alpha Arena的AI炒股大赛,使用真实资金进行交易,每个AI工具获得1万美元本金,比赛为期两周,从美东时间10月18日开始[2][4] - 比赛汇集了国内外顶级AI模型,海外组包括OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、马斯克的Grok 4以及Anthropic的Claude Sonnet 4.5,国内组包括阿里通义Qwen3 Max和幻方量化背景的DeepSeek chat v3.1[4] 当前赛况与排名 - 截至北京时间10月21日晚上22:00,DeepSeek以13%的收益率领先,其最高收益率曾达到惊人的40%[6] - Grok 4以11.7%的收益率排名第二,其最高收益率达到38.15%[8] - Claude Sonnet 4.5以11.45%的收益率位列第三,最高收益率达到28.08%[8] - 阿里通义Qwen3 Max目前处于小幅盈利状态,账户资金为10,326美元,盈利326美元[10] - OpenAI的GPT-5和谷歌的Gemini 2.5 Pro表现不佳,GPT-5亏损高达45.81%,账户剩余5,414美元,Gemini 2.5 Pro亏损50.06%,账户剩余4,994美元[6][10][11] 投资策略分析 - DeepSeek采用激进的全仓做多策略,开盘后迅速以15倍杠杆做多以太坊等多个主流加密货币,并坚定持有,该策略在上涨行情中一度盈利接近40%[12][13] - GPT-5因采取错误的看空策略导致重大亏损,其交易记录显示在以太坊上的空头交易均以亏损告终[14][15] - Gemini 2.5 Pro交易频繁且策略摇摆不定,短短几天交易70次,频繁的“追涨杀跌”操作和高昂手续费导致账户净值大幅缩水[15][16] - Grok 4与DeepSeek类似采用全仓做多策略,但波动较大[16] - Claude Sonnet 4.5表现最为稳健,仓位控制谨慎,交易风格沉稳,倾向于在看准机会后才出手[17] 行业意义与影响 - 此次比赛将AI模型置于真实且不可预测的金融市场中进行测试,超越了传统的静态能力评估榜单[17][18] - 在金融市场中,AI模型需要像真正的交易员一样,不仅分析数据,还要解读市场情绪,面对没有标准答案的不断变化的概率[19] - DeepSeek的出色表现部分归因于其背后幻方量化的支持,幻方量化作为管理规模超千亿人民币的量化巨头,拥有海量的交易数据和策略积累,这与其他互联网背景的AI模型形成对比[12]
谁家AI用一万美元赚翻了?DeepSeek第一 GPT 5垫底
第一财经· 2025-10-21 20:33
比赛概况 - 初创公司Nof1发起名为"Alpha Arena"的真实数字货币投资基准测试[3] - 测试使用真实市场环境,为每个AI模型账户提供1万美元启动资金进行自主交易[3] - 比赛于美东时间10月18日开始,持续两周至11月3日结束[4] - 整个过程实时直播,展示模型交易思路和实时收益排名[3] 参赛模型及当前表现 - 参赛模型包括DeepSeek chat v3.1、Claude Sonnet 4.5、Grok 4、Qwen3 Max、Gemini 2.5 pro、GPT 5六家[4] - 经过4天交易,DeepSeek收益率稳定在10%左右排名第一,其收益率曾一度接近40%,盈利超过4000美元[4] - Claude从第三天第三位上升至第二位,收益水平紧跟DeepSeek[6] - GPT 5目前亏损超过40%,亏损金额超过5900美元[6] - Gemini 2.5亏损超过30%,Qwen3 Max亏损超过13%[6] - Grok 4收益在盈亏线徘徊,交易风格激进波动较大[6] 模型交易风格分析 - DeepSeek交易稳定,策略简单直接,18日开盘即全仓持有,采用10-15倍做多,不换手不止损不止盈[8] - Gemini 2.5被形容交易风格神似散户,策略反复更改,交易次数远高于前几名模型,交易费更高[10] - Grok 4交易风格激进,满仓多个标的,高频跟踪趋势,波动较大不稳定[12] - Claude非常善于分析但下手犹豫,经常调仓失败反复止损[12] - Qwen3 Max每天全仓一个标的,使用20倍杠杆,方向错误便损失惨重[12] AI投资价值评估 - AI最大价值在于克服人类情绪化弱点,给出逻辑清晰方案,具备快速整合分析能力[13] - AI能够快速阅读所有报告并理清关系,但无法预测未来,也不了解市场动态信息和未公开信息[13] - 理性的AI工具与人的智慧结合被认为是最佳组合[13] - 有用户通过专业提示词让AI荐股获得可观收益,前提是用户自身具备筛选标准[12]
六大AI模型一万美元投资对决:DeepSeek收益领跑,GPT 5垫底,目前亏损超40%
第一财经· 2025-10-21 20:12
比赛概况 - 初创公司Nof1发起名为“Alpha Arena”的AI投资基准测试 使用真实市场环境进行数字货币交易 每个模型账户获得一万美元启动资金 [5] - 比赛于美东时间10月18日开始 将持续两周 于11月3日结束 实时直播交易过程并展示模型交易思路和收益排名 [5] - 参赛模型包括DeepSeek chat v3 1 Claude Sonnet 4 5 Grok 4 Qwen3 Max Gemini 2 5 pro GPT 5 涵盖三家海外头部模型和两家国内模型 [5] 当前排名与表现 - 截至10月21日比赛进行四天 DeepSeek收益率稳定在10%左右 排名第一 其收益率曾一度接近40% 盈利超过4000美元 但随大盘下跌回吐部分收益 [5][7] - Claude从前期第三位上升至第二位 收益水平紧跟DeepSeek Grok 4前期排名第二 但因交易风格激进 随大盘下跌后在盈亏线徘徊 [7] - GPT 5目前亏损已超过40% 亏损金额超过5900美元 在当日垫底 Gemini 2 5前期亏损超过30% 阿里通义的Qwen3 Max亏损超过13% 大部分时间处于亏损状态 [7] 模型交易风格分析 - DeepSeek交易风格稳定 被归因于其母公司幻方为量化机构 持仓策略为开盘即全仓持有 使用10-15倍做多杠杆 不换手不止损不止盈 [9] - Gemini 2 5交易策略反复更改 交易次数远高于前列模型 交易费用更高 被调侃为“交易风格神似散户” [11] - Grok 4交易风格激进 满仓多个标的并进行高频趋势跟踪 导致波动较大 Claude分析能力强但调仓犹豫 经常调仓失败和反复止损 Qwen3 Max每日全仓单一标的并使用20倍杠杆 方向错误则损失惨重 [13] AI投资价值与局限 - AI在投资中的价值在于克服人类情绪化弱点 提供逻辑清晰方案 并具备快速整合分析能力 如快速阅读报告和理清关系 [14] - AI的局限在于无法预测未来 也不了解市场动态信息和未公开信息 市场并非单纯数字游戏 需要理性工具与人的智慧结合 [14] - AI投资建议的风险在于其不了解用户真实资产状况 家庭工作现状和投资偏好 单纯给出投资建议是危险行为 其底层逻辑是基于归纳总结已有信息 不涉及未来预测 [13]
谁家AI用一万美元赚翻了?DeepSeek第一,GPT 5垫底
第一财经· 2025-10-21 19:24
活动概览 - 初创公司Nof1发起名为"Alpha Arena"的真实数字货币投资基准测试 让AI模型用真实资金进行自主交易[5] - 活动为每个模型账户提供一万美元启动资金 全程直播交易过程及实时收益排名 并可查看每个模型的交易思路[5] - 活动于美东时间10月18日开始 持续两周 于11月3日结束 参与模型包括DeepSeek chat v3 1 Claude Sonnet 4 5 Grok 4 Qwen3 Max Gemini 2 5 pro GPT 5共六个[5] 初期交易表现 - 截至10月21日(活动第4天) DeepSeek收益率稳定在10%左右 排名第一 其收益率曾一度接近40% 盈利超过4000美元[5][7] - Claude从最初的第3位上升至第2位 收益水平紧跟DeepSeek[7] - Grok 4收益曾一度接近DeepSeek排名第2 但其交易风格激进 随大盘下跌后收益在盈亏线徘徊[7] - Gemini 2 5 pro亏损曾超过30% GPT 5当前亏损已超过40% 亏损金额超过5900美元 Qwen3 Max亏损超过13% 大部分时间在盈亏线以下[7] 模型交易风格分析 - DeepSeek交易稳定 策略简单直接 在18日开盘时即全仓持有 使用10-15倍做多杠杆 不换手 不止损 不止盈 其稳定表现被归因于母公司幻方是量化机构[9] - Gemini 2 5 pro被调侃交易风格神似散户 策略反复更改 交易次数远高于前几名模型 交易费更高[11] - Grok 4交易风格激进 满仓多个标的 高频跟踪趋势 导致波动较大[13] - Claude非常善于分析但下手犹豫 经常调仓失败 反复止损[13] - Qwen3 Max每天"All in"一个标的 使用20倍杠杆 方向错误便损失惨重[13] 行业观点 - AI在投资中的最大价值在于克服人类情绪化弱点 提供逻辑清晰的方案 并具备快速整合分析能力 如快速读完所有报告并理清理关系[14] - AI的底层逻辑是归纳 总结和复现人类社会中已有信息 并不涉及任何对未来的预测 也不了解当下市场的动态信息及未公开信息[13][14] - 市场并非单纯的数字游戏 理性的工具与人的智慧结合被认为是最佳组合[14]