DeepSeek Chat V3.1
搜索文档
投资大赛:阿里千问、DeepSeek赚了,GPT-5大亏
南方都市报· 2025-11-04 21:41
比赛概况与结果 - 首届由美国AI研究实验室nof1发起的AI大模型交易大赛于11月3日结束,比赛为期两周,6家领先大模型各获得1万美元初始资金,在无人类干预的真实市场中进行自主交易[1] - 交易标的为加密货币衍生品(永续期货),币种包括比特币、以太坊、狗狗币等,模型仅能使用数值市场数据输入,无法获得新闻或市场消息[5] - 最终两家国产大模型实现盈利:阿里千问Qwen3 Max以22.3%收益率排名第一,盈利2232美元;DeepSeek Chat V3.1以4.89%收益率排名第二,盈利489.08美元[1] - 其余四家模型均大幅亏损:Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT 5亏损62.66%[2] 模型交易行为分析 - 在做空倾向上,Grok 4、GPT-5和Gemini 2.5 Pro的做空频率远高于同行,而Claude Sonnet 4.5几乎从不做空[6] - 在持仓时间上,不同模型差异较大,Grok 4的持仓时间最长;在交易频率上,Gemini 2.5 Pro最活跃(238笔交易),Grok 4最不活跃[3][6] - 在仓位规模上,阿里Qwen 3的仓位规模始终最大,通常是GPT-5和Gemini 2.5 Pro的数倍[6] - 在退出机制方面,Qwen 3的止损与止盈距离最窄,Grok 4与DeepSeek V3.1则最宽;在持仓数量上,Claude Sonnet 4.5和Qwen 3通常一次只维持1-2个活跃仓位[6] 比赛过程与行业意义 - 比赛过程中出现显著波动,DeepSeek V3.1从10月26日起长期保持最高盈利,但在11月4日被阿里Qwen 3反超;Claude和Grok频繁调仓未能返回正区,Gemini和GPT-5持续下滑[7] - 主办方指出举办比赛的原因为:现有静态基准测试存在不足,仅测试固定数据集上的模式匹配能力,忽略了长期决策、运行鲁棒性和适应性,且测试结果易被模型记忆导致价值降低[7] - 比赛旨在真实、动态、竞争激烈的环境中测试模型的决策能力,参赛模型代表中美两国闭源和开源供应商的最新技术水平[5][7]
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
36氪· 2025-11-04 19:13
大赛概况 - 首届Nof1 AI模型交易大赛于2025年10月17日启动,11月3日结束,旨在衡量AI投资能力,被誉为“币圈版的图灵测试” [1] - 参赛模型为6款代表中美两国闭源和开源供应商最新技术水平的大模型,包括DeepSeek Chat V3.1、Grok 4、Gemini 2.5 Pro、GPT-5、Qwen3 Max、Claude Sonnet 4.5 [1] - 每款模型获得1万美元初始资金,在Hyperliquid上进行加密永续合约交易,交易范围限于BTC、ETH、SOL、BNB、DOGE和XRP六种流行加密货币,全程无人类干预 [1][3] 比赛结果与模型表现 - 中国模型Qwen3 Max排名第一,收益率为22.3%,胜率为30.2%,总盈亏为$2232,总交易次数为43次 [3][5][9] - 中国模型DeepSeek Chat V3.1排名第二,收益率为4.89%,胜率为24.4%,总盈亏为$489.08,总交易次数为41次 [3][5][9] - 美国模型Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT-5亏损62.66% [4][5] - 中国模型在风险控制与趋势识别上更为领先,而美国系模型普遍亏损严重 [12] 交易策略分析 - Qwen3 Max整体偏“进攻型”,Sharpe值为0.273,展现高风险高回报的进取型交易策略,最大盈利达$8,176 [5][9] - DeepSeek Chat V3.1策略理性稳健,Sharpe值为0.359为所有模型中最高,显示出色的风险控制能力,最大盈利$7,378 [5][9] - Gemini 2.5 Pro交易次数达238次为所有模型最高,极度活跃但胜率仅25.6%,Sharpe值-0.566,反映过度交易且回报低效 [5][10] - GPT-5交易存在较大波动且亏损严重,Sharpe值-0.525,最大盈利仅$270.77,缺乏有效的市场判断和风险管理 [5][11] 行业影响与市场观点 - 币安创始人赵长鹏评论认为,若所有人使用相同AI模型交易可能导致同质化操作,影响市场动态,但也可能通过购买力推动价格上涨 [7] - 预计因AI交易表现引起关注,未来将有更多人研究AI在交易中的应用,交易量会大幅增加 [7] - 比赛选择加密资产因市场全天候开放、数据丰富易于获取、Hyperliquid快速可靠且易集成,支持透明审计 [3]
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
机器之心· 2025-11-04 16:52
比赛概况 - 首届nof1 AI模型交易大赛于2025年10月17日至11月3日举行,旨在衡量AI投资能力,被誉为“币圈版的图灵测试”[1] - 参赛者为6款顶级大模型,分别来自DeepSeek、xAI、Google、OpenAI、阿里巴巴和Anthropic,代表中美两国闭源和开源供应商的最新技术水平[1] - 每款模型获得1万美元初始资金,在Hyperliquid上进行加密永续合约交易,交易范围限于BTC、ETH、SOL、BNB、DOGE和XRP六种流行加密货币,全程无人类干预[1][3] 交易规则与设置 - 模型操作空间限制为买入(做多)、卖出(做空)、持有或平仓,进行中低频交易(MLFT),决策间隔为几分钟到几个小时[3] - 选择加密货币市场的实际原因包括市场全天候开放、数据丰富易于获取、Hyperliquid快速可靠易集成以及市场的全球性[3] - 所有交易记录、持仓、决策日志和账户余额变化实时公开,观众可通过Nof1.ai平台查看动态图表,透明度极高[4] 比赛结果排名 - 阿里巴巴的Qwen3 Max排名第一,收益率为22.3%,胜率为30.2%,总盈亏为$2232,总交易次数为43次[5][7] - DeepSeek Chat V3.1排名第二,收益率为4.89%,胜率为24.4%,总盈亏为$489.08,总交易次数为41次[5][7] - 其余模型均大幅亏损,Claude Sonnet 4.5亏损30.81%、Grok 4亏损45.3%、Gemini 2.5 Pro亏损56.71%、GPT 5亏损62.66%[6][7] 模型交易策略分析 - Qwen3 Max整体偏“进攻型”,回报率高达22.32%,尽管费用较高($1654),但凭借30.2%的胜率和最大盈利$8176,展现“高风险高回报”策略,Sharpe值为0.273[13] - DeepSeek Chat V3.1表现稳健,回报率为4.89%,交易费用较低($690),最大盈利高达$7378,Sharpe值为0.359,为所有模型中最高,显示出色的风险控制能力[13] - Gemini 2.5 Pro交易次数达238次为所有模型最高,但胜率仅为25.6%,回报率为-56.71%,Sharpe值为-0.566,反映出过度交易且回报低效[14] - GPT-5表现最差,回报率为-62.66%,总亏损$6266,胜率为26.7%,Sharpe值为-0.525,缺乏有效的市场判断和风险管理[15] 行业影响与关注 - 赛事引发广泛关注,币安创始人赵长鹏公开评论,认为如果所有人都用相同的AI模型交易,可能导致大家在同一时刻买卖,影响市场动态[9] - 赵长鹏预测,由于AI交易表现引起关注,未来可能更多人研究AI在交易中的应用,预计交易量会大幅增加[11] - 总体来看,中国的Qwen3 Max与DeepSeek在风险控制与趋势识别上更为领先,而美国系模型则普遍亏损严重[16]
AI 交易大赛结果出炉:只有中国 AI 赚钱,跟 GPT-5 反着买,别墅靠大海
36氪· 2025-11-04 11:26
比赛概况与最终排名 - 一场为期两周、由AI模型在Hyperliquid平台自主交易加密货币永续合约的投资比赛收官,初始资金为每个模型1万美元[1][3] - 参赛阵容包括Claude 4.5 Sonnet、DeepSeek V3.1 Chat、Gemini 2.5 Pro、GPT-5、Grok 4、Qwen 3 Max等全球6大顶级AI模型,交易品种涵盖BTC、ETH、BNB、SOL、XRP、DOGE,允许做多做空并随意使用杠杆[4] - 胜负标准基于风险调整后的收益,所有AI的思考过程和交易记录完全公开透明,要求完全自主决策,人类不得干预[4] - 最终排名显示,中国AI模型包揽前两名:阿里Qwen 3 Max以账户余额12,232美元(收益率+22.32%)夺冠,DeepSeek V3.1 Chat以账户余额10,489美元(收益率+4.89%)获亚军,它们是仅有的两位盈利选手;而GPT-5亏损62.66%,账户余额仅剩3,734美元,在6个模型中排名垫底[1][5][6][7] 各模型绩效与风险指标 - **Qwen 3 Max**:总盈利2,232美元,交易43次,胜率30.2%,最大盈利8,176美元,最大亏损1,728美元,夏普比率0.273[5] - **DeepSeek V3.1 Chat**:总盈利489.08美元,交易41次,胜率24.4%,最大盈利7,378美元,最大亏损1,224美元,夏普比率0.359,为全场最高[5][6] - **Claude Sonnet 4.5**:亏损3,081美元(收益率-30.81%),交易36次,胜率25%,夏普比率-0.057[5][7] - **Grok 4**:亏损4,530美元(收益率-45.3%),交易47次,胜率27.7%,夏普比率-0.118[5][7] - **Gemini 2.5 Pro**:亏损5,671美元(收益率-56.71%),交易238次(为全场最多),胜率25.6%,夏普比率-0.566[5][7] - **GPT-5**:亏损6,266美元(收益率-62.66%),交易116次,胜率26.7%,夏普比率-0.525[5][7] 模型交易策略与风格分析 - **Qwen 3 Max** 策略极为简单专注,仅交易BTC一个品种,使用5倍杠杆,现金仅留48美元应急,设好止盈止损后等待信号[8] - **DeepSeek V3.1 Chat** 属于理性派,基于明确的“失效条件”管理仓位,对每个品种有独立逻辑,对ETH有0.85的高置信度看涨,DOGE空头贡献正收益,虽收益不如Qwen但风险控制最佳[8][10] - **GPT-5** 在账户亏损62%时仍坚持持有所有仓位,同时持有多空头寸(ETH/SOL/XRP/BTC/DOGE做空,BNB做多)[10] - **Gemini 2.5 Pro** 选择全仓做空六个币种,完全忽略短期反弹视其为“噪音”,仅当EMA交叉才平仓,纪律性极强,交易过程中展现出类似人类的心理活动[10] - **Claude Sonnet 4.5** 喜欢在多个品种中寻找机会,重点押注XRP(持仓中表现最佳),对BTC超卖保持乐观[11] - **Grok 4** 风格谨慎,即便亏损仍保留1,884美元现金,分散持有六个品种且设置紧密止损,主打保留现金弹药等待高确定性机会[12] 行业意义与未来展望 - 主办方nof1.ai认为,金融市场是训练下一代AI的最佳场所,因为市场是动态变化的,会学习、适应并针对策略反向操作,随着AI变聪明市场难度也会提升,这被视为“终极复杂挑战”[12] - 公司计划用市场作为训练场,让AI通过开放式学习和大规模强化学习不断进化,其创始人透露公司不仅在测试第三方模型,也在开发自有模型,准备在第二赛季让自家模型与其他模型竞争[14] - Alpha Arena 1.5赛季已进入倒计时,将带来多项改进:同时测试多个提示词、为每个模型部署多个实例、继续提升挑战难度[14] - 比赛启示在于同样市场环境下,简单专注的策略(Qwen)跑赢了复杂多元的配置,验证了“少即是多”的交易智慧;而稳健派(DeepSeek)虽收益非最高但风险控制出色,是成功的另一种诠释[14][15][16]
DeepSeek AI Returns 30% Crypto Profits in Just 3 Days Using Simple Prompts
Yahoo Finance· 2025-10-21 05:38
实验概述 - Alpha Arena平台设立新基准 旨在衡量AI模型在实时加密货币市场中的表现 [1] - 实验向6个领先AI模型各提供1万美元初始资金 接入真实加密货币永续合约市场 使用相同初始指令后让其自主交易 [1] - 实验目标为衡量大语言模型在实时加密货币市场中处理风险、时机和决策的能力 [4] 实验设计与方法 - 每个模型收到相同的系统指令 即一个简单但严格的交易框架 要求其作为自主交易代理在Hyperliquid上交易BTC、ETH、SOL、XRP、DOGE和BNB永续合约 [5] - 指令框架要求每笔头寸必须设置止盈目标和止损或失效条件 使用10倍至20倍杠杆 且不得移除止损 [5][9] - 每个时点 AI接收市场数据并决定开仓、平仓或持有 模型根据其一致性、执行力和纪律性进行评判 [6] - 实验设置包括使用真实资本 市场为Hyperliquid上的加密货币永续合约 目标为最大化风险调整后回报 第一季持续至2025年11月3日 所有交易和日志公开 初始设置后无人工输入 [9] 实验结果与表现 - 在短短三天内 DeepSeek Chat V3 1将其投资组合增长超过35% 表现超越比特币和领域内所有其他AI交易者 [1] - 具体结果:DeepSeek Chat V3 1总账户价值13502 62美元 回报率+35% 策略为多元化做多山寨币;Grok 4总账户价值13053 28美元 回报率+30%;Claude Sonnet 4 5总账户价值12737 05美元 回报率+28% [7] - 基准比特币买入持有策略总账户价值10393 47美元 回报率+4%;Qwen3 Max总账户价值9975 10美元 回报率-0 25%;GPT-5总账户价值7264 75美元 回报率-27%;Gemini 2 5 Pro总账户价值6650 36美元 回报率-33% [7] 成功因素分析 - DeepSeek获胜原因包括多元化和头寸管理 其持有全部六种主要加密资产 采用适中杠杆 在10月19日至20日期间的山寨币上涨行情中分散风险的同时最大化风险暴露 [8] - 其他模型表现归因:Grok 4为广泛做多暴露和强劲的时机把握;Claude Sonnet 4 5为选择性做多且保留大量现金缓冲;GPT-5因操作错误表现不佳;Gemini 2 5 Pro因在BNB上做空方向错误而表现落后 [7]
Best AI for Crypto Profits? DeepSeek Leaves Grok and ChatGPT Behind
Yahoo Finance· 2025-10-20 18:02
竞赛概览 - 金融人工智能研究实验室nof1在其即将公开的Alpha Arena平台上启动了一场“AI交易对决” [1] - 对决旨在让顶级人工智能模型相互竞争,以检验哪个模型能从加密货币交易中获取最高利润 [1] - 六款顶级AI大语言模型在Hyperliquid上进行杠杆头寸交易 [3] 参赛模型与初始条件 - 2025年10月18日,六款AI模型各获得10,000美元初始资金,在加密货币市场上进行“完全自主”交易 [2] 当前排名与业绩表现 - DeepSeek Chat V3.1自竞赛开始以来获得了最高回报,目前处于领先地位 [2] - 该模型在两天内将其投资组合价值提升至14,038美元,回报率达40.38% [3][5] - 其仅进行了18笔交易,其中12笔为买入,6笔为卖出 [6] - 目前持有比特币、以太坊、Solana、币安币、狗狗币和瑞波币的杠杆多头头寸,永续合约头寸价值约为73,000美元 [6] - Grok 4在首日获得500%收益后一度领先,但随后遭受损失,现居第二,其持仓与DeepSeek类似但杠杆倍数更高 [7] - Anthropic的Claude Sonnet 4.5以12,437美元的投资组合价值位列第三,其主要持有ETH和XRP的杠杆多头,并频繁开平BNB多头仓位 [7] 行业影响与展望 - 此类AI交易策略若普及,预计将为加密货币市场带来更高的交易量 [3][10] - 币安前负责人赵长鹏指出,当足够多人使用同一AI模型交易时,其买卖力量可能影响价格涨跌 [9] - nof1创始人表示,该系统将“很快开放”访问 [11]