Workflow
Qwen3 Max
icon
搜索文档
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
36氪· 2025-11-04 19:13
大赛概况 - 首届Nof1 AI模型交易大赛于2025年10月17日启动,11月3日结束,旨在衡量AI投资能力,被誉为“币圈版的图灵测试” [1] - 参赛模型为6款代表中美两国闭源和开源供应商最新技术水平的大模型,包括DeepSeek Chat V3.1、Grok 4、Gemini 2.5 Pro、GPT-5、Qwen3 Max、Claude Sonnet 4.5 [1] - 每款模型获得1万美元初始资金,在Hyperliquid上进行加密永续合约交易,交易范围限于BTC、ETH、SOL、BNB、DOGE和XRP六种流行加密货币,全程无人类干预 [1][3] 比赛结果与模型表现 - 中国模型Qwen3 Max排名第一,收益率为22.3%,胜率为30.2%,总盈亏为$2232,总交易次数为43次 [3][5][9] - 中国模型DeepSeek Chat V3.1排名第二,收益率为4.89%,胜率为24.4%,总盈亏为$489.08,总交易次数为41次 [3][5][9] - 美国模型Claude Sonnet 4.5亏损30.81%,Grok 4亏损45.3%,Gemini 2.5 Pro亏损56.71%,GPT-5亏损62.66% [4][5] - 中国模型在风险控制与趋势识别上更为领先,而美国系模型普遍亏损严重 [12] 交易策略分析 - Qwen3 Max整体偏“进攻型”,Sharpe值为0.273,展现高风险高回报的进取型交易策略,最大盈利达$8,176 [5][9] - DeepSeek Chat V3.1策略理性稳健,Sharpe值为0.359为所有模型中最高,显示出色的风险控制能力,最大盈利$7,378 [5][9] - Gemini 2.5 Pro交易次数达238次为所有模型最高,极度活跃但胜率仅25.6%,Sharpe值-0.566,反映过度交易且回报低效 [5][10] - GPT-5交易存在较大波动且亏损严重,Sharpe值-0.525,最大盈利仅$270.77,缺乏有效的市场判断和风险管理 [5][11] 行业影响与市场观点 - 币安创始人赵长鹏评论认为,若所有人使用相同AI模型交易可能导致同质化操作,影响市场动态,但也可能通过购买力推动价格上涨 [7] - 预计因AI交易表现引起关注,未来将有更多人研究AI在交易中的应用,交易量会大幅增加 [7] - 比赛选择加密资产因市场全天候开放、数据丰富易于获取、Hyperliquid快速可靠且易集成,支持透明审计 [3]
大模型投资竞赛,中国AI包揽前二,GPT-5亏损超62%垫底
第一财经· 2025-11-04 18:18
2025.11. 04 本文字数:1379,阅读时长大约2分钟 作者 | 第一财经 刘晓洁 历时17天,AI大模型投资比赛"Alpha Arena"结果出炉,两个中国大模型夺得冠亚军,也是所有模型中唯二两个赚钱的,四大美国头部模型均亏损, GPT-5亏损超62%垫底。 | OVERALL STATS | ADVANCED ANALYTICS | | | | | | | | | | | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | | RANK MODEL | | ACCT VALUE J | RETURN % | TOTAL P&L | FEES | WIN RATE | BIGGEST WIN | BIGGEST LOSS | SHARPE | TRADES | | J | > QWEN3 MAX | $12,232 | +22.32% | $2,232 | $1,654 | 30.2% | $8,176 | -$1,728 | 0.273 | 43 | | 2 | DEEPSEEK CHAT V3.1 | $10,489 ...
谁家AI更会赚钱?大模型投资竞赛中国AI包揽前二
第一财经资讯· 2025-11-04 17:13
历时17天,AI大模型投资比赛"Alpha Arena"结果出炉,两个中国大模型夺得冠亚军,也是所有模型中 唯二两个赚钱的,四大美国头部模型均亏损,GPT-5亏损超62%垫底。 这是一场由初创公司Nof1发起的模型投资基准测试,但并非模拟交易,为了衡量AI投资能力,主办方 给每个模型账户发放了一万美元的启动资金,让它们在真实市场自主交易数字货币。Alpha Arena直播 整个过程,价格实时波动,并对实时收益进行排名,还可以看到每个模型的交易思路。 参与这次比赛的有六大模型,按最终盈利能力排名,阿里通义的Qwen3 Max在最后阶段反超,排名第 一,收益率22.32%,账户余额 12232 美元。DeepSeek chat v3.1紧随其后,收益率4.89%,余额 10489美 元 。 Claude Sonnet 4.5、Grok 4、Gemini 2.5 pro、GPT 5排在第三至第六位,亏损幅度均超过30%。尤其是 GPT-5亏得最多,账户余额只剩 3734 美元 。 对于这次竞赛,发起方Nof1在博客里提到,十年前 DeepMind 用游戏推动了前沿AI 的快速发展,现在 他们认为金融市场是下一个AI ...
首届AI交易大赛落幕,6个AI炒币2周:Qwen、DeepSeek赚钱,GPT-5血亏6000刀
机器之心· 2025-11-04 16:52
比赛概况 - 首届nof1 AI模型交易大赛于2025年10月17日至11月3日举行,旨在衡量AI投资能力,被誉为“币圈版的图灵测试”[1] - 参赛者为6款顶级大模型,分别来自DeepSeek、xAI、Google、OpenAI、阿里巴巴和Anthropic,代表中美两国闭源和开源供应商的最新技术水平[1] - 每款模型获得1万美元初始资金,在Hyperliquid上进行加密永续合约交易,交易范围限于BTC、ETH、SOL、BNB、DOGE和XRP六种流行加密货币,全程无人类干预[1][3] 交易规则与设置 - 模型操作空间限制为买入(做多)、卖出(做空)、持有或平仓,进行中低频交易(MLFT),决策间隔为几分钟到几个小时[3] - 选择加密货币市场的实际原因包括市场全天候开放、数据丰富易于获取、Hyperliquid快速可靠易集成以及市场的全球性[3] - 所有交易记录、持仓、决策日志和账户余额变化实时公开,观众可通过Nof1.ai平台查看动态图表,透明度极高[4] 比赛结果排名 - 阿里巴巴的Qwen3 Max排名第一,收益率为22.3%,胜率为30.2%,总盈亏为$2232,总交易次数为43次[5][7] - DeepSeek Chat V3.1排名第二,收益率为4.89%,胜率为24.4%,总盈亏为$489.08,总交易次数为41次[5][7] - 其余模型均大幅亏损,Claude Sonnet 4.5亏损30.81%、Grok 4亏损45.3%、Gemini 2.5 Pro亏损56.71%、GPT 5亏损62.66%[6][7] 模型交易策略分析 - Qwen3 Max整体偏“进攻型”,回报率高达22.32%,尽管费用较高($1654),但凭借30.2%的胜率和最大盈利$8176,展现“高风险高回报”策略,Sharpe值为0.273[13] - DeepSeek Chat V3.1表现稳健,回报率为4.89%,交易费用较低($690),最大盈利高达$7378,Sharpe值为0.359,为所有模型中最高,显示出色的风险控制能力[13] - Gemini 2.5 Pro交易次数达238次为所有模型最高,但胜率仅为25.6%,回报率为-56.71%,Sharpe值为-0.566,反映出过度交易且回报低效[14] - GPT-5表现最差,回报率为-62.66%,总亏损$6266,胜率为26.7%,Sharpe值为-0.525,缺乏有效的市场判断和风险管理[15] 行业影响与关注 - 赛事引发广泛关注,币安创始人赵长鹏公开评论,认为如果所有人都用相同的AI模型交易,可能导致大家在同一时刻买卖,影响市场动态[9] - 赵长鹏预测,由于AI交易表现引起关注,未来可能更多人研究AI在交易中的应用,预计交易量会大幅增加[11] - 总体来看,中国的Qwen3 Max与DeepSeek在风险控制与趋势识别上更为领先,而美国系模型则普遍亏损严重[16]
华尔街之狼,与AI共舞
36氪· 2025-10-28 16:05
比赛概况 - Alpha Arena实验室于2025年10月17日至11月3日举办实时加密货币AI交易竞赛,由Jay Azhang创办[1] - 比赛规则为所有AI模型获得相同初始资金和实时数据源,在无人类干预下自主决策交易,包括策略生成、仓位管理和风控设置[1] - 设置基准选手采用简单买入并持有BTC策略,用于对比验证AI模型的收益表现[2] - 为增加曝光度引入第三方预测市场Polymarket,观众可对获胜AI下注,形成元赌局[3] - 整个过程公开透明,nof1.ai官网实时展示所有模型的持仓、交易记录和决策日志[3] 参赛模型与交易设置 - 共涉及6个全球顶尖AI模型:GPT-5、Gemini 2.5 Pro、Grok-4、Claude Sonnet 4.5、DeepSeek V3.1、Qwen3 Max[5] - 每个模型分配10,000美元真实初始资本[5] - 交易标的为BTC、ETH、SOL、BNB、DOGE、XRP等主流加密货币永续合约[5] - 所有交易均在Hyperliquid平台执行,确保资金安全和交易透明度[5] - 比赛于2025年10月18日开始,持续进行[5] 中国模型表现 - 阿里巴巴Qwen3 Max展现险中求胜的机会主义风格,前期表现平平但通过重仓做多BTC/ETH并使用20倍杠杆实现逆袭[10] - Qwen3 Max在10月19-20日市场上涨时果断押注,账户资产实现两位数累计收益率,截至10月23日较初始上涨13%-47%[10] - Qwen3 Max交易频率较低,平均持仓时长超过7小时,体现"少即是多"策略[10] - DeepSeek V3.1保持稳健盈利,竞赛初期账户价值冲高到14,150美元,涨幅达40%[10] - DeepSeek策略被形容为"耐心的狙击手",总共只下6笔订单,平均单笔持仓超过21小时[10] - DeepSeek在六种加密资产上多元化布局,杠杆适中,严格遵守止盈止损纪律[10] - 当市场在10月21日前后回调时,DeepSeek及时收缩战线,截至23日仍保持8%-21%净收益[11] - DeepSeek的纪律性印证其背后研发团队的量化对冲基金背景[12] 西方模型表现 - OpenAI的GPT-5频繁追涨杀跌、情绪化操作,止损设定不当,短短数日亏损达30%-40%[14] - GPT-5到一周时账户缩水高达65%-75%,成为"亏损之最"[14] - Google的Gemini 2.5 Pro存在过度交易和滥用杠杆问题,平均每日进行15次进出场[14] - Gemini在前三天进行44次交易,累积支付近440美元手续费,蚕食近三分之一本金[14] - Gemini错过10月19日大涨行情后高位翻多,使用40倍杠杆遭遇行情反转,首周亏损超过55%[14] - xAI的Grok-4凭借对社交媒体情绪敏锐捕捉,初期通过54小时持仓获取35%收益,但后续回吐大部分利润,净收益转为约-15%[15] - Anthropic的Claude Sonnet 4.5全程谨慎保守,只下3单,前期曾有24%涨幅但最终收益转负约-17%[19] - Claude虽盈利不多,但一度创造所有模型中最优夏普比率,体现"稳健不过山,有时胜过猛盈利"[19] 市场环境与实验意义 - 加密货币市场是典型零和博弈,信息极度不对称,价格每分每秒波动,没有唯一答案[7] - 传统AI评估在静态环境中测试,而加密市场要求AI在动态环境中应对风险[6][7] - 基准的"买入并持有BTC"策略在此期间盈亏基本持平,未大幅跑输或跑赢AI模型[20] - 实验展示AI在无标准答案世界中试错的能力,为金融领域智能应用提供新视角[20]
实测用 AI 炒币,谁赚得最多?
搜狐财经· 2025-10-27 13:39
实验概述 - 初创公司Nof1发起名为Alpha Arena的实验,让多个AI模型在真实数字货币市场进行实盘交易[1] - 每个AI模型获得一万美元启动资金,交易收益、持仓及交易逻辑均实时公开[4] - 实验采用真实交易而非模拟盘,是AI界的"Battle Royale"[4] 参赛阵容与初期表现 - 参赛AI包括OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、Anthropic的Claude 4.5 Sonnet、马斯克的Grok 4、阿里的Qwen3 Max和DeepSeek V3.1 Chat[6] - DeepSeek开盘即满仓做多BTC、ETH、DOGE,几小时内盈利近一千美元,收益率达10%[6] - GPT-5表现谨慎,仓位分散且杠杆极低,在行情上涨时仍犹豫不决[8] - Gemini频繁换仓、追涨杀跌,每分钟都在操作,手续费高且亏损近一半[8] 交易风格与人格特征 - DeepSeek交易冷静,日志显示"条件未触发,继续持仓"[9] - Claude分析严谨,日志如论文般提及"根据链上指标与宏观趋势,BTC短线或反弹,但风险依旧"[11] - Grok风格激进,日志显示"趋势没完,拉满仓干"[11] - Gemini即使爆仓仍坚持原计划,日志称"止损条件未满足,计划不变"[11] 中期战况变化 - 截至21日中午,Gemini净值排名垫底,但21日下午表现回暖成功超越GPT-5[15] - 榜尾顺序变为Gemini倒数第二,GPT-5正式垫底[15] - 22日下午开始,Qwen3 Max与DeepSeek展开激烈拉锯战,两者互有领先[15] 最终排名与市场反应 - 截至26日中午12点,Qwen3 Max以微弱优势超越DeepSeek登顶第一[17] - Grok和Claude位列中游,Gemini回升但仍倒数第二,GPT-5垫底[19] - 网友热议DeepSeek被反杀,认为幻方AI也有失利之时[20] - 有分析指出样本太少偶然性大,建议重复100次取平均成绩[21] 实验意义与行业影响 - 实验是AI首次用真金白银面对真实、混沌、不可控的市场环境[22] - 不同于传统语言分数比拼,此次考核的是AI在不确定性中生存的能力[22] - 实验被视为人机决策的对照实验,每个AI都像人类情绪的镜像[22] - 类比DeepMind下围棋开启AI强化学习新纪元,此次实验可能让AI进入最复杂的博弈场——市场[24] - 实验将于11月3日迎来最终收官[24]
中国AI模型超美国模型,靠AI炒股的时代来了吗?
36氪· 2025-10-26 17:20
实验概述 - 全球首次AI炒币实盘对决在Alpha Arena平台进行,六大中美顶级AI模型各获1万美元实盘资金,自由买卖BTC、ETH、SOL等主流加密货币[1] - 实验旨在测试AI模型在最真实、不可预测的金融市场中的表现,而非静态知识评估,模型需分析数据和市场情绪,如同真实交易员[2] - 实验提供了观察AI在真实市场中博弈的窗口,重点在于分析其买卖标的、持仓时长及止盈止损策略,而非仅关注收益结果[11] 参赛模型表现 - 开赛6天后,Qwen3 Max以20倍杠杆、近乎全仓的激进策略实现总收益13.41%,现金余额一度仅剩96.8美元,领先其他模型一天多[7] - DeepSeek Chat v3.1收益率曾接近40%,盈利超4000美元,后随大盘下跌回吐部分收益,收益率稳定在10%左右,位列前两名[3] - GPT-5亏损高达68.9%,表现持续下行;Grok-4因高频激进、涨跌均不割肉的策略,在实现超40%盈利后迅速跳水;Claude因理性保守、仓位轻、止损严,总收益为负17.46%[4] 模型能力背景分析 - DeepSeek由幻方量化团队训练,在金融和数学方面有积累,但此次大赛前的小规模测试中,GPT和Grok实现盈利,DeepSeek反而出现亏损[7] - 实验作为基准测试仍缺乏大样本、长时间、跨市场的数据积累,以及透明可复现的设置,存在较大随机性和不可靠性[9] AI在投资领域的应用现状 - 据路透社消息,至少十分之一的散户投资者已开始依赖ChatGPT或Gemini等聊天机器人筛选投资标的[12] - 券商eToro指出,使用AI选股要求使用者具备一定金融知识,否则试错成本高昂,且目前并无市场公允推荐的能高成功率预测市场的模型[12] - 多家券商已推出收费AI选股服务,如中国银河证券的“财富星AI投顾”包含AI选股、数据等功能;东方财富“妙想”模型分体验版、进阶版和专业版,季度费用从518元至818元不等[16][18] 金融大模型发展历程 - 2023年彭博社发布500亿参数的BloombergGPT,但其成本高昂、系统封闭,普通开发者无法触及,模型为黑箱运作,金融预测性提升感知不强[14] - 2025年8月清华大学发布开源项目Kronos,旨在利用时间序列大模型预测K线走势,但使用者反馈其观点判断过于平均市场化或臆造,预测结果难以信服[14] AI投资的局限性 - 大模型往往从市面挖掘有效因子,对矛盾之处缺乏深入推理,导致策略趋同,难以跑赢资金体量更大、信息调研更强的量化机构[15] - AI更擅长技术面分析,如趋势、成交量等;基本面分析多重复新闻和研报,仍需用户自行分析行业前景和盈利能力[21] - AI难以判断“黑天鹅”风险,对“灰犀牛”事件认知滞后,面对全新商业模式或颠覆性技术等“未知的未知”时可能犯灾难性错误[23][24] - 知名投资人段永平将AI投资定义为“高级的看图看线”,认为其是在优化“猜人心”的游戏,而非实践“估价值”的投资[23] 有效使用AI投资的要点 - 用户需比AI更懂投资,明确自身炒股目标和纪律,并注意AI数据的可靠性,具备被投资行业的常识[20][22][23] - AI输出质量高度取决于数据质量和提示词设计,用户需反复与AI解释强调以达成定义共识,例如对价值投资和“护城河”的理解[20][21] - 利用AI进行上市公司财报总结和行情基本分析是高效趋势,可将繁琐的文本图表任务交给AI,但选择模型不应以名气判断,而应根据自身目标考察完成度准确性,并保持频繁使用和调换[18][22]
高盛大幅上调阿里资本开支预期至4600亿元:推理需求爆炸性增长,AI效率提高驱动更强收入
硬AI· 2025-10-24 20:40
文章核心观点 - AI推理需求呈指数级增长,推动云服务厂商资本开支持续扩张,技术效率提升反而可能加速资本开支向收入的转化 [2][3][6] - 中国互联网巨头在AI领域的战略路径分化,阿里巴巴聚焦企业级AI云市场,字节跳动发力消费级应用 [2][3][8] - 当前中国主要科技股估值相较于全球同行仍有折价空间,市场尚未进入AI泡沫 [4][10] AI推理需求与资本开支 - 高盛预计阿里巴巴2026至2028财年合计资本开支将达4600亿元人民币,远高于其此前3800亿元的目标 [2][3] - AI推理需求激增是支撑资本开支判断的核心逻辑,阿里巴巴AI推理需求每2-3个月翻一番 [2][6] - 字节跳动日均token消耗量在9月份突破30万亿,相比4-5月实现翻番,已接近谷歌的43万亿水平 [6] - 高盛预测中国云服务提供商在2025年第三季度资本开支将同比增长50% [6] - 技术效率提升(如阿里云Aegaeon系统节省82% GPU资源,DeepSeek模型减少90% token消耗)并不意味着资本开支缩减,反而有助于投资更有效转化为收入 [6] 巨头AI战略路径分化 - 阿里巴巴凭借全栈AI能力押注企业级AI云市场,在外部AI云收入规模和企业级服务方面处于领先地位 [2][3][8] - 字节跳动凭借聊天机器人"豆包"在消费级市场和日均token消耗量上占据最大份额,侧重于探索面向消费者的AI应用 [2][3][8] - 阿里巴巴正式推出夸克AI聊天机器人助手服务,利用闭源通义千问模型与字节跳动"豆包"和腾讯"元宝"竞争 [8] - 字节跳动加速"豆包"商业化,在聊天中无缝接入抖音电商服务,并加入AI键盘等新功能 [8] 多模态进展与商业化 - 中国多模态大模型凭借开源、低价和高速度策略形成差异化优势,例如腾讯"混元图像3.0"在文生图模型排行榜名列前茅 [10] - 阿里巴巴Qwen3 Max模型输出价格比GPT-5/Gemini 2.5 Pro便宜40% [10] - 中国开源AI模型获全球市场认可,例如爱彼迎大量使用阿里巴巴Qwen模型支持其客服代理 [10] - 中国To-C聊天机器人商业化路径仍在演进,最终可能更多地由广告收入驱动 [10] 行业估值水平 - 腾讯和阿里巴巴2026年预期市盈率分别为21倍和23倍,相较于谷歌的24倍以及亚马逊和微软的28-30倍,仍处于"不苛刻"水平 [4][10] - 高盛认为市场尚未进入AI泡沫,腾讯和阿里巴巴估值相较于其盈利增长前景及全球同行仍有折价空间 [4][10]
现在,最会赚钱的AI是Qwen3,全球六大模型厮杀,Top 2来自中国
36氪· 2025-10-23 20:49
比赛结果与排名 - Qwen3 Max以14,438美元账户价值位列第一,收益为4,438美元,回报率+44.38% [1][9][11] - DeepSeek V3.1以12,092美元账户价值排名第二,收益为2,092美元,回报率+20.92% [9][11] - Claude 4.5 Sonnet账户价值8,780美元,亏损1,220美元,回报率-12.2% [10][11] - Grok 4账户价值8,301美元,亏损1,699美元,回报率-16.99% [10][11] - Gemini 2.5 Pro账户价值3,946美元,亏损6,054美元,回报率-60.54% [10][11] - GPT-5账户价值2,852美元,亏损7,148美元,回报率-71.48% [10][11] 比赛进程与表现 - 10月21日所有模型经历暴涨,22日凌晨集体大跌 [3] - Qwen3 Max在22日下午先后超越Grok 4和DeepSeek V3.1,首次升至第一 [7] - 23日上午Qwen3 Max再次反超DeepSeek V3.1,优势持续扩大 [3][8] - Qwen3 Max采用稳健的"快准狠"操盘策略实现逆袭 [8] - Gemini 2.5 Pro和GPT-5从比赛第二天开始持续亏损,表现稳定 [24] 交易行为分析 - Gemini 2.5 Pro交易次数达102次,GPT-5为42次,属于高频交易 [26] - Qwen3 Max交易22次,Claude 4.5 Sonnet交易12次,Grok 4交易10次,DeepSeek V3.1仅交易9次 [26] - Gemini 2.5 Pro在交易中表现出情绪化特征,类似人类交易行为 [15] 比赛规则与设置 - Alpha Arena由Nof1实验室组织,为六大模型各提供1万美元初始资金 [18] - 所有模型在Hyperliquid交易所使用相同提示词和输入数据进行交易 [20] - 模型需根据实时价格、MACD、RSI等技术指标自主做出交易决策 [20] - 比赛目标为"最大化风险调整后的收益",要求模型独立生成Alpha、决定仓位、把握时机和管理风险 [20] 行业意义与影响 - 金融市场被视为AI能力的终极试金石,是比游戏更复杂的训练环境 [29][30] - 市场环境会随AI能力提升而同步增加难度,考验模型在不确定性中的生存能力 [30] - Qwen3 Max的胜利体现了国产大模型在高风险动态金融环境中的领先实力 [32][33] - 这次比赛结果被视为AI在真实世界中生存能力的重要里程碑 [32]
1万美金操盘4天,DeepSeek大赚40%
搜狐财经· 2025-10-23 13:48
比赛概况 - 初创公司Nof1组织了一场名为Alpha Arena的AI炒股大赛,使用真实资金进行交易,每个AI工具获得1万美元本金,比赛为期两周,从美东时间10月18日开始[2][4] - 比赛汇集了国内外顶级AI模型,海外组包括OpenAI的GPT-5、谷歌的Gemini 2.5 Pro、马斯克的Grok 4以及Anthropic的Claude Sonnet 4.5,国内组包括阿里通义Qwen3 Max和幻方量化背景的DeepSeek chat v3.1[4] 当前赛况与排名 - 截至北京时间10月21日晚上22:00,DeepSeek以13%的收益率领先,其最高收益率曾达到惊人的40%[6] - Grok 4以11.7%的收益率排名第二,其最高收益率达到38.15%[8] - Claude Sonnet 4.5以11.45%的收益率位列第三,最高收益率达到28.08%[8] - 阿里通义Qwen3 Max目前处于小幅盈利状态,账户资金为10,326美元,盈利326美元[10] - OpenAI的GPT-5和谷歌的Gemini 2.5 Pro表现不佳,GPT-5亏损高达45.81%,账户剩余5,414美元,Gemini 2.5 Pro亏损50.06%,账户剩余4,994美元[6][10][11] 投资策略分析 - DeepSeek采用激进的全仓做多策略,开盘后迅速以15倍杠杆做多以太坊等多个主流加密货币,并坚定持有,该策略在上涨行情中一度盈利接近40%[12][13] - GPT-5因采取错误的看空策略导致重大亏损,其交易记录显示在以太坊上的空头交易均以亏损告终[14][15] - Gemini 2.5 Pro交易频繁且策略摇摆不定,短短几天交易70次,频繁的“追涨杀跌”操作和高昂手续费导致账户净值大幅缩水[15][16] - Grok 4与DeepSeek类似采用全仓做多策略,但波动较大[16] - Claude Sonnet 4.5表现最为稳健,仓位控制谨慎,交易风格沉稳,倾向于在看准机会后才出手[17] 行业意义与影响 - 此次比赛将AI模型置于真实且不可预测的金融市场中进行测试,超越了传统的静态能力评估榜单[17][18] - 在金融市场中,AI模型需要像真正的交易员一样,不仅分析数据,还要解读市场情绪,面对没有标准答案的不断变化的概率[19] - DeepSeek的出色表现部分归因于其背后幻方量化的支持,幻方量化作为管理规模超千亿人民币的量化巨头,拥有海量的交易数据和策略积累,这与其他互联网背景的AI模型形成对比[12]