全球首次AI炒币混战概述 - 一场使用真实资金的AI投资对决在Alpha Arena平台展开,六大AI模型各获得1万美元实盘资金,在加密市场自由买卖主流币种,无人类干预[3] - 实验旨在测试AI在真实金融市场中的表现,区别于静态能力排行榜,市场被视为由信息和情绪构成的生命体,要求模型具备分析数据和市场情绪的能力[3] - 实验已进行6天,经历了市场波动,排名和收益率出现显著变化[5] 各AI模型交易表现与策略分析 - DeepSeek Chat v3.1在前三天收益率一度接近40%,盈利超过4000美元,但随市场下跌回吐部分收益,收益率稳定在10%左右,保持前两名[5] - GPT-5表现最差,亏损高达68.9%,且持续下行,可能最先出局[5] - 马斯克的Grok-4采用高频激进策略,几乎满仓操作,曾实现超40%盈利,但随市场变化迅速跳水[6] - Claude表现为理性保守派,仓位轻、杠杆低、止损严格,但因过于谨慎错失行情,总收益为负17.46%[6] - Qwen3 Max凭借比Grok-4更激进的策略实现反超,使用20倍杠杆、几乎全仓操作,现金余额一度仅剩96.8美元,总收益13.41%,领先DeepSeek Chat v3.1二十个点以上[8] AI模型表现差异原因分析 - DeepSeek由幻方量化团队训练,在金融和数学方面有积累,但并非遥遥领先,大赛前的小规模测试中GPT和Grok盈利而DeepSeek亏损[8] - GPT-5和Gemini 2.5 Pro作为通用模型,被训练用于聊天、写代码等任务,学习了互联网上相互矛盾的分析和情绪化内容,其"散户式"高频交易可能源于学习了过多"噪音"[11] - 实验意义在于观察AI在真实市场中的博弈行为,包括买卖选择、持仓时长、止盈止损策略,而非单纯关注收益结果[13] AI在投资领域的应用现状与挑战 - 至少十分之一的散户投资者开始依赖ChatGPT或Gemini等聊天机器人筛选投资标的,但成功使用要求使用者具备一定金融知识[15] - 金融大模型发展可追溯至2023年,彭博社发布的BloombergGPT因成本高昂、系统封闭、提升感知有限而未能广泛推广[17] - 清华大学2025年发布的Kronos开源项目试图利用时间序列大模型预测金融市场走势,但使用者反馈其观点判断过于平均或臆造,难以令人信服[17] - 大模型往往从公开信息挖掘有效因子,对矛盾之处缺乏深入推理,导致策略趋同,难以跑赢资金体量更大、信息调研更强的量化机构[18] - 各大券商推出收费AI选股服务,如中国银河证券的财富星AI投顾和东方财富的"妙想"大模型,月费从几百到3888元不等[18][21] 有效使用AI进行投资的策略建议 - 选择模型不应以名气判断,而应根据自身目标考察完成度和准确性,需反复使用和调换模型[21] - 明确炒股目标和纪律至关重要,DeepSeek在比赛中完全按照预设交易计划执行,行情波动也不做盘中调整,注重风控结构和盈亏比[22] - AI输出质量高度取决于数据质量和提示词设计,当前更擅长技术面分析,基本面分析多重复新闻和研报,仍需用户自行分析行业前景和盈利能力[23] - 使用者需比AI更懂投资,注意AI数据的可靠性,具备被投资行业的常识,AI难以判断"黑天鹅"风险和认知"灰犀牛"事件[24] - AI被定义为"高级的看图看线",优化"猜人心"的游戏而非实践"估价值"的投资,面对充满不确定性的未来可能犯下灾难性错误[24] - AI可回溯过去数据找到完美相关关系,但无法真正理解品牌价值或企业文化力量,对全新商业模式和颠覆性技术可能应对失误[25]
中国AI模型超美国模型,靠AI炒股的时代来了吗?
首席商业评论·2025-10-25 11:52