AI Can Code, But It Can't Bet: Why Top Models Are Going Broke On Sports Markets - Amazon.com (NASDAQ:AMZN

文章核心观点 - AI前沿模型的实际能力与市场炒作存在显著差距一项新的长周期测试表明当前最先进的AI模型在模拟英超投注市场中全部亏损无法进行连贯的长期决策这挑战了AI将快速取代白领工作并引发颠覆性经济场景的市场主流叙事[1][3] AI模型能力测试结果 - 所有参与测试的AI模型在模拟英超赛季投注中均亏损无一盈利[2] - Anthropic的Claude模型表现最佳但仍亏损11%[2] - xAI的Grok 4.20模型表现最差亏损近90%的初始资金[2] - 所有模型在44点精细度评分表中的得分均未超过总分的三分之一[2][3] 模型能力局限性分析 - 模型在长周期内行为缺乏连贯性经常无法根据自身分析采取行动或适应环境变化[3] - 测试结果对“AI将迅速取代白领工作”的Citrini场景论点提出了质疑[4] - 如果前沿模型尚无法在足球博彩市场中获胜那么实现该场景所要求的自主金融决策的时间线可能比许多预期更长[4] 市场影响与预期 - 炒作与现实的差距已开始影响市场仅2026年第一季度就有近80,000名科技工作者被裁员其中近一半归因于AI[3] - 在预测平台Kalshi上交易员对Citrini场景发生的定价约为23% 该市场已吸引超过2500万美元的交易额[4] - 在Polymarket上关于AI泡沫在2026年12月31日前破裂的合约当前定价为20% 已交易250万美元[5] - 如果模型进展停滞当前20%的破裂概率可能显得定价过低[5] 对行业与公司的潜在影响 - 测试结果作为一个关于当前AI能力局限性的数据点降低了AI颠覆性发展的Citrini看涨情景的概率增加了渐进式发展情景的可能性[6] - xAI公司在追赶领先模型的过程中经历了严重的管理层更替和扩展挑战[2]