Grok 4.20
搜索文档
Elon Musk's Grok 4.20 Beats OpenAI, Google Models In Live Stock Trading Contest — xAI CEO Jokes About Paying For GPUs
Yahoo Finance· 2026-01-18 20:38
文章核心观点 - 由埃隆·马斯克领导的xAI公司开发的Grok 4.20人工智能模型,在Alpha Arena Season 1.5实盘股票交易竞赛中击败了包括OpenAI和谷歌在内的主要竞争对手,取得了约10%–12%的总回报率,展示了其在真实金融市场中创造收益的潜力,并可能为AI的商业化变现提供一条路径 [1][2][4][6] 竞赛表现与结果 - Grok 4.20在Alpha Arena Season 1.5实盘股票交易竞赛中,从1万美元的起始资金获得了约11,060美元的权益,实现了约10%–12%的总回报率 [2] - 该模型是竞赛中唯一实现盈利的模型,表现优于OpenAI、谷歌等其他主要AI开发商的参赛模型 [4] - 竞赛排行榜截图显示,Grok的变体模型占据了前六名中的四个席位 [3] 模型能力与策略 - Grok 4.20的表现并非依赖于单一交易策略,其通过同一模型的多种配置(包括情境感知、新基线、最大杠杆和僧侣模式)取得了成功 [4] - 该模型的表现不仅限于基准测试,而是在实盘市场中赚取了真实收益 [5] 商业意义与行业影响 - 埃隆·马斯克通过评论“好吧,我想我看到了一条支付所有这些GPU费用的途径”,强调了高级AI系统直接创造收入的潜力,这回应了行业对AI巨额基础设施投资回报问题的关注 [6] - 此次竞赛结果被视为AI在现实世界货币化的早期胜利,表明AI模型具备在金融交易等复杂领域直接产生经济效益的能力 [1][6]
Elon Musk's Grok 4.20 Beats OpenAI, Google Models In Live Stock Trading Contest — xAI CEO Jokes About Paying For GPUs - Alphabet (NASDAQ:GOOGL)
Benzinga· 2026-01-16 17:01
文章核心观点 - 由埃隆·马斯克领导的xAI公司开发的Grok 4.20人工智能模型在实盘股票交易竞赛中击败了OpenAI和谷歌等竞争对手,展示了其在现实世界金融市场的盈利潜力,并引发了市场对高级AI直接创收能力的关注 [1][5] 竞赛表现与结果 - Grok 4.20在Alpha Arena Season 1.5实盘股票交易竞赛中位列榜首,初始资本为1万美元,最终权益约为11060美元,实现了10%–12%的总回报率 [2] - 在竞赛中,Grok 4.20是唯一一个最终实现盈利的AI模型,表现超越了OpenAI、谷歌等其他主要AI开发商的参赛模型 [4] - 发布的排行榜截图显示,Grok的变体模型占据了前六名中的四个席位 [3] 模型能力与策略 - 该模型的优异表现是通过同一模型的多种配置实现的,包括情境感知、新基线、最大杠杆和僧侣模式,这表明其盈利能力不局限于单一的交易策略 [4] - 相关帖子强调,Grok 4.20不仅在基准测试中表现良好,更是在实盘市场中赚取了真金白银 [5] 商业潜力与行业影响 - 埃隆·马斯克转发了竞赛结果并评论称“我想我看到了为所有这些GPU付费的方法”,这暗示了该技术具备显著的商业化潜力,可能帮助抵消在昂贵计算基础设施上的巨额投资 [5] - 这一结果凸显了行业对高级人工智能系统能否直接产生收入的兴趣日益增长,尤其是在各公司投入数十亿美元用于计算基础设施的背景下 [5]
陶哲轩惊叹,数学奇点初现,AI首次给出人类无法企及的原创证明
36氪· 2026-01-16 08:13
AI在数学研究领域的突破性进展 - 谷歌DeepMind团队利用Gemini模型证明了一个代数几何领域全新的定理,论文核心成果的证明过程在Gemini模型及其相关工具(DeepThink系统、FullProof系统)的推动下得以实现 [3][8] - 斯坦福大学教授、美国数学会会长Ravi Vakil亲自认证Gemini提供了关键且独创的洞见,其论证严谨、正确且优雅,并非对既有证明的简单改写 [12] - Ravi Vakil教授认为此次进展是“人类智慧与Gemini贡献之间的真实协同”,并曾预计AI对数学的影响将是“相变”,而非缓慢爬坡 [14][16] AI在解决具体数学问题上的能力展示 - 马斯克的Grok 4.20模型在5分钟内解决了困扰教授的Bellman函数难题,给出了一个漂亮的显式公式:U(p,q) = E √(q²+τ) [23] - Grok 4.20的解决方案将下界精度从约 p√log(1/p) 级别提升至 p log(1/p) 级别,实现了对数因子上的“平方根级别飞跃”,并且该下界被证实是“紧确的” [24][25][30] - 在调和分析领域,Grok 4.20将二进平方函数L¹范数的下界纪录从 |A|(1-|A|)√log(...) 级别,提升至 |A|(1-|A|) log(...) 级别 [29] AI在攻克埃尔德什问题集上的表现 - 自GPT 5.2发布以来,从圣诞节至今已有15道埃尔德什题目从“未解”变为“已解”,其中11道明确标注AI模型在解题中发挥了关键作用 [38] - 数学家陶哲轩统计,目前AI模型在8道埃尔德什难题上实现了“自主推进式”的实质性进展,还有6道是通过查找和延续已有研究取得突破 [38] - 陶哲轩提出“AI扩展”猜想,认为AI非常适合系统性地清理那些相对容易的“长尾”埃尔德什难题,并猜测现有AI工具能直接攻克约1%到2%的未解埃尔德什难题 [38][41] 行业影响与未来展望 - 谷歌Gemini与马斯克Grok等AI工具已在数学领域遍地开花,正式叩响思想创造之门,AI与人类天才之间的差距正在缩小 [4][10] - 数学界的研究范式正在被AI重塑,无论是Aristotle等专用AI助手,还是GPT-5.2等通用大模型,都在改变对“数学探索者”的传统想象 [41] - 有观点预测2026年将是“ASI(超级人工智能)元年”,未来可能形成“人类负责定义问题,AI负责填补证明空白”的共生模式 [4]
西北首台量子计算机落地西安;神秘模型Grok 4.20,AI炒股夺冠丨AIGC日报
创业邦· 2025-12-08 08:08
SpaceX估值与业务进展 - 马斯克否认SpaceX正以8000亿美元估值进行融资的传闻[2] - SpaceX多年来保持正现金流,并通过每年两次股票回购为员工和投资者提供流动性[2] - 公司未来估值提升取决于星舰(Starship)、星链(Starlink)的进展以及获得全球直连手机网络的频谱[2] 量子计算产业落地 - 我国西北地区首台量子计算机在西安正式落地[2] - 基于该设备建设的先导医图量子AI融合计算中心将为西部地区科研与产业升级提供算力支撑[2] - 人工智能与量子计算融合的两大方向:使用AI加速量子计算求解问题,以及用量子计算机辅助AI模拟训练和推理,均需量子计算机真机算力[2] AI模型在金融领域的应用 - 在nof1.ai举办的Alpha Arena 1.5赛季中,xAI的Grok 4.20模型在为期两周的比赛中,将1万美元本金变为12193美元,综合回报率达12.11%[2] - 该模型在比赛中表现优于Gemini 3和GPT-5.1等其他AI模型[2]
谷歌(GOOGL.US)涨近6% Gemini 3 Pro登顶“大模型竞技场”LMArena排行榜
智通财经· 2025-11-19 23:09
公司股价与市场反应 - 谷歌股价周三上涨近6% 收于300.91美元 [1] 核心产品与技术突破 - 谷歌最新大模型Gemini 3 Pro登顶LMArena排行榜 其综合能力评估Elo分数达到1501创下新纪录 [1] - Gemini 3 Pro在AIME 2025美国数学邀请赛代码执行模式下实现100%准确率 [1] - Gemini 3 Pro在MathArena Apex数学竞赛得分23.4% 远超同类模型普遍低于2%的水平 [1] - 模型多模态处理能力突出 屏幕截图理解得分72.7% 较竞品翻倍 [1] - 模型在18世纪手写文稿识别上错误率仅0.56% 破译水平接近专家 [1] 财务表现与AI商业化 - 谷歌云业务第三季度营收达152亿美元 同比增长33.5% [1] - 谷歌云业务营业利润率提升至23.7% [1] - AI相关收入已达到每季度数十亿美元规模 [1] - 基于生成式AI模型构建的产品收入同比增长超过200% [1] 行业竞争格局 - 随着Gemini 3发布 谷歌与OpenAI之间的竞争愈演愈烈 [2] - OpenAI联合创始人兼CEO山姆·奥特曼评价“Gemini 3看起来很不错” [2] - xAI创始人兼CEO埃隆·马斯克在祝贺同时表示“看来我们要抓紧发布Grok 4.20了” [2]
美股异动 | 谷歌(GOOGL.US)涨近6% Gemini 3 Pro登顶“大模型竞技场”LMArena排行榜
智通财经网· 2025-11-19 23:08
公司股价与市场反应 - 谷歌股价周三上涨近6% 收于300.91美元 [1] 核心产品与技术突破 - 谷歌最新大模型Gemini 3 Pro登顶LMArena排行榜 其综合能力评估Elo分数达到1501分创下新纪录 [1] - Gemini 3 Pro在AIME 2025美国数学邀请赛代码执行模式下实现100%准确率 在MathArena Apex数学竞赛得分23.4% 远超同类模型普遍低于2%的水平 [1] - 模型多模态处理能力突出 屏幕截图理解得分72.7% 较竞品翻倍 18世纪手写文稿识别错误率仅0.56% 破译水平接近专家 [1] 财务表现与AI商业化 - 谷歌云业务第三季度营收达152亿美元 同比增长33.5% 营业利润率提升至23.7% [1] - AI相关收入已达到每季度数十亿美元规模 [1] - 基于生成式AI模型构建的产品收入同比增长超过200% [1] 行业竞争动态 - 随着Gemini 3的发布 谷歌与OpenAI之间的竞争愈演愈烈 [2] - OpenAI联合创始人兼CEO山姆·奥特曼评价Gemini 3看起来很不错 [2] - xAI创始人埃隆·马斯克在祝贺的同时表示要抓紧发布Grok 4.20 [2]