Workflow
图灵测试
icon
搜索文档
马斯克将用最强Grok 5,挑战LOL最强战队T1
36氪· 2025-11-26 20:15
项目核心目标 - 马斯克旗下Grok 5项目计划在2026年挑战由Faker领衔的传奇人类《英雄联盟》战队T1 [2] - 该项目旨在通过游戏对决进行一场关于“感知”与“直觉”的终极图灵测试,其根本目标是推动具身智能发展,为特斯拉Optimus机器人等现实应用奠定基础 [3][33][34] 技术核心限制 - 采用纯视觉感知:Grok 5只能通过捕捉屏幕像素来理解游戏,每秒需解析240帧的混乱画面,从“读取代码”转变为“理解像素” [7][8][9] - 施加人类级反应延迟:将AI反应速度限制在约200毫秒的人类极限内,迫使AI依靠预判和博弈而非非人手速取胜 [11][14][15] 技术架构与能力 - Grok 5是一款多模态大型语言模型,据称将拥有6万亿参数 [17] - 其学习方式从传统强化学习的“试错”转变为“理解”:通过阅读游戏资料和观看数百万小时比赛视频来构建世界模型,并展示逻辑推理能力 [18][19] - 模型可能模拟人类大脑的“快慢系统”:慢系统负责宏观战略,快系统负责即时战术 [20][21][22] 选择《英雄联盟》作为测试平台的原因 - 游戏包含战争迷雾,是不完全信息博弈,要求AI像人类一样依靠直觉和心理博弈来填补信息空白 [25][27] - 游戏考验团队协作能力,五个AI智能体需在极短时间内达成共识并预测队友意图,这是对AI协同能力的重大测试 [28] 项目潜在意义与影响 - 游戏中的混乱团战是现实世界的完美隐喻,成功将意味着AI能仅凭视觉在动态复杂环境中做出决策 [33] - 该视觉-动作模型将直接应用于特斯拉Optimus人形机器人,是赋予机器人在非结构化现实世界中生存能力的关键一步 [33][34]
AI如何进行几何推理?北邮专家带学生探索人工智能的本质
新京报· 2025-10-21 20:11
人工智能的战略地位与发展现状 - 世界主要国家将人工智能作为目前最大的发展战略,力图在新一轮国际竞争中掌握主导权 [1] - 人工智能被视为一次新的工业革命,其特点是带来更低廉的生产成本,而非传统工业革命的产能转移 [2] - 当前世界人工智能研究中心呈现两极化格局,主要集中在美国和中国 [2] 人工智能的技术原理与能力 - 人工智能大模型具备强大的内容生成能力,例如创作出遣词精美、语义流畅的诗歌,足以混淆人类判断 [1] - 人工智能通过拼凑、统计模型等方法进行内容创作 [1] - 人工智能能够进行数学解题和几何证明,其原理是基于吴文俊将几何推理和数学证明引入人工智能的基础 [2] - 计算机进行几何证明的方式是模仿人类,从基本假设出发,通过快速推导得出最终结论,尽管可能缺乏技巧但速度极快 [2] 人工智能发展的理论基础与关键人物 - 艾伦·图灵提出的“图灵测试”为评判机器是否具有智能行为提供了首个可操作的标准 [2] - 诺姆·乔姆斯基的转换-生成语法理论为计算机理解自然语言结构提供了重要理论基础,对早期人工智能研究影响深远 [2] - 中国科学家吴文俊的贡献在于将几何推理和数学证明引入人工智能领域,为当前大模型的数学能力奠定基础 [2] 中国人工智能的发展目标 - 中国在《新一代人工智能发展规划》中提出,目标是到2030年成为世界主要的人工智能创新中心 [2]
OpenAI奥特曼认错:我天生不适合管理公司
量子位· 2025-10-09 15:03
公司核心战略 - OpenAI确立三大核心目标:成为个人AI订阅服务、构建大规模基础设施、最终实现对人类真正有用的AGI [4] - 公司战略已转变为垂直整合模式,认为为实现AGI使命必须比原先想象中做更多事情,并引用iPhone作为成功垂直整合案例 [8][9] - 在资源分配上,当存在资源限制时,GPU将优先分配给研究而非产品支持,基于构建AGI的终极目标研究享有最高优先权 [33][34] 技术发展路径与AGI展望 - Sora项目表面与AGI不直接相关,但公司认为构建真正出色的世界模型对AGI的重要性将超出人们想象 [11] - 推出Sora的理由包括:制作优秀产品获得用户喜爱、让社会提前适应视频模型、视频比文本有更多情感共鸣、帮助推进AGI研究以及增加乐趣和喜悦 [16] - 未来人机交互界面将包括实时渲染视频的世界模型和新型环境感知硬件设备 [19] - 个人认为图灵测试的等价物是AI能够进行科学研究,并预测两年内模型将承担更多科学工作并做出重要发现 [21][22] 基础设施与行业合作 - 公司决定进行非常激进的基础设施押注,因对研究路线图和经济价值从未如此自信,需要整个行业佼佼者的支持 [29] - 公司将与众多伙伴合作,涉及从电子级别到模型分发的所有环节,未来几个月预计有更多动作 [30] - 若对模型能力发展的预测正确,规模扩展的上限离当前位置还非常遥远,但若只有今天模型则不会如此激进 [31][32] 行业宏观观点 - 能源是AI最大的瓶颈之一,历史上更便宜充足的能源是提高人类生活质量最有影响力的事情 [44] - 批评西方长期排斥核能是令人难以置信的愚蠢决定,其推广速度取决于是否具有完全压倒性的经济优势 [44] - 认为AGI的到来是连续性的过程,而非奇点大爆炸 [44] - 深度学习是一个持续给予奇迹的技术,公司能够用当前技术制造出能够找出下一个突破的东西 [24][27]
奥特曼和量子计算奠基人讨论GPT-8
36氪· 2025-09-28 12:41
对话核心观点 - 奥特曼与戴维・多伊奇就AI能否发展为具备意识的超级智能展开讨论,奥特曼以假设的GPT-8为例,认为其若能解决量子引力问题并解释其思考过程,则应被视为具备高级智能 [1][14] - 戴维・多伊奇最初认为AI无法发展为超级智能,但被ChatGPT的对话能力所改变观点,并指出判断智能的关键在于能否提供“过程故事”,并最终认同奥特曼的GPT-8假设场景 [7][14] - 双方讨论凸显AGI定义标准模糊且目标不断变化,缺乏明确的衡量基准 [3][9][10] 奥特曼的观点 - 奥特曼高度评价戴维・多伊奇的著作《无穷的开始》,认为其乐观阐述了在AI世界中人类依然有无限价值与探索空间 [5] - 奥特曼认为AI有可能发展成具备意识的超级智能,并以GPT-8假设案例进行论证:若GPT-8能解决量子引力问题并讲述其思考过程,则应被认可 [1][14] 戴维・多伊奇的观点 - 戴维・多伊奇曾认为AI无法发展为超级智能,但ChatGPT的出现改变其观点,承认其在广泛主题下进行开放式对话的能力 [7][8] - 他强调现有AI系统缺乏“解释性创造力”,真正的通用智能需具备主动选择动机的能力,而非机械响应提示 [10][11] - 他指出图灵测试并非AGI基准,判断智能的关键在于能否提供如爱因斯坦发现相对论般的“过程故事” [9][13][14] 行业技术讨论 - 对话触及AGI衡量标准的核心难题,即缺乏测试基准来区分机器输出与真正的创造性智能 [9][10][12] - 戴维・多伊奇作为量子计算奠基人,其理论框架为量子计算机发展奠定数学基础,并证明量子算法的指数级加速效应 [15][17]
奥特曼和量子计算奠基人讨论GPT-8
量子位· 2025-09-28 11:39
核心观点 - 萨姆·奥特曼与戴维·多伊奇就“AI能否发展为具备意识的超级智能”展开对话,奥特曼以未来GPT-8可能解决量子引力问题并解释其思考过程为例,论证AI具备超级智能的可能性 [1][8][22] - 戴维·多伊奇最初认为AI无法发展为具备意识的超级智能,但被奥特曼的GPT-8假设说服,认为如果AI能提供解决复杂问题(如量子引力)的“过程故事”,则可被视为具备解释性创造力 [1][11][12][22] 奥特曼的观点 - 奥特曼极度乐观地认为,即使在AI世界里,人类依然永远不会缺少可以做的事、可以发挥价值的方式、可以解决的问题和可以探索的未知 [6] - 奥特曼认为AI有可能发展成具备意识的超级智能,并以GPT-8为例,假设其能搞懂量子引力并讲述如何做到,以此论证AI的超级智能潜力 [1][8][22] 戴维·多伊奇的观点 - 戴维·多伊奇最初认为AI不会发展成为具备意识的超级智能,并指出现有系统(如ChatGPT)的能力是知识的副产物,而非真正的AGI [11][12][13] - 多伊奇强调“解释性创造力”和“过程故事”是判断智能的关键,认为真正通用的智能需具备主动选择动机的能力,而非机械输出 [18][19][21] - 多伊奇被奥特曼的GPT-8假设说服,认为如果AI能提供类似爱因斯坦发现相对论那样的“过程故事”,则可被视为具备超级智能 [22] 对话背景与影响 - 对话围绕AGI定义标准模糊、目标不断变化展开,引发网友讨论,有人认为AGI无法衡量,目标已转向ASI(超级人工智能) [3] - 多伊奇是量子计算奠基人,曾提出量子图灵机理论框架和Deutsch-Jozsa算法,为量子计算机发展奠定数学基础 [23][24][26]
人工智能至今仍不是现代科学,人们却热衷用四种做法来粉饰它
观察者网· 2025-05-21 08:09
人工智能的起源与图灵测试 - "人工智能"一词于1956年达特茅斯学院研讨会正式提出,但学术奠基可追溯至图灵1950年提出的"图灵测试"[1] - 图灵测试通过人机对话判断机器是否具备人类思考能力,核心设计为黑箱隔离测试环境,仅评估输入输出结果[3][5] - 测试标准存在主观性缺陷:33%人类应答率即被视为通过(2014年Eugene Goostman案例),但未形成科学共识[7] 人工智能的科学性争议 - 图灵论文存在科学规范问题:将神经细胞与计算机部件速度类比(声称计算机快1000倍)缺乏实证依据[8][9] - 行业普遍存在非科学方法论:欧盟"蓝脑计划"(2005-2016)因脑模拟假设不成立而失败,耗资超10年研发周期[12][13] - 术语滥用现象突出:"摩尔定律"(非科学定律)、"尺度定律"(参数规模决定性能)等概念被包装为科学原理[15][16] 技术发展现状与挑战 - 当前AI仍属"现代工匠技艺":依赖暴力计算(参数规模达万亿级)而非科学理论驱动,但应用范围持续扩展[19][20] - 关键瓶颈在于认知科学:人类自我意识机制未解(如神经元工作原理),导致类脑计算缺乏可靠理论基础[11][12] - 商业化加速概念炒作:"涌现"等术语被滥用为技术突破的伪科学解释,资本推动夸大宣传[17][18] 行业方法论批判 - 德雷弗斯1965年报告指出:AI发展类似炼金术,需建立化学级基础理论而非表面突破[18][19] - 学术研究存在三大误区:将想象类比作为论证依据(如脑模拟)、虚构概念包装(如数据科学)、混淆技术表现与智能本质[10][16][17] - 技术有效性不依赖科学理论:AI在图像识别等领域准确率超95%,但底层仍无统一智能理论框架[20][21]
纳指彻底崩了5.9%,中概却红了
小熊跑的快· 2025-04-04 07:05
美股市场表现 - 美股整体暴跌,其中与进出口相关的硬件公司受影响最严重 [1] - 苹果股价下跌9.25%,台积电下跌7.63% [1] - 微软仅下跌2.3%,表现相对抗跌,可能因市场认为软件行业受影响较小 [1] - 亚马逊暴跌9%,可能因其电商业务受关税影响较大 [1] 中概股表现 - 中概股表现强劲,腾讯ADR上涨 [1] - 港股大跌的股票在美股市场反而上涨 [1] - A股成为全球唯一外资资金流入的市场 [2] 行业表现差异 - 硬件行业受冲击明显,软件行业相对抗跌 [1] - 微软的云基础设施采购可能来自墨西哥而非台湾,规避了高关税影响 [1] - 黄金市场表现疲软,与中概股形成鲜明对比 [2]
gpt4.5 通过了图灵测试
小熊跑的快· 2025-04-03 07:47
关税影响 - 关税政策导致纳斯达克指数期货下跌 [1] AI技术进展 - AI通过图灵测试,技术成熟度显著提升 [1] - AI技术进步可能加速行业裁员进程 [1]