Workflow
通用智能
icon
搜索文档
马斯克评宇树机器人「下黑脚」/OpenAI联创:从未感到如此落后/围棋比赛选手戴AI眼镜引争议|Hunt Good周报
搜狐财经· 2025-12-28 15:28
欢迎收看最新一期的 Hunt Good 周报! 在本期内容你会看到: 7 条新鲜资讯 4 个鲜明观点 12 月 27 日,特斯拉 Cybertruck 项目首席工程师在社交平台分享了这段视频后迅速引发传播。 马斯克本人也看到了这个视频,在评论区发了一个「 笑哭」表情包作为回应。这也是他继上次评价宇树 G1 在王力宏演唱会上的表现后,近期内第二 次对宇树机器人发表看法。 围棋比赛选手引发争议,被曝佩戴 AI 眼镜 Hunt for News|先进头条 马斯克再评中国机器人,测试时对工程师「下黑脚」 宇树科技 G1 人形机器人在动作训练期间的意外举动近日成为网络热点。 测试视频显示,当工程师演示格斗动作供机器人学习时,机器人突然抬脚踢向测试人员。 视频出处看左上角 2025 年 12 月 21 日至 26 日, 第八届「杀猪大会」全品级围棋大赛在浙江绍兴举行。 比赛采用 60 分钟保留时间每步加 10 秒制, 个人积分编排制共 11 轮, 按棋份对局分为九品, 其中前六品细分正品和从品, 后三品只有正品。 比赛期间,业余 5 段选手李蒙七轮连胜, 赢下多名正一品职业棋手,其后被发现佩戴 AI 眼镜并因此遭到质疑。 ...
LeCun哈萨比斯神仙吵架,马斯克也站队了
量子位· 2025-12-25 08:27
一水 发自 凹非寺 量子位 | 公众号 QbitAI 吵起来了。 图灵奖得主和诺贝尔奖得主,为了"智能的本质"——直接激情友好地交流上了。 AI三巨头之一、图灵奖得主Yann LeCun明确表示: 纯粹就是胡扯(complete BS)。 而诺贝尔奖得主、谷歌DeepMind CEO哈萨比斯也不留情面了,指名道姓回击: LeCun的说法简直是大错特错。 当然,马斯克的站队可能也有别的原因。毕竟他和LeCun素来不是很对付,跟哈萨比斯则亦师亦友——马斯克还是哈萨比斯DeepMind早期投 资人。 论战之激烈,关注度之高,已经让专门开辟了一个话题板块: 马斯克也跑来吃瓜了—— 没有任何多余的解释,但这波他站哈萨比斯——"Demis is right"。 事情还要从LeCun几天前接受的一场采访说起。 他在节目中言辞犀利地指出: 根本不存在所谓的"通用智能",纯粹就是胡扯(complete BS) 。 这个概念毫无意义,因为它实际上是用来指代人类水平的智能,但人类智能其实是高度专业化的。我们在现实世界里确实干得不错,比 如认个路、导航blabla;也特别擅长跟人打交道,因为咱们进化了这么多年就是干这个的。 但在国际 ...
不装了,LeCun哈萨比斯神仙吵架,马斯克也站队了
36氪· 2025-12-24 15:47
核心观点 - 人工智能领域两位顶尖专家就“智能的本质”展开激烈辩论,图灵奖得主Yann LeCun认为“通用智能”是胡扯,人类智能是高度专业化的产物,而诺贝尔奖得主、谷歌DeepMind CEO Demis Hassabis则认为通用智能不仅存在,且人脑是其存在性证明,双方的核心分歧部分在于对“通用”一词的定义和理解[1][6][8][13] - 尽管对智能本质的哲学观点存在分歧,但双方在实现AGI(通用人工智能)的实践路径上均将“世界模型”视为关键,但对其具体内涵和实践方向的理解存在差异:LeCun倾向于将世界模型视为用于决策的抽象认知框架,而Hassabis则更侧重于将其视为能够模拟和生成世界的“模拟器”[20][21][22] - 这场辩论反映了AI领域长期存在的根本性思辨,如符号主义与连接主义、端到端学习与模块化系统之争,这些辩论共同推动着技术发展方向的定义与演进[22] 主要人物与立场 - **Yann LeCun (Meta AI科学家,图灵奖得主)**:认为“通用智能”概念是“complete BS”(纯粹胡扯),主张人类智能是进化过程中为适应物理世界而形成的、高度专业化的能力,并非真正通用[6][8][14] - **Demis Hassabis (谷歌DeepMind CEO,诺贝尔奖得主)**:强烈反对LeCun的观点,认为其混淆了“通用智能”与“全能智能”的概念,强调人脑在理论上是近似图灵机的通用系统,并以其惊人的成就证明了通用智能的潜力[8][9][10] - **Elon Musk (企业家)**:在争论中表态支持Hassabis,称“Demis is right”,其立场可能受到与Hassabis的长期友谊及曾是DeepMind早期投资者的关系影响[2][4] - **Jürgen Schmidhuber (LSTM之父)**:在争论之外提及,其早期工作与LeCun正在创业的“世界模型”概念高度相似,并长期在AI领域进行“维权”,强调自身贡献[22][24][27] 关于智能本质的辩论要点 - **LeCun的核心论证**: - 人类智能是专业化的:人类在现实世界导航、社交等方面表现出色,但在国际象棋等特定领域表现不佳,甚至不如某些动物,这表明人类是“专才”而非“通才”[6] - 理论完备不等于实际通用:人脑在理论上(配合无限资源)是图灵完备的,但在资源有限的实际问题中效率极低,因此是资源约束下高度优化的专门化系统[14] - 大脑可实现的功能比例极小:以视觉为例,从100万比特输入到1比特输出的所有可能布尔函数中,人脑能实现的只占“一个无穷小的比例”,这证明大脑是高度专门化的[17][18] - **Hassabis的核心论证**: - 大脑具有极强的通用性:大脑是目前宇宙中已知最精妙复杂的事物,只要给予足够时间、内存和数据,就能够学习任何可计算的内容,是近似的图灵机[9] - 人类成就证明通用潜力:人类能发明国际象棋、科学乃至现代文明(如波音747),考虑到大脑本是为狩猎采集进化而来,这些成就已充分展现其惊人的通用潜力[9] - 智能的关键标准是通用性与学习能力:以1997年“深蓝”为例,其虽擅长国际象棋但不会玩简单的井字游戏,体现了非通用程序的局限性,而人类大脑则展示了通用智能的可行性[10] 实现AGI的路径与方法论 - **Hassabis提出的三步方法论**: - **预测为基石**:智能的本质在于预测(如下一个单词或蛋白质结构),这是所有认知活动的基础形式[10] - **引入搜索与规划**:AI需建立世界模型,并在此基础上在巨大组合空间中进行搜索规划以找到最优解[11] - **通向深度强化学习**:结合深度学习(模式匹配)与强化学习(试错与规划),模拟大脑的神经通路与多巴胺奖励系统,实现自主进化[12] - **双方共识与分歧点**: - **共识**:实现AGI需要构建“世界模型”[20] - **分歧**:LeCun认为世界模型应追求掌握控制理论和认知科学,关注用于决策的抽象表征,而非渲染像素;Hassabis则认为世界模型应能理解世界的因果关系与“直观物理学”,并能生成逼真世界以证明其理解[20][21][22] 行业动态与商业布局 - **LeCun的创业计划**:即将从Meta离职,创立名为Advanced Machine Intelligence Labs (AMI Labs)的新公司,计划于明年一月正式亮相,目标估值30亿欧元(约247亿元人民币),专注于世界模型研发[20] - **谷歌DeepMind的进展**:已于2024年8月推出新版世界模型Genie 3,并持续开发如Veo等视频模型,视可交互的世界模型为通往AGI的关键一步[21][22] - **历史技术路线之争**:当前关于智能本质的争论是AI领域长期思辨的延续,历史上包括符号主义与连接主义、端到端学习与模块化系统以及当下的开源与闭源之争,这些辩论持续塑造着行业技术发展方向[22]
不装了!LeCun哈萨比斯神仙吵架,马斯克也站队了
量子位· 2025-12-24 13:14
核心观点 - 两位AI领域顶尖专家就“智能的本质”展开激烈论战,其核心分歧在于对“通用智能”的定义和理解,但双方都认为“世界模型”是实现AGI的关键路径 [3][31][42] 关于智能本质的争论 - **Yann LeCun的观点**:认为“通用智能”是胡扯(complete BS),人类智能是高度专业化的,是为了适应现实物理世界而专门进化出来的能力 [9][13] - LeCun论证:人类在某些领域(如国际象棋)表现很差,而有些动物更强,因此人类是“专才”而非“通用” [10] - LeCun进一步指出:理论上的图灵完备性(如人脑配合无限纸笔)对解决现实问题效率极低,真正的智能必须在有限资源下高效运作,人脑是资源约束下高度优化的结果 [34][35] - LeCun以神经网络为例:理论上两层网络可逼近任何函数,但实践中需要巨大且难以实现的神经元数量,因此我们使用多层网络,这证明了专业化 [36] - LeCun引用爱因斯坦:世界竟然可以被理解是不可思议的,我们能理解的只是所有可能函数中无穷小的比例,无法理解的部分称为“熵” [37][38][39] - **Demis Hassabis的观点**:认为LeCun大错特错,其混淆了“通用智能(general intelligence)”和“普适智能(universal intelligence)” [15][16] - Hassabis认为:大脑是宇宙中已知最精妙复杂的事物,具有极强的通用性,从图灵机理论看,只要给予足够时间、内存和数据,就能学习任何可计算内容,人脑和AI基础模型是近似的图灵机 [17][18] - Hassabis以人类发明国际象棋、科学乃至现代文明(如波音747)为例,认为这展现了人脑惊人的通用潜力,尽管大脑最初是为狩猎采集进化 [19][20] - Hassabis衡量智能的关键标准:通用性(Generality)和学习能力(Learning) [22] - Hassabis以1997年“深蓝”为例:其虽擅长国际象棋但不会玩简单井字游戏,足见其死板,而最吸引他的是作为人类代表的卡斯帕罗夫的大脑 [22][23] - Hassabis坚信:人类大脑是宇宙中已知唯一关于“通用智能可行性”的存在性证明 [24] - **争论的调和与核心**:LeCun后续回应称分歧主要在于“用词”,他反对用“通用”指代“人类水平”,但承认用词分歧后仍坚持人类智能高度专门化的观点 [32][33] - 网友观点:抛开用词,两人本质在谈论不同问题,一个强调“我们是什么”(人类智能的现状),另一个强调“我们能成为什么”(智能的潜力) [41] 实现AGI的路径:世界模型 - 双方都认为“世界模型”是实现AGI的关键下一步 [42] - **Yann LeCun的世界模型路径**:其即将从Meta离职创业,新公司名为Advanced Machine Intelligence Labs(AMI Labs),计划于2025年1月正式亮相,目标估值30亿欧元(约247亿人民币) [43] - LeCun对世界模型的理解:追求的不是渲染精美像素,而是掌握控制理论和认知科学,模型应专注于捕捉能用于AI决策的世界状态的抽象表征,与JEPA研究一脉相承 [44] - LeCun认为关键:了解“世界的结构是什么” [45] - **Demis Hassabis的世界模型路径**:表示世界模型是谷歌DeepMind接下来的重点 [46] - 谷歌DeepMind于2024年8月推出新版世界模型Genie 3 [47] - Hassabis对世界模型的理解:指能够理解世界运行机制中因果关系与协同效应的模型,即一种“直观物理学”——事物如何运动、相互作用及表现 [47] - Hassabis认为检验方式:是否能够构建一个逼真的世界,因为若能生成它,就意味着已理解并内化了系统运作规律,这也解释了Genie、Veo等模型首先以视频模型形式出现 [48][49] - **双方世界模型理念的差异**:LeCun代表“世界模型即认知框架”,Hassabis代表“世界模型即模拟器” [50] 行业背景与相关动态 - AI领域的重大进步常伴随根本性争论,如历史上的符号主义与连接主义、端到端学习与模块化系统、以及当前的开源与闭源之争 [51] - LSTM之父Jürgen Schmidhuber介入,称LeCun即将创业的世界模型与其团队在2014年的工作高度相似 [51][53] - Schmidhuber被称为“成熟人工智能之父”,其发明的LSTM在ChatGPT诞生前曾被称为“最具商业价值的人工智能成就”,但在当前AI时代未获相应奖项认可 [53][54] - 马斯克评价Jürgen Schmidhuber为“一切的发明者” [58] - 马斯克在此次争论中站队Hassabis,称“Demis is right”,部分原因可能是其与Hassabis关系密切(曾是DeepMind早期投资人),且与LeCun素来不和 [5][7]
腾讯研究院AI速递 20251224
腾讯研究院· 2025-12-24 00:01
生成式AI产品与功能更新 - ChatGPT官方首次面向美国、英国、加拿大、新西兰和澳大利亚用户推出“Your Year with ChatGPT”年度回顾功能,为用户提供发送消息数、聊天总数等数据,并颁发趣味奖项,许多用户发现自己的活跃度排名在前1% [1] - 智谱AI发布并开源GLM-4.7模型,其在Code Arena全球编码评测中位列开源第一、国产第一,表现超过GPT-5.2,SWE-bench-Verified达到73.8%的开源SOTA水平 [2] - GLM-4.7模型显著提升了多语言编码、终端智能体效果、前端审美、工具调用和推理能力,并引入新的思考机制,响应速度提升且Token消耗下降 [2] - MiniMax发布M2.1模型,系统性提升了Rust、Java、Golang、C++等多语言编程能力,在SWE-bench多语言版达到66.7% [3] - MiniMax M2.1模型显著加强了原生Android和iOS开发能力,在VIBE综合榜单以88.6分展现接近Claude Opus 4.5的全栈构建能力,几乎所有子集均超过Claude Sonnet 4.5 [3] AI在企业级应用与商业模式演进 - 钉钉发布为AI打造的工作智能操作系统Agent OS和钉钉ONE界面,其通用任务处理Agent“悟空”实现从“对话者”向“执行者”进化 [4] - 钉钉发布DingTalk Real AI主机作为Agent OS物理载体,并将DingTalk A1升级为团队工作助理,支持录音数据直接导入业务系统成为结构化资产 [4] - 钉钉的商业模式从按功能收费转向结果付费,其AI差旅等产品明确提出“帮助企业降本15%”等业务成果,预示AI To B行业从销售功能转向销售结果 [4] - 创业孵化器Y Combinator指出,AI经济已从“安装阶段”过渡到“部署阶段”,形成了模型层、应用层、基础设施层三层清晰结构 [9] AI芯片与硬件生态竞争 - 硅谷投资大佬Peter Thiel预测AI芯片最终将变成白菜价,认为英伟达过去几年的暴利本质来自CUDA生态绑定和缺乏替代品的“垄断红利” [7] - AMD硬件性能已追平甚至局部反超GPU,ASIC效率碾压通用GPU,谷歌Gemini 3全部运行在TPU上,Anthropic大量训练跑在Trainium上 [7] - 外媒揭秘“英伟达循环贷”模式,企业用GPU抵押借钱再购买更多GPU,CoreWeave融资规模超过120亿美元,GPU债务市场规模突破200亿美元 [7] AI行业竞争格局与开发者偏好 - 根据Y Combinator年终复盘,Anthropic用户增长52%,超越OpenAI成为YC创业者最常使用的API,Claude Sonnet成为代码生成和AI Agent任务首选 [9] - 创业公司基于Evvals选择模型而非盲目跟随,Gamma公司以50人团队做到1亿美元年度经常性收入,AI工具极大提升单个开发者生产力 [9] 前沿科技进展 - 长征十二号甲遥一运载火箭成功发射并实现二级入轨目标,但一级火箭未能成功回收,该火箭采用液氧甲烷推进剂,起飞质量433吨,近地轨道运载能力12吨 [5][6] - 这是国家航天体系在“入轨级可回收运载火箭工程化应用”方向的关键一步,体现了“举国体制+市场机制”的模式创新 [6] AI学术与理论争议 - Meta首席AI科学家LeCun认为“通用智能”不存在是胡说八道,强调人类智能高度专用化,只能在能构想的问题上“通用” [8] - DeepMind掌门人Hassabis反驳LeCun,认为其混淆了“通用智能”和“普适智能”,指出人类大脑和AI基础模型近似图灵机,理论上什么都能学 [8] - 这场争论反映了对AGI发展路径的不同判断:Hassabis关注通用架构规模化后的潜力上限,LeCun强调现实环境中可扩展可学习的具体机制 [8]
LeCun和哈萨比斯「吵」起来了:「通用智能」到底存不存在?
机器之心· 2025-12-23 15:06
文章核心观点 - 文章报道了人工智能领域两位顶尖专家Yann LeCun与Demis Hassabis就“通用智能”概念展开的公开辩论 这场辩论反映了对人工智能发展路径的两种不同研究范式[1][10][38] LeCun的核心论点:反对“通用智能”概念 - Yann LeCun认为“通用智能”这个概念是“彻头彻尾的胡说八道”和“无稽之谈” 他认为人类智能是高度专用化的 人类在许多任务上表现差劲 而动物在许多领域胜过人类[3][4][5] - 他认为人类自认为通用是一种“幸存者偏差”的错觉 因为人类只能意识到自己能构想出的问题 而忽略了海量位于认知盲区之外、根本无法构想的任务[3][4] - 他从数学和效率角度论证 认为人类大脑是极度专业化的 视神经拥有100万根神经纤维 视觉任务是从1E6比特到1比特的布尔函数 在所有可能的此类函数中 大脑能够实现的比例微乎其微[25] - 他指出 人脑约有1E11个神经元和约1E14个突触 指定整个连接组所需的总比特数最多为3.2E15 这意味着人脑可表示的布尔函数总数最多为2^(3.2E15) 与所有可能函数总数2^(2^1E6)(约2^(1E301030)或10^(3 x 1E301029))相比是极小的数字[25][26][27] - 他强调理论上的可计算性(如图灵完备)不等于实际效率 在资源受限下 人脑处理绝大多数计算问题的效率极低 表现是高度次优的[23][25] Hassabis的核心论点:支持“通用智能”概念 - Demis Hassabis认为LeCun混淆了“通用智能”与“普适智能” 他认为人类大脑是“目前在宇宙中已知的最精妙、最复杂的现象” 并且具有极高的通用性[12][13] - 他的观点基于通用计算理论 认为人类大脑以及AI基础模型都是近似的图灵机 只要给予足够的时间、内存和数据 从理论上讲就能够学习任何可计算的事物[12][14] - 他以人类创造力为例反驳LeCun 指出人类大脑的出厂设置是为了“采集和狩猎” 但却用这套硬件发明了国际象棋并造出了波音747 这证明了其令人惊叹的通用性[12][14] 争论的本质与行业意义 - 两位专家的争论看似围绕词汇定义 实质上反映了对AGI发展路径的两种不同判断和研究范式[38] - Hassabis的立场更接近“通用计算主义” 关注通用架构在规模化后的潜力上限 认为能力边界可以随算力、数据和训练时间的扩展而持续外推[38] - LeCun则强调实际可实现性与效率约束 认为智能系统必须在有限资源下运行 必然高度依赖结构、归纳偏置和与世界相匹配的表征方式 应关注构建能高效理解和预测现实世界的“世界模型”[38] - 这场分歧是两种研究范式的差异 在AGI实现之前 这两条路径可能会长期并行并相互借鉴 争论本身是推动领域前进的重要动力[38][39] 其他行业专家的观点 - 谢赛宁支持LeCun的观点 推荐了Frans de Waal的著作《Are We Smart Enough to Know How Smart Animals Are?》 认为人类应对智能抱有更谦卑的态度[29][30] - 黑天鹅理论之父Nassim Nicholas Taleb从哲学角度支持LeCun 认为任何智能都是“领域特定”的 受进化和结构束缚[33] - 埃隆·马斯克则简洁地表示支持Hassabis的观点[36]
科技周报 | “游戏沪十条”即将出台;TikTok美国方案签约
第一财经· 2025-12-21 15:06
游戏产业政策与市场动态 - 上海即将推出支持游戏电竞产业发展的“游戏沪十条”举措,旨在打造产业高地、搭建出海跳板、加强科技赋能等[2] - 2025年上海网络游戏产业预计实现销售收入1707亿元,同比增长约9.6%[2] - 2025年中国国内游戏市场收入约3508亿元,同比增长7.7%,用户规模超过6.8亿,同比增长约1.4%[11] - 2025年中国自研游戏海外市场收入约204.6亿美元(约为人民币1440.6亿元),同比增长10.2%,出海收入规模已连续六年超千亿元[11] 阿里巴巴投资动向调整 - 阿里系资本一周内减持了华谊兄弟、翱捷科技、红星美凯龙三家上市公司股份[3] - 美年健康股东杭州灏月及其一致行动人计划在未来三个月内合计减持不超过公司总股本3%的股份[3] - 阿里巴巴目前的投资正向AI领域集中,今年以来新增外部投资活跃在具身智能领域[3] TikTok美国业务重组 - 字节跳动、TikTok已与三家投资者签署协议,将成立名为TikTok美国数据安全合资有限责任公司的美国合资公司,负责美国的数据保护、算法安全等内容[4] - 由字节跳动全资控股的其他实体将继续负责美国市场的电商、广告等商业活动及全球互联互通[4] - 字节跳动继续拥有TikTok算法的知识产权,授权新合资公司使用并收取授权费[4] 机器人行业重要事件 - 宇树机器人在王力宏演唱会伴舞表演,其视频获得马斯克在社交平台转发并评论“令人印象深刻”[5] - 美国扫地机器人鼻祖iRobot申请破产,并将由中国的扫地机器人代工龙头企业杉川通过法院监督程序收购[6][7] - 杉川计划同步推进iRobot在海外和中国的业务,保留原有品牌,已于今年8月获得iRobot中国区域代理权[7] - 人形机器人公司银河通用完成新一轮超3亿美元融资,由中国移动链长基金等机构领投,最新估值超200亿元[8] 消费电子与互联网平台监管 - 苹果在日本地区调整iOS应用政策,允许通过第三方应用商店分发应用及接入第三方支付工具,对应佣金率仅为10%-21%[9] - 日本是亚洲第一个打破苹果App Store应用内购买与应用分发规则的国家[9] - 在中国市场,苹果对年收益超过100万美元的App抽取30%的内购收益,年收入100万美元以内的抽成比例为15%[9] 清洁电器行业资本动态 - 扫地机器人企业追觅的创始人俞浩拟以20多亿元收购A股上市公司嘉美包装的控股权,引发借壳上市猜想[10] - 嘉美包装公告表示未来一年不改变主业[10] - 中国清洁电器头部企业正积极挖掘第二增长引擎,进行多元化与技术创新布局[10] - 行业竞争加剧,石头科技筹划香港分拆上市,科沃斯布局具身智能,云鲸正为香港上市做最后冲刺准备[10]
格林大华期货早盘提示-20251216
格林期货· 2025-12-16 08:01
报告行业投资评级 未提及 报告核心观点 受外围市场利空影响,周一两市主要指数震荡调整,科创 50 指数跌幅较大;2026 年股市预计有增量资金,中国科技板块成全球资金布局 AI 新选择;摩根大通看好 2026 年中国股市;后市资金面承压,市场预期弱势运行,建议股指观望等待新机会,暂不参与股指看涨期权 [1][2][3] 各部分内容总结 行情复盘 - 周一两市主要指数震荡调整,科创 50 指数跌幅较大,两市成交额 1.77 万亿元,下跌缩量;沪深 300 指数收 4552 点,跌 28 点,跌幅 -0.63%;上证 50 指数收 2987 点,跌 7 点,跌幅 -0.25%;中证 500 指数收 7113 点,跌 55 点,跌幅 -0.78%;中证 1000 指数收 7309 点,跌 61 点,跌幅 -0.84% [1] - 行业与主题 ETF 中涨幅居前的是卫星 ETF、航空航天 ETF 等,跌幅居前的是科创芯片设计 ETF、创新药 ETF 等;两市板块指数中涨幅居前的是林业、航天装备等,跌幅居前的是消费电子、医疗美容等 [1] - 中证 1000、中证 500、沪深 300、上证 50 指数股指期货沉淀资金分别净流出 52、40、34、1 亿元 [1] 重要资讯 - 11 月份,规模以上工业增加值同比实际增长 4.8%,环比增长 0.44%,1 - 11 月份同比增长 6.0%,41 个大类行业中有 30 个行业增加值同比增长 [1] - 证监会表示推动落实中长期资金长周期考核机制,发展权益类公募基金,推动指数化投资发展,启动创业板改革,加快科创板改革举措落地,研究推出新期货品种 [1] - 中泰证券称 2025 年股市实现 2.26 万亿净流入,2026 年保险、理财、养老金为增量资金,机构增量资金达 3.1 万亿,公募固收 + 规模至少翻倍 [1][2] - 高盛估计全球央行 10 月净买入 49 吨黄金,维持 2026 年月均 70 吨假设,预计 2026 年底金价升至 4900 美元 [1] - 美银认为美联储储备管理购买计划和财政部债券发行策略调整形成“类 QE 组合拳”,2026 年美联储预计购买 5600 亿美元短债,财政部增发 5000 亿短债、减发 6000 亿中长期债券,降低市场久期风险,预计对 10 年期美债收益率产生 20 - 30 个基点下行压力 [1][2] - AI 专家对大语言模型发展有不同观点,一方认为逼近人类,另一方认为是“智能幻觉” [2] - 可再生能源板块今年跑赢大盘和石油股,标普全球清洁能源转型指数年内飙升 44%,投资创新高,源于人工智能革命带来的能源需求 [2] - 对冲基金进军实物大宗商品市场,金融巨头涉足天然气、电力和原油实物交易 [2] - 国金证券研报称 SpaceX 护城河是成本、制造和客户三大壁垒融合,猎鹰 9 号降低发射成本,与美国政府客户关系构建商业闭环 [2] - OpenAI 取消新员工“期权授予期”,今年股权薪酬支出预计达 60 亿美元,接近预计收入一半 [2] - 日本大型制造业企业商业信心 12 月攀升至四年高位,为日本央行本周加息扫除障碍,市场预计基准利率上调至 0.75% [2] - 经济学家建议特朗普用“关税退税”政策拉升支持率,推动新“超级法案” [2] - 多家全球大型资产管理机构看好印度市场,认为其股市与全球 AI 交易低相关,可对冲风险 [2] 市场逻辑 - 受外围影响周一两市指数调整,2026 年股市有增量资金,中国科技板块因估值、产业生态和制造能力优势成全球资金布局 AI 新选择 [2] - 瑞银证券分析师认为 2026 年多因素共振助力 A 股估值上行,摩根大通上调中国股票评级为“超配”,英伟达 CEO 认为中国将赢得人工智能竞赛 [2][3] 后市展望 - 受外围影响周一两市指数调整,全球资金加码中国股市,外资期待主动资金回归,中国科技板块成布局 AI 新战场 [3] - 摩根大通认为 2026 年中国股市上涨风险高于下跌风险,看好多重积极因素,阿里和谷歌相关人士表示 AI 需求旺盛 [3] - 美国回归门罗主义使全球资金加速流向中国资本市场,美联储降息并购买短债,资产负债表扩张 [3] - 周一两市调整技术走弱,后市资金面承压,市场预期弱势运行,股指观望等待机会 [3] 交易策略 - 股指期货方向交易建议观望等待新机会 [3] - 股指期权交易暂不参与股指看涨期权 [3]
GPT-5.2来了,首个“专家级”AI复仇成功,牛马打工人终于得救了
36氪· 2025-12-12 07:58
产品发布与定位 - OpenAI发布GPT-5.2系列模型,包括即时版、思考版和专业版三款,今日全部上线 [1][2] - 该系列模型定位为“地表最强通用模型”,专为解决高难度知识型工作而生 [4] - 此次更新正值公司内部进入“红色代码”紧急状态,旨在集中资源优先开发,但公司高管表示不应将其视为对竞争对手的直接回应 [21] 核心性能提升 - 相比上一代,GPT-5.2在通用智能、超长文本理解、Agent工具调用及视觉能力上实现全面进化 [6] - 在SWE-Bench Pro基准测试中取得55.6%的高分,在LMArena代码竞技场中位列全球第二,在ARC-AGI-2基准测试中以52.9%的绝对优势登顶全球第一 [6] - 在GDPval基准测试中,覆盖44种职业知识,表现超越人类行业专家,成为首个在该测试中表现超过人类专家水平的模型 [6][25] - 在长上下文推理方面树立新标准,在OpenAI MRCRv2基准测试的多种变体(高达256k Token)上达到接近100%的准确率 [53] - 视觉能力显著增强,在图表推理和软件界面理解方面的错误率大约减少了一半 [60] 具体任务表现 - 在GDPval知识工作任务中,GPT-5.2 Thinking在70.9%的情况下击败或打平顶尖行业专业人士,完成任务的速度比专家快11倍,成本低于1% [27] - 在针对初级投资银行分析师电子表格建模的内部测试中,GPT-5.2 Thinking的平均每任务得分比GPT-5.1高出9.3个百分点(从59.1%升至68.4%) [33] - 在编程能力上,GPT-5.2 Thinking在SWE-bench Verified上取得80%的高分,能更可靠地调试生产环境代码、实现功能请求和重构大型代码库 [44] - 幻觉显著减少,在一组去标识化的ChatGPT查询中,包含错误的回答相对减少了30% [49] - 在工具调用和端到端工作流方面表现卓越,在Tau2-bench Telecom上创造了98.7%的新纪录 [64] 模型规格与定价 - 模型知识库更新至2025年8月31日,拥有40万Token的上下文窗口和12.8万Token的最大输出长度 [19] - 相比GPT-5/5.1,GPT-5.2的输入输出价格贵了40% [19] - 具体定价为:GPT-5.2 / gpt-5.2-chat-latest的输入价格为每百万Token 1.75美元,输出价格为14美元;GPT-5.2 Pro的输入价格为21美元,输出价格为168美元 [20] - 尽管每Token成本更高,但由于更高的Token效率,GPT-5.2的性价比反而更高 [88] 行业影响与生态 - 该模型被定位为“打工人的最佳工作模型”,能有效辅助完成创建电子表格、制作演示文稿、编写代码、感知图像等专业任务 [21][22][29] - 公司报告称,ChatGPT每天能为企业用户平均节省40–60分钟,重度用户每周能节省超过10小时 [25] - 在科学研究辅助方面,GPT-5.2 Pro和Thinking是辅助科学家工作的最佳模型,在研究生水平基准GPQA Diamond上分别达到93.2%和92.4%,并已实际参与完成学术论文证明 [70][72][73] - 新模型已向付费ChatGPT用户(Plus、Pro、Go、Business、Enterprise)优先开放,GPT-5.1将继续供付费用户使用三个月后停用 [87] - 开发者可通过Responses API和Chat Completions API使用对应模型,并支持新的第五种推理强度“xhigh” [88]
没有身体就没有AGI!Hillbot苏昊对谈千寻高阳:具身智能泡沫很大但进展真实
量子位· 2025-11-27 11:00
文章核心观点 - 具身智能是通往通用人工智能的必经之路,其本质与大语言模型无异,核心在于数据规模的扩展[2][3][4] - 行业正处于“全民做科研”的泡沫与真实进展并存阶段,技术突破是连续过程,机器人具身模型的GPT-3.5时刻预计在2-3年内到来[31][33][38][41] - 中国在具身智能领域具备硬件与软件协同设计、供应链效率和现实世界数据采集的显著结构性优势[25][26][27][30] 具身智能的战略重要性 - 具身智能是实现通用物理智能和通用智能的关键出口,缺乏身体则无法验证认知和改变世界[2][16][19] - 无论是虚拟智能体还是物理机器人,与环境的交互和经验学习是获得通用能力的必不可少环节[21][23] - 科学发现和拓展人类生存空间等宏大目标,均需具身智能实现感知与交互的配合[19] 技术路径与突破预期 - 技术路径借鉴大语言模型的成功经验,核心是解决预训练问题,让模型具备先验知识[39][40] - 世界模型是技术框架的重要组成部分,旨在建立对物理世界常识的表征,视觉-语言-动作架构需要其支撑[34][36] - 下一个突破是模型听话程度和完成多样化物理行为能力的连续提升,最终能串联复杂任务[40][41] - 机器人具身模型的GPT-3.5时刻预计还需2-3年,GPT-4时刻则需更长时间[41] 中美竞争与中国优势 - 中美在顶尖技术层面差距不大,美国在人才绝对数量和资本对“世界第一”量级的投入上具有优势[24][25] - 中国的核心优势在于硬件和软件的协同设计能力、供应链效率以及现实世界数据采集的迭代速度[25][26][27] - 硬件迭代周期在中国可比美国快3-10倍,配件获取速度以天为单位,而美国需周以上[25][26] - 中国全社会对具身智能的投入度和决心更强,且在该领域“没有退路”,必须持续支持[30] 行业现状与挑战 - 当前AI行业处于“全民做科研”状态,因问题宏大,资本和研究力量过早介入导致泡沫与真实进展并存[31][33] - 具身智能发展的最短板是数据,其瓶颈与大语言模型的电力瓶颈不同[27] - 芯片供应,特别是端上芯片,是中国面临的一个明确挑战[30]