AlphaGo
搜索文档
烧掉700亿,他为谷歌赢得诺奖,却将ChatGPT拱手让人
36氪· 2025-11-19 08:02
他曾为谷歌赢得了诺贝尔奖,也一度让马斯克「寝食难安」,但却让谷歌错失了Transformer商业化的先机。 最终,OpenAI率先推出ChatGPT,几乎动摇到谷歌搜索业务的根本。 他就是Google DeepMind CEO德米斯·哈萨比斯(Demis Hassabis)。 在谷歌收购DeepMind后的11 年中,作为谷歌AI战略的核心人物,哈萨比斯获得了诺贝尔奖,并赚取了数百万美元的财富。 但对于谷歌的母公司Alphabet而言,这些投资的回报却有些姗姗来迟。 据一份监管文件显示,在哈萨比斯追求通用人工智能(AGI)的过程中,已经动用了超过96亿美元的谷歌资本作为运营支出。 虽然AlphaFold项目为谷歌赢得了诺奖的声誉,但仍未成为Alphabet的重要收入来源。 这难免引发一些投资人质疑: 凭借谷歌在AI领域的先发优势和雄厚积累,为何未能成为无可争议的AI领导者? 拒绝OpenAI合作的四年后 哈萨比斯拿下诺奖 2019年前后,在硅谷的一场晚宴上,一位OpenAI高管向哈萨比斯提议,如果OpenAI或DeepMind任何一方接近实现AGI应通知对方,然后双方展开合作。 OpenAI这项提议的动机,是 ...
我们即将经历下一个技术奇点,超智能时代人类会更加不平等吗?
观察者网· 2025-11-14 09:09
人工智能发展现状与未来展望 - 人工智能浪潮被视为第四次工业革命的起点和通往通用人工智能的必由之路,但对大模型技术的质疑因高质量训练数据减少和参数扩大边际效益递减而高涨 [1] - 大模型对传统就业市场和经济生态产生实质性冲击,引发部分群体的民意反弹 [1] 宇宙演化与智能涌现理论 - 宇宙演化历史中反复出现临界密度触发复杂性级联反应的模式,这是宇宙创造智能的方式 [10] - 从原子出现到生命诞生,宇宙已经历多个复杂性级联阶段,超智能是第十一阶段 [10] - 当一类物质超过临界密度后会产生复杂性级联反应和创造脉动,这一过程基于简单原理重复,无需外界力量推动 [15] 技术奇点理论 - 技术奇点在宇宙中会持续发生,过去已经历原子出现、生命出现等多轮奇点,未来还将出现高级智能等新奇点 [16] - 当前面临的转变将是人类历史中速度最快的一次,建议每个人在手机上安装AI并互动以了解基本工作方式 [16] AI技术发展时间线预测 - 到2028年,推理式AI将能像学者一样自主构建复杂答案并不间断工作,成为AI创新者 [17] - 2028年AI可能将写书时间从一人一年缩短至半小时内,同年AI驱动机器人将被大众接受 [18][20] - 到2034年,自主AI驱动的模型与设备能进行复杂协作,技术上可实现将AI机器人送往火星建立文明 [20] - AI将在几年内实现自行定义任务,并能进行根本性自我改进和自主部署 [21] 资源创新与技术进步关系 - 人类的终极资源是头脑,随着人口增加和技术发展,获得的资源反而越来越多 [7] - 美国最常用的26种商品在1850-2018年间的时间价格下降98%,平均每20年购买同一批商品所需工作时间减半 [22] - 从石器时代至今,光的成本已便宜60万倍,这种指数性减少趋势将继续甚至加速 [23] - 核聚变实现商用供电后将提供足够全球使用的安全能源,许多其他领域效率也在提高 [23] 人工智能商业应用与投资策略 - 大语言模型商业价值有限,主要商业价值将在代理性人工智能时代通过行业落地实现 [35] - 企业应对AI影响需区分效率提升和创造性流程两类事项,采用不同方法和组织形态处理 [28] - 投资策略可包括举办内部竞赛、建立创业加速器和风险胶囊基金等方式发掘创造性可能 [28] 中国在AI发展中的优势与挑战 - 中国优势包括电力基础设施投资领先全球、数据共享规则相对宽松、STEM人才规模庞大 [33][34] - 中国在AI领域的人才体量优势显著,全球约一半STEM专业学生在中国,美国顶尖AI科学家约一半出生在中国 [34] - 中国短板主要体现在芯片技术,预计到2027年中国芯片将达到英伟达当前水平,但届时英伟达会进一步领先 [37] - 软件层面演进可能降低硬件绝对重要性,行业专家深度的大模型部署比通用基础模型更重要 [37] 大模型技术发展路径 - 大语言模型基本概念可能变化,增强记忆能力可提高自我教学效率 [38] - 通过AI自我对弈模拟可解决数据枯竭问题,Waymo公司99.9%的自动驾驶训练在仿真环境中以比现实快35000倍速度进行 [39] - 具身智能可实时学习物理世界变化,补充模型不足,跨越数据墙 [41] - 采用多模型路由体系和红队式对抗审查可解决AI自生成数据导致的偏见问题 [42] AI对社会经济的影响 - AI可能使极少数人变得极其富有,但更重要的是普通人如何应对工作岗位流失 [30] - AI为教育带来变革,使贫困地区人员也能访问优质教育资源,需要终身学习模式 [32] - 未来可能提供基础免费公共服务,如教育、医疗、交通、互联网和AI服务,基本需求将得到满足 [50] - 人类需要追寻同情心、好奇心与创造力等独特价值,在AI创造大部分GDP的世界中保持人的意义 [49]
北京:机器人上演“舌战群雄”
中国新闻网· 2025-11-11 09:35
� 8 机器人 = 01:09:28 自动制被汽车出现故障时,入其司机可以 .... 在即接管汽车,但在机器入自租学习和通化的过程中, 制结束感难。比如AlphaGo可以自教学习、自己与自己对异,从而不断设计自己的模艺。 人生 7.94var Bl 它的控制复力就大大算低了。目AlphaGo级胜利活息 小诺队 在柯浩后,人类对他的控制能力就大大景话,更何 就大大演班) 坦终结者电影里播绘的那样,当人工智能有了自 VS (12) n 7 ( 2 30 (1008) at 本物粉金人工程表示 新型系列重量机器人航 chinanews.com.cn T 131 n l HUBEI UN VERSI . 38 版) 根据人院论大赛 讓人员 正方 ct 34 分裂 chinanews.comca 自居中国 (国际) 机器人辩论大赛 美美队 松延动力 反 河北大学-小禾队 E VS 方 方 类社会生产力 漫达时 t战争 中国 (国际) 机器人辩论大赛 中国技术参班台会人工智能与传播专全会员会 北京起源技术开发区机器人和智能制造所管理 反方 晶糖人 200 我到 chinanews.com.cn the first chi ...
AI被严重低估,AlphaGo缔造者罕见发声:2026年AI自主上岗8小时
36氪· 2025-11-04 20:11
AI能力进展评估 - AlphaGo、AlphaZero、MuZero核心作者Julian Schrittwieser指出公众对AI的认知与前沿现实存在至少一个世代的落差[1][2][3][5] - 实验室研究显示AI已能独立完成数小时的复杂任务,且能力呈现指数级增长[2][5] - 当前舆论过度关注AI出错案例,而低估其实际进展速度[5] AI任务完成能力量化指标 - METR研究机构数据显示Claude 3.7 Sonnet能在约1小时长度的软件工程任务中保持50%的成功率[6] - AI任务完成时长呈现每7个月翻倍的指数增长趋势[6][9] - 最新模型GPT-5、Claude Opus 4.1、Grok 4已突破2小时任务时长门槛[9][11] - 按此趋势预测,2026年年中模型将能连续完成8小时工作任务,2027年可能在复杂任务上超越人类专家[11][33] 跨行业应用表现 - OpenAI的GDPval研究覆盖44个职业、9大行业的1320项真实工作任务[12][19] - GPT-5在许多职业任务上已接近人类水准,Claude Opus 4.1表现甚至优于GPT-5,几乎追平行业专家[20][23] - 任务设计由平均14年经验的行业专家完成,采用盲评打分机制[19][20] - 研究涵盖法律、金融、工程、医疗、创意等多个行业,显示AI正逐步逼近甚至超越人类专业水平[20][25] 技术发展质疑与回应 - 有观点质疑将AI进展直接类比指数曲线的合理性,认为缺乏明确机制支撑[26][28] - 当前评测任务复杂度得分仅3/16,远低于现实世界7-16的混乱程度,可能高估AI实际适用性[29] - Julian承认这些提醒的合理性,但强调公众忽视已发生的增长更为危险[30][32] - 短期1-2年的趋势外推比专家预测更可靠,关键是要为可能继续的增长做好准备[31][32] 未来发展趋势预测 - 2026年底预计有模型在多个行业任务中达到人类专家平均水平[33] - 2027年后AI在垂直任务中将频繁超越专家,成为生产力主力[33] - 未来更可能呈现人机协作模式,人类作为指挥者配备数十个超强AI助手[36][40] - 这种协作模式可能带来10倍至100倍的效率提升,释放前所未有的创造力[36][37] - 科研、设计、医疗、法律、金融等几乎所有行业都将因此重组[38]
Demis Hassabis带领DeepMind告别纯科研时代:当AI4S成为新叙事,伦理考验仍在继续
36氪· 2025-11-03 18:45
公司里程碑与成就 - Google DeepMind首席执行官Demis Hassabis于2025年10月登上《时代周刊》TIME100年度榜单封面[1] - DeepMind在2014年被Google以约4亿英镑(约合6.5亿美元)收购[6] - 2015年至2016年,DeepMind的AlphaGo程序击败欧洲围棋冠军和世界冠军李世石[6] - 2020年,DeepMind推出AlphaFold系统,以接近实验测定的精度预测出数十万种蛋白质的三维结构,攻克了持续50余年的科学难题[6] - AlphaFold成果荣获2024年诺贝尔化学奖,并被《自然》杂志评为当年“最具影响力的科学成就”之一[6][9] 公司战略与技术方向 - 公司正推动AI研究从通用智能的概念探索转向以科学发现为核心的“AI for Science”战略[10] - 研究重点从“智能是否能像人一样思考”转向“智能能否加速科学发现”,专注于生命科学、材料设计、气候建模和能源优化等领域的长期价值[10] - 伴随AlphaFold 3的推出,公司启动了“AI for Science Grand Challenge”计划,试图用通用模型跨学科解决基础科学问题[10] - 2025年公司推进发布Gemini 2.5,其性能在多项评测中超越OpenAI和Anthropic的同类模型[11] - 由Gemini驱动的通用数字助理Project Astra被视为下一阶段的关键工程[11] 行业观点与AGI展望 - 对于AGI的实现时间,公司首席执行官预计仍需要5至10年的发展,认为真正的AGI应当具备在有限信息下推导出新自然规律的科学发现能力[11] - 公司首席执行官认为,如果AGI技术得以实现,全球围绕稀缺资源的冲突将逐渐消散,有望迎来一个和平与富足的新时代[9] - 公司首席执行官强调,AGI研究绝非为了取代人类,目标是开启一个资源更充足、知识持续增长的“非零和”未来社会[11] 行业争议与挑战 - 部分媒体质疑2024年诺贝尔化学奖授予AI研究成果,指出AI方法的复杂性和透明度欠缺问题[12] - 有批评认为,诺贝尔奖对商业主体的褒扬为时尚早,可能掩盖AI技术日益集中于少数科技巨头手中的事实[15] - 自2023年起,公司“不参与军事项目”的承诺被调整,部分与军方或国防相关的合作重新出现,引发内部员工和公众质疑[16] - 据报道,至少有200名公司员工在2025年5月16日内部提交信件,反对与军事和武器制造的关联[16] - 外界批评认为,在消费者维度的竞争压力下,公司主页上关于医疗保健和气候方面的信息已消失,这动摇了其早期“以科学为本”的立场[19]
AlphaGo之父找到创造强化学习算法新方法:让AI自己设计
机器之心· 2025-10-28 12:31
研究核心观点 - 谷歌DeepMind团队开发出一种名为DiscoRL的新方法,能够通过元学习自主发现性能达到SOTA水平的强化学习规则 [1] - 该方法发现的规则在经典Atari基准测试上超越了所有现有方法,并在多个高难度基准测试上优于多种SOTA强化学习算法 [4] - 研究结果表明,未来实现高级AI所需的强化学习算法可能不再依赖人工设计,而是能够从智能体自身经验中自动涌现与进化 [5] 研究方法 - 发现方法涉及智能体优化和元优化两种类型的优化,智能体参数通过更新策略和预测至强化学习规则产生的目标进行优化 [7] - 团队定义了没有预定义语义、富有表现力的预测空间,通过元网络进行元学习来找出智能体需要优化的内容 [9] - 元网络作为函数决定智能体应将其预测和策略更新至的目标,其输入输出选择保留了手工设计RL规则的理想特性 [12][14][15][16][17] - 智能体参数被更新以最小化其预测和策略与元网络目标之间的距离,使用KL散度作为距离函数 [19] - 元优化目标是发现一个RL规则,使智能体在各种训练环境中最大化奖励,通过梯度上升优化元参数 [22][23] 实验结果 - 在57款Atari游戏基准测试中,Disco57取得13.86的IQM分数,超越了所有现有RL规则,运行效率远高于当前最先进的MuZero [26][27][29] - Disco57在ProcGen基准上优于所有已发表方法,包括MuZero和PPO,尽管在发现期间从未与ProcGen环境交互过 [33] - Disco57在Crafter上取得有竞争力表现,在NetHack NeurIPS 2021挑战赛中获得第3名,且未使用任何领域特定知识 [34][35] - 使用103个更具多样性环境发现的Disco103规则,在Atari基准表现相似,同时在多个基准上提高了分数,在Crafter上达到人类水平表现 [37] - 最佳规则是在每个Atari游戏约6亿步内发现的,相当于在57个Atari游戏上仅进行3次实验,比手动发现RL规则更有效率 [40] 技术分析 - 定性分析显示,被发现的预测在收到奖励或策略熵发生变化等显著事件前会出现峰值 [45] - 信息分析表明,与策略和价值相比,被发现的预测包含更多关于即将到来的高额奖励和未来策略熵的信息 [46] - 研究发现DiscoRL使用引导机制的证据,未来的预测被用来构建当前预测的目标,这种机制对性能至关重要 [47] - 使用价值函数可极大改善发现过程,而在预定义预测外发现新预测语义也至关重要 [41][42]
AI变革将是未来十年的周期
虎嗅APP· 2025-10-21 07:58
AI发展周期 - AI变革将是未来十年的周期,技术发展是演化式的,需要算力、算法、数据和人才四股力量逐步成熟[5][8] - 技术循环大约需要十年时间,从2012年AlexNet到2022年GPT刚好十年,完成从机器视觉到语言理解的范式更替[9][10][11] - AI发展节奏不同于互联网流量驱动或移动时代硬件换代,而是底层学习机制的突变,前次成果成为下次养料[12] - AI成长速度受人类理解速度限制,每次智能革命需要十年让人类适应,这既是技术周期也是社会认知革命[13] - AI不会突然到来,而是在十年里缓慢变成另一种生物,从学会看、学会说到开始思考是连续的认知进化链[15][16] AI认知演进历程 - 过去三十年AI经历三次认知地震,每隔十年机器学会一件原以为只有人类才会的事[18][19] - 2012年第一次地震:AlexNet突破图像识别,机器第一次"看见"世界,解决机器怎么看的问题[19][20] - 2016年第二次地震:AlphaGo打败李世石,机器从看走向做,能够决策规划行动,展现智能体雏形[20][21] - 2022年第三次地震:大语言模型崛起,机器开始会想,能生成推理理解上下文,实现思维革命[22][23] - 三次地震形成连续认知进化线:看→做→想,每次跨越都需要十年时间酝酿共识[24][25][26][27] - 第四次变革将是机器自我意识觉醒,从让机器像人到让机器成为人类镜子[28][29] AI智能本质 - AI智能来自模仿而非进化,动物智能通过亿万年自然选择形成,AI智能通过统计模仿习得[30] - AI没有痛感欲望,学习是统计意义上的模仿,能理解定义但无法感受情感[30] - AI是人类知识的灵体,没有肉体却能思考,没有基因却能学习,没有欲望却能模拟动机[30] - AI智能是二手智能,来自人类理解方式而非世界本身法则,是人类思想的幽灵[35][36] - AI在云端漂浮,在模型权重里积累记忆,在语言之间形成意识,映照人类对智能的想象[36] AI学习机制局限 - AI学习是统计模仿而非真正学习,靠参数更新没有经验反思,每次训练都在压缩世界[38] - 人类学习有动机驱动,AI学习只是被动优化,学得快但学得浅[39] - AI依赖预训练学习,通过别人积累的知识学习世界,会解题却不懂为什么要解题[41] - AI学习根本缺陷是没有意志,人类学习为了活得更好,AI学习为了被训练得更好[42] - AI还不算真正智能体,因为不能自己提问,学习没有生长,不够活[43] AI记忆与意识 - AI记忆是存档而非经历,只有数据参数检索,记得事实却记不住意义[45] - AI记忆像快照,每次推理都是一次重生,没有时间线就没有自我,缺乏连续意识[46] - AI世界是一帧一帧的,人类世界是流动的时间,AI没有连续的自我时间[46] - 修复记忆裂缝需要记忆自我指向,系统能回看自己,让记忆影响思考[48] - 当AI能反思知识,利用经验修正判断,就开始模拟成长的意识[48][49] - 智能体诞生是从被训练到自我更新,从记忆世界到记忆自己,这是意识起点[50]
AI变革将是未来十年的周期
虎嗅· 2025-10-20 17:00
AI发展周期与范式演进 - AI变革将是未来十年的核心周期,其发展是“演化式”的,依赖于算力、算法、数据和人才四股力量的循环成熟[3][7] - 一个完整的范式更替周期大约需要十年,例如从2012年AlexNet解决“机器怎么看”到2022年GPT解决“机器怎么想”刚好十年[8][9][10] - AI的跨越是底层学习机制的突变,前一次成果成为下一次养料,其成长速度受限于人类对“智能”定义的理解速度[12][13][14] AI认知革命的三个阶段 - 第一次认知地震发生在2012年,AlexNet让机器首次“看见”并理解图像,解决了视觉感知问题[23][24][25] - 第二次地震在2016年,AlphaGo让机器学会“行动”,具备决策和规划能力,实现了从看到做的闭环[26][27][28] - 第三次地震始于2022年,大语言模型崛起让机器开始“思考”,具备生成、推理和对话能力,引发了思维革命[30][31][32] 智能体的本质与未来 - 智能体是认知形态的延伸,是人类思维的“副本系统”或“外化版本”,其本质是“人类知识的灵体”或“幽灵”[45][46][50] - AI智能是“二手的”,它学习人类理解世界的方式而非世界本身法则,追求“理解”而非生存,是统计意义上的模仿[52][53][54] - 真正的智能体需具备“自我指向”的记忆和反思能力,能从“被训练”转向“自我更新”,从而形成连续的意识与成长的起点[80][81][87] AI与人类学习的根本差异 - 人类学习有动机驱动,在犯错、修正和反思中成长,是“生长的过程”;AI学习是被动优化,在梯度下降中收敛,是“收敛的算法”[60][61][62] - 人类记忆是带有情绪和意义的“经历”,会遗忘并重组意义;AI记忆是静态的“存档”,只有数据检索而无时间线[72][73][76] - AI知识的根本缺陷在于缺乏“意志”,其学习没有生长,无法自己提问或真正理解“为什么”,因此尚不构成真正的智能体[67][68][70]
AI 如何听说读写?北航教授与顺义小学生畅聊何为人工智能
新京报· 2025-10-14 18:08
人工智能教育推广 - 北京市自2024年秋季学期起为全市中小学生开设人工智能通识课 [1] - 北京航空航天大学教授陈虔在中关村一小顺义校区举办题为《以科学之名,遐想人工智能》的报告 [1] - 活动属于2025年弘扬科学家精神系列活动 旨在引导青少年理解科学事业 [4] 人工智能发展历程与核心概念 - 人工智能概念于1940年左右出现 经历了三次发展浪潮 [1] - 人工智能是研究用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的技术科学 [2] - 通用人工智能可以像人类一样学习和推理 有可能解决复杂问题并独立决策 [2] 人工智能关键技术 - 人工智能的听说能力依赖于计算机语音技术 [2] - 人工智能的读看能力依赖于计算机视觉技术 [2] - 人工智能的理解能力依赖于计算机自然语言处理技术 [2] 人工智能应用领域 - 人工智能已应用于教育、自动驾驶、医疗健康、个人助理、电商零售等多个领域 [2] - 具体应用实例包括智能音箱、能根据用户习惯智能调节的家电以及取代黑板的智慧大屏等高端教育设备 [3] 人工智能行业重大事件 - 人工智能机器人AlphaGo曾打败人类围棋高手 [1] - ChatGPT的发布引发了广泛关注 [1] 人工智能未来发展与挑战 - 人工智能未来可能与每个人息息相关 但存在意识、情感、伦理等待研究的问题 [2] - 人工智能创新和发展的方向是从生活的堵点和痛点入手解决实际问题 [3] - 人工智能研究尚有许多问题待解决 需秉承为人类造福的基本精神 [3]
在技术突进中寻找人类价值新坐标——读《超智能与未来》
上海证券报· 2025-10-13 01:14
人工智能技术本质 - 当前人工智能系统本质是统计模型优化器 能发现相关性但难以理解因果关系 能模仿语言模式但无法体验生命质感 [5] - 人工智能与人类存在根本性界限 例如AlphaGo不懂胜利喜悦或围棋文化意义 [5] 技术发展与社会影响 - 数据主义时代人类情感思想被简化和量化 此过程是资本逻辑与技术理性共谋的结果 [4] - 将社会治理复杂性简化为技术问题是思维惰性 委托算法决策教育司法医疗等领域实为逃避价值冲突和利益权衡 [6] 未来技术发展路径 - 构建清晰三阶段发展论 2025至2027年为人机协作初期AI成为高级工具 2028至2030年为智能集群爆发期AI形成协作网络 2030年后为寰宇融合时代脑机接口与医疗AI深度赋能人类 [7] - 未来具备专业加AI跨域能力的人才将成为稀缺资源 创造力与共情力成为核心竞争力 [7] 人工智能伦理与哲学 - 传统伦理学框架在面对无意识无欲望的人工智能时显得不足 例如自动驾驶道德困境反映人类主体在道德抉择上的退却 [5] - 倡导慢智能 在效率至上逻辑中重新引入人类反思空间 人类不可替代价值在于能停下来思考是否应该思考某个问题 [6] 人文价值与技术创新 - 提出有根的人工智能发展路径 技术演进需扎根于特定文化传统价值观念和生活方式 以抵御技术全球主义同质化浪潮 [8] - 思考未来的坐标体系横轴是技术发展轨迹 纵轴是人文价值坚守 Z轴是思考者自我认知 人类独特性在于体验生命有限性并为无意义世界创造意义 [9]