AlphaGo

搜索文档
理想VLA实质是强化学习占主导的持续预测下一个action token
理想TOP2· 2025-08-11 17:35
本文核心分享四条逻辑链: 2.越认为predict the next token不只是概率分布/统计学的人,越容易认可LLM潜力很大/AI潜力很大/ 推理过程就是意识雏形甚至就是意识/超级对齐非常重要。 1.对predict the next token不同的理解本质是对LLM或AI的潜力与实质有不同的理解。 3.不同时真正的深入思考AI与理想,很容易对理想所做之事含金量低估。 4.理想的VLA实质是在强化学习占主导的连续predict the next action token,类比OpenAI的O1O3。且 辅助驾驶比chatbot更适合用强化学习。 本文架构: 先介绍为什么Ilya的观点值得重点参考,再分享Ilya对predict the next token的英文原文与中文翻译。最 后类比一下与理想VLA的关联以及为何理想所做之事含金量被低估。 以下为正文: Ilya是前OpenAI首席科学家,目前在做超级对齐的工作(如果不认为超级对齐非常重要,本质是不信 AGI。) 最近十余年AI界多项最重要的变化由其推动。包括但不限于2012年和Hinton/Alex Krizhevsky 推出 AlexNet, ...
AI“黑箱”与老子的“道”:跨越2500年的惊人共鸣
虎嗅· 2025-08-08 11:57
核心观点 - 文章探讨了老子《道德经》中"道"的不可言说性与现代物理学、AI技术的"不可解释性"之间的深刻关联 [1][2][20] - 提出人类认知边界与自然规律/技术原理之间存在根本性鸿沟,需以新视角理解AI的"黑箱智慧" [12][17][21] 物理学与"道"的关联 - 光的波粒二象性颠覆经典物理认知,体现微观世界规律超越人类直觉 [4][5][6] - 高维空间理论(弦理论/M理论)揭示宇宙运行逻辑远超三维感知能力 [7][8] - 量子物理奠基者(海森堡/爱因斯坦)的困惑印证自然规律不可被传统逻辑完全解释 [9][10][11] AI技术的"黑箱"特性 - AlphaGo的"神之一手"展示AI通过海量训练发现人类无法理解的决策模式 [14][15] - 模型复杂性体现为:万亿级参数非线性交互、非符号化数值表征、缺乏显性逻辑规则 [17][18] - 当前技术局限:开发者可构建系统但无法完全解析内部实时决策机制 [19] 跨领域共性特征 - 认知超越性:自然规律(道)与AI模式均突破语言/逻辑框架 [12][20] - 涌现现象:简单规则衍生复杂行为(宇宙秩序/AI智能) [20] - 有效性优先:两者均通过实际结果而非理论解释证明价值 [21] AI应用启示 - 需建立可靠性验证机制替代完全透明性要求 [24][25] - 人机协作模式:AI发现模式+人类伦理决策形成共生智慧 [26][27][29] - 数据治理关键性:需防范训练数据偏见导致的系统性风险 [30][31] 终极思考 - 科学边界问题:量子不确定性/宇宙观测限制暗示人类认知存在永久盲区 [33][34] - 提出"接受未知"的智慧观,呼应老子"知其白守其黑"哲学 [35][36]
AI教父Hinton,重新能坐下了
虎嗅· 2025-08-03 12:53
行业与公司发展 - 2012年Hinton团队在ImageNet竞赛中以15.3%错误率夺冠,标志深度学习在图像分类领域的重大突破 [30][31] - 深度学习复兴的两大前提:2010年前后计算能力与大数据成熟 [34] - Hinton团队开发的神经网络技术使机器识别常见物体的准确度达到前所未有的水平 [33] 关键技术突破 - Hinton与搭档提出玻尔兹曼机和反向传播算法,解决机器"从数据中自动提炼内部表征"的核心难题 [20] - ChatGPT底层架构采用Transformer,属于神经网络的一种特殊形式 [13] - 2012年深度学习从纯学术研究转向产业应用,成为科技巨头战略核心 [42][43] 重大商业事件 - 2013年谷歌以4400万美元收购Hinton创立的DNNResearch公司 [40][41] - 谷歌随后以6.5亿美元收购DeepMind,该交易被视为谷歌最值得的投资之一 [54] - DeepMind被收购后开发出AlphaGo、AlphaFold、Gemini等里程碑式AI产品 [55][57] 行业影响与趋势 - 2019年Hinton与LeCun、Bengio共获图灵奖,表彰其推动神经网络成为科技产业核心 [59][60] - 2023年Hinton预警AI风险,提出"AI30年内导致人类灭绝概率10%-20%"的观点 [76] - AI发展速度超预期,Hinton修正预测认为"AI5年内可能比人类更聪明" [76] 行业应用前景 - Hinton认为AI将颠覆所有行业,仅水管工等需要高度创造力的职业暂时安全 [76] - 谷歌通过整合DeepMind与谷歌大脑部门,持续产出尖端AI产品 [57] - 全球科技巨头围绕深度学习重构业务,涵盖搜索、语音、图像识别、自动驾驶等领域 [43]
深度|95后Scale AI创始人:AI能力指数级增长,生物进化需要百万年,脑机接口是保持人类智慧与AI共同增长的唯一途径
Z Potentials· 2025-07-28 12:17
脑机接口技术 - 脑机接口是保持人类智慧与人工智能增长相关性的唯一途径 因AI能力呈指数级增长而人类生物进化需要百万年尺度 [7] - 脑机接口存在巨大风险 技术可能被用于大脑广告植入 记忆窃取甚至意识操控 恐怖分子或国家行为体可能借此实施"思想劫持" [7] - 神经接口技术不仅能模拟视觉 还可操控触觉 嗅觉 味觉 全感官欺骗时代可能来临 [7] - 儿童早期神经可塑性极强 出生于脑机接口时代的孩子将能更自然地使用该技术 而成年人则难以达到同等适应程度 [4] AI数据战争 - 数据是新时代的"石油" 但不同于会枯竭的石油 AI能力会形成自我强化的增长飞轮 [7] - 算法 计算能力 数据构成AI竞争三要素格局 当前科技巨头正在争夺未来5-6年的数据中心布局先机 [7] - AI将成为未来经济 军事和政府运作的命脉 能有效采用AI的国家将实现近乎无限的GDP增长 [23] - 数据中心规模决定AI战争胜负 拥有更多计算能力的国家可运行更多AI副本 在对抗中占据优势 [25] Scale AI业务 - 公司为ChatGPT等主流AI模型提供核心数据支持 估值超250亿美元 [2] - 业务涵盖数据生产 AI系统部署 与大型企业和政府合作 包括美国国防部 全球顶级银行和医疗系统等 [10][11] - 在国防领域帮助训练AI系统进行卫星影像识别 并参与名为Thunderforge的军事规划AI项目 [65][68] - 公司采用"agentic warfare"理念 将现有"humans in the loop"流程转变为"humans on the loop" 由AI agents承担大部分工作 [69] AI军事应用 - AI可大幅加速军事规划与作战筹划 将原本需要数天的流程压缩到数小时 [68] - 军事AI系统能实时进行战棋推演 运行数百万次仿真以评估各种行动方案的可能结果 [72][73] - 数据投毒是最大威胁 攻击者可能污染训练数据以扭曲AI决策流程而不被察觉 [81][82] - 战略突袭成为制胜关键 需不断引入敌方AI无法模拟的新型平台以保持优势 [85][87] AI政府应用 - AI可显著提升政府效率 如将退伍军人看医生的平均等待时间从22天缩短至1-2天 [95] - 自动化审批流程可将耗时数年的项目审批缩短至一天内完成 [96] - 政治体制对新技术反应速度不足是重大挑战 需加快立法和监管以适应AI发展 [97][98] 能源挑战 - AI数据中心建设将推动能源需求激增 美国需采取激进措施提高发电能力以跟上中国步伐 [99][100] - 小型模块化核反应堆(SMR)可能成为数据中心供电解决方案 [103] - 美国电网陈旧且易受网络攻击 存在重大战略风险 [101]
谷歌诺奖大神哈萨比斯:五年内一半几率实现AGI,游戏、物理和生命的本质都是计算
AI科技大本营· 2025-07-25 14:10
人工智能发展前景 - 谷歌DeepMind掌门人预测未来五年内有50%可能性实现通用人工智能(AGI) [3] - 自然界所有可演化模式都能被经典学习算法高效建模 为AI模拟万物提供理论基础 [5][9] - Alpha系列项目证明AI能在组合性极高的空间建立模型 如蛋白质折叠和围棋策略 [5][16] 技术突破与应用 - AlphaFold 3实现蛋白质RNADNA相互作用建模 向完整细胞模拟迈进 [64][66] - Veo 3视频生成模型展现对物理规律的直觉理解 能模拟流体和材料行为 [21][23] - AlphaEvolve系统结合LLM与进化算法 实现算法自我改进与创新 [49][53] 游戏产业变革 - AI将彻底改变游戏开发 实现真正个性化动态生成的开放世界 [3][32] - 生成式系统可即时创建无限游戏内容 突破传统资产制作限制 [37] - 交互式AI游戏可能成为"后AGI时代"的重要应用场景 [38] 计算与能源发展 - 神经网络系统已证明能高效处理传统认为需要量子计算的难题 [16][17] - AI优化能源使用 在电网管理和核聚变反应堆设计方面取得进展 [90] - 免费清洁能源将解决资源稀缺问题 开启太空探索新时代 [92] 企业竞争格局 - 谷歌通过整合DeepMind与Brain团队 一年内实现LLM产品逆袭 [99][100] - 保持初创公司文化的同时利用大公司资源 是技术快速迭代的关键 [101] - AI领域竞争激烈 全球顶尖企业都在争夺技术主导权 [100]
诺奖得主谈人类末日危机实录:关于AI“第37步”、卡尔达舍夫I型文明
36氪· 2025-07-25 12:21
AI技术突破与象征意义 - AlphaGo在第2局比赛中的第37步棋被誉为"神之一手",成为AI在复杂决策中创新性突破的象征 [1] - 该事件引发行业对AI是否已接近技术变局临界点的思考 [1] - DeepMind首席执行官提出自然界可生成模型均可通过经典学习算法高效建模,涉及生物学、化学、物理学等领域 [4][5] 通用人工智能(AGI)发展路径 - 预测2030年实现AGI的概率约为50%,需通过提出科学猜想或发明复杂游戏等标志性标准验证 [4] - AGI需具备匹配人脑的全面认知功能,当前系统存在智能参差不齐的问题 [30][31] - 测试AGI需对数万认知任务全面评估或由顶尖专家长期观察 [31] - 混合系统(结合大语言模型与进化算法等)可能成为实现AGI的关键路径 [18][19] 自然系统建模与技术应用 - AlphaGo和AlphaFold通过智能引导搜索解决蛋白质折叠等复杂问题 [5] - Veo 3视频模型展现出对物理规律的直觉理解能力,挑战了需具身AI才能理解物理的传统观点 [7][8][9] - 未来视频可能发展为可互动场景,接近"世界模型"概念 [10][11] - 进化算法AlphaEvolve结合大语言模型探索新解法,展现组合创新潜力 [18][19] 游戏与交互界面革新 - AI将重塑游戏开发,实现动态生成剧情和真正开放世界 [12][13] - 未来5-10年可能出现根据玩家决策实时生成内容的游戏系统 [12] - AI生成界面时代将到来,界面可个性化匹配用户审美与思维习惯 [4][55][56] 能源与文明发展前景 - 核聚变和太阳能将成为未来主要能源,推动人类迈向卡尔达舍夫类型I文明 [4][43][44] - 解决能源问题将释放海水淡化、太空探索等潜力 [44] - 能源丰裕可能改变经济模式,消除资源稀缺引发的冲突 [45][46] 行业竞争与研发动态 - DeepMind保持双轨研发策略:50%资源投入突破性研究,50%优化现有技术规模化 [37] - 谷歌通过整合Google Brain与DeepMind团队加速产品落地 [51][52] - Gemini模型每6个月发布重大版本更新,沿帕累托前沿优化性能与成本 [56][57] - Meta高薪挖角策略反映AI人才争夺加剧,但前沿研究吸引力仍是关键 [4][50] 科学研究的AI赋能 - AI可辅助科学猜想验证,但提出高质量猜想仍需人类科学家 [23][24] - AlphaFold已分拆为Isomorphic公司,专注AI药物研发 [49] - 模拟生命起源等重大科学问题可能成为AI的下一个突破方向 [26][27]
没有智能全是人工!印度AI,超级骗骗骗
金投网· 2025-07-11 17:32
公司背景 - 创始人杜加尔14岁开始职业生涯,17岁为德意志银行打造套利系统,21岁创办云计算公司Nivio并估值1亿美元[1] - 2016年创办Engineer.ai(后改名Builder.ai),核心理念为用AI标准化模块结合全球众包人力实现低成本软件开发[3] - 公司宣称拥有全球首个AI产品经理"娜塔莎",能通过自然语言交互自动生成应用架构[3] 融资历程 - 2018年A轮融资2950万美元(欧洲当时最大规模之一),投资方包括瑞士风投、新加坡风投和软银[4] - 2021年B轮融资6500万美元,推出Builder Studio平台并打出"让软件构建像点披萨一样简单"的口号[6] - 2022年C轮融资1亿美元,投资方包括美国机构、世界银行、好莱坞大亨和微软[6] - 2023年D轮融资2.5亿美元,卡塔尔投资局领投,37家机构跟投,总融资超4.5亿美元,估值达15亿美元[6][7] 骗局揭露 - 2024年审计发现公司虚报营收300%(宣称2.2亿美元实际仅5500万美元)[9] - 主要债权人Viola Credit扣押3700万美元后,公司于2024年5月20日申请破产[9] - 实际运营中200名印度程序员人工替代AI功能,演示时后台手动接管操作[4] - 宣称处理的10亿行代码数据中90%为公开数据集复制粘贴[10] 行业现象 - AI行业存在算法黑箱(决策不可解释)、演示黑箱(预录交互视频)和数据黑箱(伪造数据集)三重技术壁垒[10] - 伪AI企业常见套路:廉价人力替代算法、开源模型包装自研、漂亮Demo掩盖缺陷[12] - 美国每年因电信诈骗损失近千亿美元,Builder.ai案例显示诈骗目标已升级至企业级投资者[12]
AI发展的三种可能性与重新被定义的真实
新浪财经· 2025-07-08 14:28
未来科技发展趋势 - 未来25年技术演进分为基石层面(AI、数字治理与组织变革)、生存层面(医疗和教育)、应用层面(机器人、无人驾驶和太空探险)以及终极层面(生命科学和脑机接口)[2] - AI发展可能呈现三种场景:规模扩展持续增长、规模扩展失效需新模型、发展停滞进入平台期[3] - 未来AI发展最可能是第一种和第二种可能性的交叉版本,可能出现数据算力边际效用递减或研究领域全新变化[5] AI技术发展现状与挑战 - 当前AI热潮由大语言模型推动,英伟达因AI芯片技术优势市值一度超三万亿美元[2] - AI规模扩展模式可能导致电力消耗剧增,高科技企业开始考虑在火电站附近建数据中心或投资小型核电站[4] - 人类大脑能耗仅约25瓦且学习效率高,模拟人脑是AI发展的一个方向[5] AI对社会的深远影响 - AI将改变"眼见为实"的标准,深度伪造技术使验证真实成为必要,可能推动AI"测谎仪"开发[6] - AI平台可能达成行业共识,在生成内容上添加辨别真伪的标记[6] - 眼球经济/注意力经济在AI时代将有新发展[7] 全球AI商业格局 - AI领域入场券至少需10亿美元,将被科技巨头主导[8] - 全球AI领域可能出现两三个主导者,主导地位最多维持10年左右[8] - 中美将是AI竞争最激烈国家,中国和印度可能在25年内超越模仿阶段开始真正创新[9] AI赋能领域与投资机会 - AI目前对编码和软件编程领域影响最大,程序员普遍使用AI优化工作[10] - AI可能加速更强大AI的问世,神经网络和大语言模型尤其适合生成代码[10] - 未来25年发展最快的领域将是能充分受益于AI技术突破的领域[10]
AI智能体开发指南(2025版)
36氪· 2025-07-07 07:09
AI智能体发展现状 - 2025年被定义为"智能体之年",AI智能体技术进入爆发期,能够感知环境、处理信息、自主决策并采取行动,仅需极少量人工干预 [1][40] - 当前AI智能体已广泛应用于客服、数据录入、任务分派、摘要生成、日程安排与决策流等场景,输出高效稳定 [40] - 行业正在经历工作流重构与职业生态变革,人类角色从执行者转向系统设计者和管理者 [40][93] 智能体行为力理论 - 行为力是智能体的核心能力,指系统在环境中自主感知、建模、决策并行动,且能根据结果自我调整的特性 [13] - 行为力四大核心机制:感知(接收环境信号)→评估(根据目标分析)→行动(影响环境)→学习(形成反馈闭环) [16] - 行为力六阶模型揭示能力进阶路径:从简单反射型→适应型→预测型→反思型→社交型→元系统型,每阶代表质的飞跃 [18][21-26] AI智能体技术架构 - 现代AI智能体由三大组件构成:大脑(LLM处理推理)、躯干(n8n工作流实现系统化行动)、双手与感官(外部工具扩展能力) [59][60][62] - 主流智能体类型包括:简单反射型、基于模型型、目标驱动型、效用型、学习型、分层型和LLM核心型,各自适应不同场景 [43-57] - 混合架构如BDI智能体(信念-愿望-意图)、认知架构(SOAR/ACT-R)和多智能体系统(MAS)正在推动技术边界 [55][56] 自主工作流应用 - 自主工作流与传统自动化的本质区别在于智能响应力,能适应多元输入并针对目标优化决策 [90][91] - 典型应用场景包括:多平台社媒内容自动化生产、销售情报自动化分析、数据查询聊天机器人、全能个人助手等 [103-106] - 实施效果显著,例如客服场景中AI智能体日处理咨询量可达人工的10-100倍,同时释放人类从事更高价值工作 [94][95] 行业转型趋势 - 劳动力模式正从"人类→执行任务"转变为"人类→系统设计→AI智能体→执行任务",标志着战略统筹能力的跨越 [100] - 未来岗位将聚焦智能系统设计、监控与优化,例如营销经理转型为营销系统经理,工作更具战略性和创造性 [96][97] - 核心技能需求转向系统思维、人机协作、伦理领导和持续学习能力,传统职业金字塔向"智能体职业钻石模型"演进 [114][115]
融资6亿美元,诺贝尔奖团队开发AI制药大模型
36氪· 2025-07-03 09:22
Demis Hassabis的AI发展历程 - 4岁学棋、7岁编程、16岁考入剑桥计算机科学系、22岁创办游戏公司、30岁攻读认知神经科学博士学位,随后创办DeepMind [1] - 2016年DeepMind开发的AlphaGo以4:1击败围棋世界冠军李世石,展示AI在复杂策略领域的潜力 [4] - 2018年AlphaFold在CASP比赛中夺冠,成功预测蛋白质3D结构,解决生物学界50年难题 [5] - 2024年因AlphaFold技术荣获诺贝尔化学奖 [5][10] Isomorphic Labs的创立与发展 - 2021年创立Isomorphic Labs,专注AI药物研发,依托AlphaFold技术成果 [3][10] - 2024年1月与诺华、礼来达成战略合作,分别获得3750万美元和4500万美元预付款,聚焦小分子疗法研发 [10] - 2024年5月与谷歌DeepMind联合发布AlphaFold 3,可精准解析药物中常见分子的相互作用 [10] - 2025年2月诺华宣布扩大合作范围,新增最多三个研究项目 [11] AlphaFold 3的技术突破 - Evoformer核心模块改进,高效处理分子信息,捕捉分子间复杂相互作用 [13] - 扩散网络生成分子3D结构,迭代优化原子位置,生成精确3D结构 [14] - 覆盖全类别生物分子,包括DNA、RNA、配体等,较AlphaFold 2范围更广 [14] - 分子相互作用预测精度较传统方法提升至少50%,部分场景下精度翻倍 [14] AI药物设计引擎的核心优势 - 技术层面:凭借AlphaFold 3高精度预测能力,解析药物与靶点结合模式,提升设计成功率 [16] - 效率层面:替代人工实验,缩短药物发现周期,从5-10年降至1-2年甚至更短 [16] - 应用层面:兼容全类别生物分子,可探索肿瘤、免疫病、罕见病等多个领域 [17] AI制药行业趋势 - 2025年全球AI制药市场规模预计达200亿美元,年复合增长率超30% [19] - AI技术正从辅助工具转变为药物研发重要驱动力,覆盖从靶点发现到临床研究的全链条 [20] - 谷歌和Meta等公司公开大量蛋白质结构数据,为研究提供支持 [20] - 斯坦福医学院和英矽智能等机构已利用AI技术取得显著药物研发成果 [20]