通用人工智能(AGI)
搜索文档
Gary Marcus惊世之言:纯LLM上构建AGI彻底没了希望!MIT、芝大、哈佛论文火了
机器之心· 2025-06-29 12:23
论文核心观点 - 大型语言模型(LLM)存在"波将金式理解"现象,即模型能正确定义概念但在实际应用中频繁出现自相矛盾的错误,揭示其概念表征存在深层次内在不一致性[2][3][17] - 这种现象普遍存在于各类主流模型中,包括GPT-4o、Claude-3.5、Gemini-2.0等,波将金率总体达到55%(分类)、40%(生成)、40%(编辑)[32][33] - 研究通过两种互补方法验证:基于三大领域(文学技巧/博弈论/心理偏差)的基准测试和自动化评估程序,结果显示模型内部存在对同一概念的冲突表征[28][36][39] 研究框架 - 提出形式化理论框架:将概念理解定义为函数f:X→{0,1},人类正确解释为f*,误解集合为F_h[21][22] - 引入"基石集"概念:最小实例集S⊆X,通过有限示例测试即可判定是否真正理解概念[24][25] - 基准测试有效性前提:LLM的误解方式需与人类相似,否则高分仅反映"波将金式理解"[17] 实证方法 - 基准测试覆盖32个概念/3159条标注数据,测量模型在定义正确后分类/生成/编辑任务的错误率[28][29] - 自动化程序检测内部不一致性:让模型评估自身生成的实例,结果显示不一致得分范围0.02-0.64[37][39] - 测试模型包括7个主流LLM:Llama-3.3正确率57%/43%/36%,GPT-4o为53%/38%/35%,Qwen2-VL表现最差达66%/62%/52%[32] 行业影响 - 模型定义准确率94.2%,但应用时表现断崖式下跌,证明传统基准测试存在局限性[33] - DeepMind科学家测试显示Gemini 2.5 Pro能正确处理论文案例,但需验证完整测试集表现[12] - 争议点:部分观点认为LLM无需真正理解,只需表现持续改进即可满足需求[11]
AI日报丨抢人抢技术!Meta一亿美元从OpenAI强揽三员大将,AI顶级人才争夺战白热化
美股研究社· 2025-06-27 22:26
AI行业动态 - 理想汽车进行组织架构调整,将"研发与供应群组"和"销售与服务群组"整合为"智能汽车群组",由总裁马东辉负责,CEO李想将更多精力投入AI领域[3] - Meta从OpenAI挖走顶级研究员Trapit Bansal,加入其新成立的AI超级智能部门,Bansal是OpenAI强化学习关键推动者和首个AI推理模型o1的基础贡献者之一[4] - Meta从OpenAI苏黎世研发中心挖走三位核心研究员卢卡斯・拜耶、亚历山大・科列斯尼科夫、翟晓华,为拜耶开出5000万美元签约奖金加股权激励的薪酬包[5] 科技公司AI战略 - 摩根士丹利分析师认为微软对OpenAI的投资取得成功,Azure AI业务进展使微软在生成式AI创新周期中处于有利地位,预计实现中等个位数复合年增长率[6][7] - 亚马逊生成AI副总裁瓦西・菲洛明离职,他曾领导AWS的AI产品战略并主导开发Amazon Bedrock平台,其职责由副总裁Rajesh Sheth接管[9][10][11][12][14] 半导体行业表现 - 英伟达股价上涨0.8%,市值达3.80万亿美元,巩固其全球最大市值公司地位,微软以3.68万亿美元市值位居第二[16][17] - 费城半导体指数上涨0.5%,Marvell Technology上涨5%,Credo Technology和Allegro MicroSystems上涨2%,Broadcom、高通、Analog Devices和英特尔均上涨1%,Astera Labs飙升8%[18] - 美光科技股价下跌2%,但自2025年4月4日以来已上涨近一倍[18]
国内数据产业规模已超2万亿元,腾讯云程彬:Data+AI赛道将爆发
钛媒体APP· 2025-06-27 22:04
腾讯云"Data+AI"战略布局 - 腾讯云将于下半年发布数据智能体产品,构建"Data+AI"深度融合能力,实现从数据存储到智能交互的跃迁 [2] - 公司提出新一代DIaaS平台,集成多模态数据处理、AI模型和Data Agent,使非结构化数据可被AI理解与利用 [5] - 与传统"DataxAI"概念不同,腾讯云强调"Data+AI"是原生一体化平台,目标是让数据智能成为基础设施级的服务 [5][6] 数据产业规模与增长 - 2024年中国数据生产总量达41.06ZB(同比增长25%),人均31.31TB(同比增长25.17%) [2] - 当前中国数据领域企业超19万家,产业规模超2万亿元,预计2030年达7.5万亿元(年均增长率20%+) [8] - 非结构化数据占比达70%-90%,相关IT支出将占数据管理总支出的40%(2027年预测) [3][5] 行业技术变革趋势 - AI大模型推动数据平台转型:从被动数据仓库发展为主动交互的"知识母体" [4][5] - 企业面临数据源激增挑战(平均管理400+异构数据源),需建立动态可追溯的治理体系 [3] - Gartner预测2027年80%的数据治理措施可能因缺乏危机意识失效 [3] 市场竞争格局 - 国际头部企业Databricks估值600亿美元、Snowflake市值740亿美元,已成功转型"Data+AI" [7] - 国内尚未出现对标Snowflake的技术型大数据初创公司,但预计下半年将涌现新竞争者 [7] - 腾讯云认为行业协同至关重要,单独企业难以满足全部客户需求 [7] 技术应用前景 - 生成式AI推动非结构化数据处理需求爆炸式增长,合规压力加剧企业管理难度 [3] - Agent智能体短期内(1-3年)可提升数据价值,但长期可能被AI模型替代 [7] - 大语言模型技术成熟与用户需求增长是推动数智平台发展的双重动力 [6]
AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体
机器之心· 2025-06-27 12:02
研究背景与目标 - 研究聚焦于开发能在开放世界图形用户界面(GUI)中自主探索的智能体,这是实现通用人工智能(AGI)的关键路径之一 [2] - 当前大语言模型(LLMs)和视觉语言模型(VLMs)已展现出跨领域任务泛化能力,为GUI智能体开发奠定基础 [2] - 吉林大学团队提出《ScreenExplorer》项目,旨在训练视觉语言模型实现GUI环境自主探索 [3] 方法论创新 - 构建实时交互的在线强化学习框架,智能体通过鼠标/键盘函数调用与真实GUI环境交互 [10][11] - 引入"好奇心机制"解决开放环境反馈稀疏问题,利用世界模型预测状态转移并估算新颖度 [10] - 采用"经验流蒸馏"训练范式,将每代智能体探索经验自动提炼用于下一代微调 [10] - 设计启发式+世界模型驱动的奖励体系,包含轨迹差异奖励、好奇心奖励、格式奖励和意图对齐奖励 [12] - 采用GRPO算法进行强化学习训练,实现多环境并行推理与实时策略更新 [14][15] 实验结果 基础模型表现 - 未经训练的Qwen2 5-VL-3B模型仅能随机点击屏幕,无法打开任何软件 [17] - 经过初步训练后,3B模型可成功打开桌面软件,7B模型能完成"加购物车"完整流程 [18][20] 性能对比 - ScreenExplorer-3B-E1训练后探索多样性达0 51,显著优于基础模型Qwen2 5-VL-3B的0 21 [23] - 7B版本ScreenExplorer-7B-E1表现更优,探索多样性达0 54,超过专用GUI模型doubao-1 5-ui-tars的0 45 [23] - 世界模型好奇心奖励对训练至关重要,去除后模型无法突破冷启动阶段 [26][28] 涌现能力 - 训练后智能体展现出跨模态翻译、现状计划制定和复杂推理等新能力 [29][32][34] - 探索产生的"意图"字段可自动生成标注数据,为后续任务训练提供基础 [34] 技术价值 - 首次实现视觉语言模型在真实GUI环境中的自主探索训练 [35] - 经验流蒸馏技术显著降低对人工标注数据的依赖,实现能力自主进化 [10][35] - 为开发更自主的智能体和实现AGI提供了可行的技术路径 [35]
诺贝尔奖得主给你支招:AI时代年轻人该学什么 ?
老徐抓AI趋势· 2025-06-27 03:01
戴密斯·哈萨比斯的背景与成就 - 国际象棋神童:4岁学棋,13岁达到大师水平,多次成为英国少年队队长 [6] - 学术跳级:16岁考入剑桥大学计算机系,20岁毕业 [7] - 游戏创业:毕业后创立游戏公司,开发多款畅销游戏,实现财务自由 [7] - 转向AI与神经科学:认为人类大脑处理数据能力有限,希望通过AI创造"加强版大脑"加速科研 [8] - 深造神经科学:29岁攻读伦敦大学博士,研究大脑运作机制,为AI研究奠定基础 [9] - 创立DeepMind:2010年创办DeepMind,目标用AI解决复杂科学问题 [10] - AlphaGo突破:2016年AI系统击败围棋冠军李世石,2017年再胜柯洁,震惊全球 [11] - AlphaZero进化:AI从零自学围棋,3天碾压AlphaGo,展现超越人类的策略创新能力 [12] - 蛋白质革命与诺奖贡献:AlphaFold将单次蛋白质结构研究时间从数年缩短至分钟级,开源2亿个蛋白质结构数据,2024年获诺贝尔化学奖 [13] AI时代的学习与就业方向 - 基础能力重要性:AI时代更应学习编程、数学和物理等基础科学,掌握底层原理才能有效调教和定制AI工具 [15][16] - AI工具应用能力:能否将AI转化为超级助手,关键在于对底层的理解和调教能力,而非依赖AI的自动化功能 [17][18] AI高考志愿助手产品 - 产品功能:基于北大分段策略模型,结合三年录取数据,提供"冲保稳"分类推荐 [19] - 智能搜索:支持模糊搜索和场景提问(如"适合不擅长数学的专业"、"上海小语种强校") [19] - 个性化AI问答:根据省份、分数、偏好生成定制化建议,非标准化答案 [19] - 使用建议:可对比多个工具,因志愿填报为重大决策需谨慎投入 [21] AI时代的机遇与挑战 - 时代特征:AI带来大量机会,但也会淘汰未能适应技术变革的群体 [24] - 关键行动:需持续关注AI、积极拥抱技术并将其深度融入工作与学习 [25]
阿里巴巴,重磅发布!
中国基金报· 2025-06-26 22:04
阿里2025财年年报核心数据 - 2025财年总收入达9963.47亿元,净利润同比增长77%至1259.76亿元 [5] - 阿里云财年收入实现双位数增长,AI相关产品收入连续七个季度三位数同比增长 [2] - 淘天集团客户管理收入(CMR)同比增长6%,88VIP会员规模超5000万且留存率稳定 [6] - 国际数字商业集团收入同比增长29%,跨境业务表现强劲 [2] 业务板块表现 - **云计算与AI**:阿里云服务63%中国A股上市公司,模型平台"百炼"用户显著增长,通义Qwen3模型性能全球领先,已开源200余款模型衍生超10万个子模型 [6][9] - **电商与用户增长**:淘天集团"全站推广"营销工具商家渗透率提升,88VIP会员活跃比例与上年持平 [6] - **创新业务**:夸克月活突破2亿,钉钉付费周活达4200万并成为国内最大效率办公App,高德、虎鲸文娱实现单季度盈利 [6] - **战略调整**:有序退出高鑫零售、银泰百货等资产,优化互联网平台经营效率 [6] 战略方向与AI布局 - **双核心战略**:聚焦"用户为先"与"AI驱动",所有互联网业务贯彻用户优先原则 [9] - **AI技术路径**:坚持开源开放路线,目标推动全球协作实现AGI,通义模型家族规模全球最大 [9] - **第二增长曲线**:以"AI+云"为核心,依托中国云计算市场领导地位(亚太第一)加速全球化布局 [10] 管理层展望 - 未来十年变革将由AI驱动,公司需以创业者心态捕捉机遇,强调"创造而非守成"的基因 [3][8][10] - 阿里云将打造全球云计算网络,支持中国企业全球化,AI国际化蕴含重大机遇 [10]
通往 AGI 之路的苦涩教训
AI科技大本营· 2025-06-26 19:10
核心观点 - Google DeepMind CEO Demis Hassabis预测未来5到10年内有50%概率实现通用人工智能(AGI)[1] - AI发展历程中最大的教训是过度依赖人类经验而非算力与数据规模[2][3] - 当前AGI探索面临技术路径的隐忧,包括强化学习的局限性、脑模拟的算力瓶颈以及NLP的认知边界问题[9][14] 技术路径分析 - **强化学习**:虽为早期突破性技术,但存在"短视"缺陷,需结合更宏观的智能框架[14] - **脑模拟**:受限于算力瓶颈与理论盲区,难以完全复现人类认知机制[14] - **自然语言处理(NLP)**:虽进展迅速,但语言能力不等同于认知能力,模型输出与真实思想存在本质差异[9][15] 行业趋势与反思 - **算力驱动**:历史表明AI突破的核心引擎是计算规模而非人类直觉[2][3] - **大模型争议**:Scaling Law下参数膨胀可能掩盖智能本质,引发"进化还是幻觉"的质疑[15] - **跨学科融合**:脑科学与AI交叉研究成为新方向,强调对世界理解与知识迁移的能力[7][13] 关键人物与事件 - **刘嘉教授**:从AI转向脑科学再回归,提出AGI需融合认知科学、心理学等多学科视角[7][13] - **AlphaGo事件**:标志性技术转折点,推动研究者重新审视智能的本质与构建路径[7] - **《苦涩的教训》**:Richard Sutton指出AI发展应放弃人类经验依赖,专注算力与数据扩展[2][3] 未来探讨方向 - AGI构建是否需突破语言模型的表层能力,实现真正的认知理解[9][15] - 技术路线选择如何平衡短期效果(如NLP)与长期智能本质(如脑模拟)[14] - 跨学科研究(脑科学+AI)对突破现有范式局限的潜在价值[7][13]
坐拥顶刊论文+百万粉丝!哥大博士创业企业「首形科技」,半年拿下Pre A轮融资!
机器人大讲堂· 2025-06-26 16:32
融资与公司概况 - 首形科技完成Pre A轮融资 由招商局创投、深创投领投 五源资本、浔商创投跟投 具体金额未披露[1] - 公司成立于2024年6月 专注于超仿生人形机器人研发 融合AI与类人机器人技术 目标打造高交互能力与逼真外观的产品[1] - 成立仅一个月即获德迅投资、奇绩创坛、Taihill、智元机器人早期投资[1] 技术方向与愿景 - 技术覆盖电机驱动、大型语言模型、运动控制、表示学习、自监督学习及仿生皮肤技术 推动机器人智能化与个性化发展[1] - 以"引领世界走向更智能、更和谐的未来"为愿景 为通用人工智能(AGI)实现提供技术支撑[1] 核心团队 - 创始人胡宇航博士毕业于哥伦比亚大学 研究领域包括机器人自我建模、自主认知及类人交互系统 学术成果发表于《Science Robotics》《Nature Machine Intelligence》等顶级期刊[3][4] - 联合创始人朱德航专注仿生皮肤硅胶材料研发 获中国化学奥赛一等奖 团队还包含帝国理工学院等顶尖学府的复合型人才 覆盖机器学习、机械工程、心理学等多领域[6] 产品与技术 - CharacterMind技术结合情感AI与人脸机器人 构建"角色心灵"系统 能识别人类情绪并动态生成情感表达 实现个性化交互[8] - Elf系列机器人具备30个自由度 支持环境感知、智能对话与自主学习 Lan系列搭载10个自由度 兼顾轻量化与经济性[9][11] - 高性能无刷微型电机专为面部精细动作设计 具有超静音、高响应特性[13] 行业生态 - 人形机器人领域企业包括优必选科技、宇树、云深处等 具身智能企业涵盖跨维智能、银河通用、科大讯飞等[17][18] - 核心零部件企业涉及绿的谐波、因时机器人、坤维科技等 覆盖谐波减速器、传感器等关键部件[19]
OpenAI与微软陷入AGI定义之争:合同条款触发科技巨头博弈
搜狐财经· 2025-06-26 16:03
合作关系与AGI定义争议 - OpenAI与微软的合作关系因AGI定义分歧面临挑战,涉及数十亿美元商业利益与AI技术控制权 [1][3] - 根据2019年协议,微软向OpenAI投资10亿美元,后续追加130亿美元,约定OpenAI达成AGI后可限制微软获取后续技术 [3] - OpenAI近期在多模态AI、推理能力与自主进化技术上取得突破,引发微软对AGI判定标准的质疑 [3] AGI定义与技术标准 - 行业普遍认为AGI需具备跨领域通用性、自主进化能力、意识与自我认知等特征 [3] - OpenAI倾向"功能主义"定义,以系统实际能力(如图灵测试变体、解决复杂科学问题)为判定依据 [3] - 微软主张"渐进式评估",认为AGI应分阶段定义以避免过早触发技术限制条款 [3] 商业依赖与谈判僵局 - 微软核心业务深度依赖OpenAI技术,包括Azure云服务算力支持及Copilot等生产力工具的API嵌入 [4] - OpenAI组建独立委员会联合学术界与伦理学家制定AGI判定标准,计划2026年前公布技术白皮书 [4] - 微软提议将AGI判定权交第三方机构(如NIST或IEEE),但OpenAI以"损害技术机密"为由拒绝 [4] 战略立场与潜在影响 - OpenAI CEO强调AGI达成需服务于"造福全人类"使命,暗示可能重新评估与微软的合作关系 [4] - 若OpenAI单方面宣布达成AGI,微软可能失去对GPT-5、GPT-6等下一代技术的优先使用权 [3][4]
生物智能、机器智能和人类智能:三种智能驱动人类未来丨《两说》
第一财经· 2025-06-26 14:27
生物智能的深刻启示 - 地球上存在三种不同但密切相关的智能:生物智能、人类智能和机器智能,三者相互作用和影响 [2] - 生物智能是最伟大的智能,创造了地球上所有的生命和人类,而人类制造了计算机 [2] - 生物智能的启示在于其从"无"到"有"的自我组装能力,以及保持多样性的进化原则 [4] - 生物进化的奥义在于多样性,子代随机继承母细胞和父细胞各一半的基因,以应对不可预测的未来 [4] - 多样性具有重要的社会意义,是应对未来的一种保险,意味着社会上每个人都很重要 [4] - 生物的生命奥义不是适者生存,而是最具多样性者生存 [5] - 未来不可预测,保持多样性是最好的应对方法之一 [6] 机器智能的深远影响 - 机器智能已存在很长时间,任何利用计算机进行科学研究的行为都是一种机器智能 [8] - 人工智能被视为超级助手,每天与生成式人工智能对话,话题广泛,答案具有启发性 [10] - 人工智能永远不会累,可以随时随地提供辅助,与人类互动中激发新想法 [10][13] - 在人工智能赋能的计算生物学领域,与人类健康相关的生命机制将变得更加清晰 [14] - 不相信技术奇点的概念,因为未来本质上是无法预知的 [12][15] - 人类与计算机、人工智能的结合点会因人而异,利用多样性原则处理互动关系 [12] 人类智能的深度思考 - 人类智能不可替代,具有创新性,能够以出乎意料的方式进行思考 [17] - 人类智能的独特之处在于新想法的随机出现,这是其重要组成部分 [17] - 未来是人类与机器共存的时代,人类智能和机器智能将在互动中找到共识 [21] - 人工智能知道答案,而人类需要做的是思考并提出问题 [22] - 人类将决定价值观的方向,引导技术向善 [23] - 面对未来,应保持开放的心态,重视好奇心、犯错和理解他人意见的价值 [19]