Workflow
通用人工智能(AGI)
icon
搜索文档
未来改变世界的不再是人?OpenAI 首席科学家直言:AI才是关键力量
36氪· 2025-08-18 07:47
8月16日消息,在最新一期OpenAI发布的播客节目中,主持人(OpenAI前工程师)安德鲁・梅恩和其公 司的黄金搭档——首席科学家雅库布・帕乔基(Jakub Pachocki)和研究员西蒙・西多尔(Szymon Sidor)作为嘉宾参与。 这对搭档回顾了从波兰高中同学到在OpenAI共事的渊源,还深入探讨了人工智能发展的关键议题,包 括通用人工智能(AGI)的定义与衡量标准、技术突破的标志性成果、基准测试面临的挑战,以及AI对 教育、科研和社会的实际影响等。核心观点有: ●AGI的定义与衡量演进:AGI已从抽象概念细化为多维能力集合。比如IMO金牌等里程碑虽有意义, 但点状突破已不足,未来应关注其在自动化科研和现实应用中的影响。 ●AI技术的突破轨迹:从早期情感分析的局限,到GPT系列模型的迭代,模型已能参与IMO、ICPC、日 本AtCoder等竞赛,展现出强大的推理与创造性思维能力。 ●基准测试的挑战与 "饱和":许多基准测试已出现"饱和",模型接近或超过人类水平,但难以全面反映 智能。衡量标准需转向实际效用与新见解的发现能力。 以下为此次播客节目的精华版内容: 安德鲁・梅恩:大家好,我是安德鲁・梅恩, ...
AI和互联网的旷世冲突
36氪· 2025-08-18 07:41
平台主导下的旧秩序 - 互联网底层权力结构体现为注意力权利不对称,用户是注意力的供给方,平台是垄断性代理和加工方,将注意力打包成广告位售卖[4] - 平台掌握三大核心权力:信息优先级设置权(算法决定用户看到的内容)、个人数据使用权(单向收集行为数据构建用户画像)、价值分配权(定义创作者/商家/用户的收益规则)[5][6] - 用户在该体系中处于被动地位,成为"被看见、被分析、被引导"的客体,权利与服务免费性形成对冲[7] 个人智能体引发的新范式 - 个人智能体(Personal Agent)作为用户数字世界的专属代理人,唯一效忠用户利益,颠覆平台中心主义[8][10] - 权力结构从不对称转向对称:广告模式面临终结(Agent自动过滤营销信息除非用户主动同意)、算法目标反转(从最大化粘性转向效率优先)、数据主权回归用户(Agent控制数据分享权限与定价)[10][11] - 技术本质是依赖倒置:平台需通过用户Agent获取许可,而非用户依赖平台访问信息,这一变革由AI算力成本下降驱动[11] AI思维与无人公司的应对策略 - 虚拟先行:商业Agent需在世界模型中与数百万模拟个人Agent预交互,验证价值主张与定价策略的算法适配性[13] - 规模化试错:通过生成数千种API接口和价值证明协议,快速测试主流个人Agent的接受度,试错成本趋近于零[13] - 算力对冲:企业投入算力模拟Agent集群行为,替代传统市场费用,未来护城河取决于对Agent生态的理解深度[14] 行业范式转移的核心结论 - AI驱动的冲突本质是市场主导权再分配,直接挑战平台中心化的数字经济秩序[3][15] - 未来竞争核心转为赢得用户Agent信任,商业交互频次与数据处理量级将推动智能组织和无人公司成为必然形态[15]
融资数千万美元,前B站副总裁创业:走出ICU,用户已超800万
搜狐财经· 2025-08-18 05:36
公司概况 - 心影随形由互联网资深人士Binson(刘斌新)于2023年4月创立,专注于AI陪伴型产品开发,创始人曾任职百度、360、B站等企业高管 [1] - 核心产品"逗逗游戏伙伴"定位为AI游戏陪玩桌宠,融合AI技术与二次元文化,测试阶段已获800万用户,入选2024年"全球50家最具潜力初创公司榜单" [1][3] - 公司累计完成四轮融资,总额达数千万美元 [1] 产品特性 - 产品实现跨场景智能陪伴,支持游戏攻略、情绪互动、工作学习等场景,采用VLM视觉大语言模型提升交互真实感 [9][31][33] - 游戏场景深度适配《英雄联盟》《原神》等热门游戏,提供BP建议、gank提醒、战后复盘等专业功能 [3][5][20] - 与老番茄、永雏塔菲等UP主合作开发虚拟角色,通过人格化设计增强用户情感连接,拒绝唤醒词以强化陪伴感 [7][25] 技术架构 - 基于开源模型进行多模态微调,针对游戏画面开发专用VLM模型,半年训练周期实现画面语义理解 [34][35] - 采用云端+本地混合数据处理架构,严格规避敏感信息,用户隐私数据仅以ID形式存储 [40][41] - 当前技术成熟度自评70分,目标实现AGI级陪伴体验,需突破长视频推理与环境感知能力 [30][37][38] 市场策略 - 优先垂直切入游戏场景,避免与通用AI产品直接竞争,通过"先做小再做深"构建壁垒 [47][71] - 日本市场表现突出,用户时长留存优于国内,归因于当地宅文化及社交压力差异 [42][43] - 商业化初期以角色皮肤、通话时长收费为主,未来规划B端广告分成占比超50% [44][45] 行业认知 - 判断AI陪伴需求将随社会孤独感加剧持续扩大,最终覆盖数亿用户规模 [39][67][68] - 行业竞争关键在于数据积累与情感连接,现有游戏内置AI助手难以实现跨场景支持 [47][49][50] - 多模态技术发展速度低于预期,但长期看好AI重构生产关系的变革潜力 [53][73] 创始人理念 - 坚持"工具是引子,情感是本质"的产品哲学,通过共同回忆建立用户与AI的情感纽带 [12][23][25] - 创业需把握技术信号提前布局,如2023年预判VLM价值并投入研发形成先发优势 [56][58][59] - 商业目标拒绝"小而美",认为优质产品必然走向规模化,参考中国游戏玩家6亿基数制定增长策略 [69][70][72]
“按需思考”的GPT-5引发争议,但这可能是AI的未来
财富FORTUNE· 2025-08-17 21:04
GPT-5发布引发的争议与挑战 - 用户强烈反对GPT-5的发布,认为其性能下降且失去原有模型的友好交互特性,演变为产品与信任危机 [1] - 核心问题在于GPT-5采用实时模型路由器调度多个子版本,而非单一模型,部分子模型性能较弱或成本更低,导致输出不一致 [1] - 行业评论家批评GPT-5"姗姗来迟、过度炒作、索然无味",开发者与用户对剥夺控制权表示愤怒 [1] OpenAI的应对措施 - 公司迅速为专业用户重新启用早期主力模型GPT-4o,并承诺修复路由故障、提高使用限额以重建信任 [2] - AI销售平台创始人评价路由技术"精准时像魔法,失灵时如系统崩溃" [2] 模型路由技术的现状与前景 - 路由技术面临固有挑战,如同一查询的不同部分可能被分发至多个模型,导致答案拼接时出现矛盾 [3] - 完善路由系统的难度堪比打造亚马逊级推荐系统,需多年时间与领域专家协作 [3] - 技术与经济双重因素推动路由技术成为常态:单体模型性能触及瓶颈,且路由可复用旧模型降低成本 [3][4] - 物理限制(如GPU内存瓶颈)阻碍模型规模扩大十倍,路由技术成为必要选择 [4] 行业对GPT-5及路由技术的评价 - 模型集成并非新概念,但GPT-5因公开路由系统且改进幅度微小引发用户不满 [5] - 官方文档显示GPT-5包含多个变体(标准版、高速版、思维版等),通过路由器自动调度 [5] - 行业认为从GPT-4到GPT-5的迭代缺乏跨越式提升,是用户不满的根源 [6] 关于AGI的讨论与争议 - GPT-5依赖多模型网络而非单体架构,引发对AGI过度炒作的批评 [6] - 专家指出全能型单体模型仍遥不可及,混合系统可逐步升级且降低成本 [6][7] - AI发展可能介于多模型组合与统一大模型之间,受工程成本、算力限制及商业压力影响 [7]
奥特曼的人设,塌在GPT-5
虎嗅APP· 2025-08-17 18:23
核心观点 - OpenAI CEO山姆·奥特曼关于AGI的表述前后矛盾,从强调重要性到否定术语价值,引发公众和投资人质疑 [7][8][15] - GPT-5发布过程中奥特曼的营销手法引发"狼来了"效应,Polymarket投票显示OpenAI支持率从75%暴跌至14% [9][10][14] - 奥特曼被曝存在系统性"撒谎信号"微表情,管理风格被前高管指控为"心理虐待"和资源操纵 [10][21][22] - OpenAI商业模式立场反复,从公开反对广告到探索广告收入,被类比为科技行业"Vaporware"现象 [16] - 行业竞争格局变化,Google、Anthropic、xAI等对手正在蚕食OpenAI技术领先优势 [25] 公司动态 领导层争议 - 董事会曾指控奥特曼未坦诚披露创业基金持股、提供不准确安全信息并在成员间制造矛盾 [21] - 前高管爆料其通过同一资源承诺制造团队内斗以巩固控制权,被描述为"心理虐待"式管理 [22] - 与马斯克决裂过程中展现政治手腕,通过关键人物站队促使马斯克退出 [22] 产品与技术 - ChatGPT用户数据表现亮眼:周活7亿(同比增4倍)、商业用户500万(6月为300万)、日均消息30亿条 [12] - GPT-5预热采用神秘主义营销但实际效果未达预期,被网友调侃"眩晕无力"宣传图 [11] - 技术路线从早期开源承诺转向封闭,内部讨论承认"不会纠正外界误解" [12] 商业模式 - 广告策略出现180度转变:从"最后手段"到探索"交易收入"可能性 [16] - 早期非营利定位吸引重量级支持,但实际运作偏离"反垄断"叙事 [12][16] 行业观察 竞争格局 - 注意力经济效应显著:即使Google模型更强,缺乏话题度仍难改变用户习惯 [13] - 多技术路线并存格局形成,Anthropic、DeepSeek等推动生态多元化 [25] 行业现象 - 高技术壁垒领域依赖创始人"人设背书",但信任坍缩速度远超技术迭代 [23] - "Vaporware"现象在AI行业重现,过度宣传与交付落差引发批评 [16] - 营销驱动创新模式受到质疑,行业呼吁回归技术本质 [25] 历史参照 - 对比乔布斯案例:奥特曼虽具"现实扭曲力场"但缺乏持续成功验证 [24] - 参照马斯克早期策略:技术领袖形象可帮助渡过产品验证期 [23]
谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代
36氪· 2025-08-17 16:44
Genie 3技术突破 - Genie 3是谷歌DeepMind开发的最先进世界模型,能够通过文本实时生成互动且高度一致的世界,分辨率为720p,帧率高达每秒24帧[1][6] - 该模型由Veo 2和Genie 2两个项目合作完成,具备长达一分钟的空间记忆能力,物理规律会随训练数据规模和深度提升[4][10][11] - 在生成视频时长、世界一致性、内容多样性和特殊记忆等方面实现突破,支持实时交互并提升真实感[6][8][12] 技术特性与比较 - 相比前代产品,Genie 3在分辨率(720p)、交互延迟(实时)、交互时长(多分钟)等关键指标上显著提升[7] - 特殊记忆功能表现突出,能保持场景元素的一致性,如角色刷墙后痕迹保留等超出预期的效果[10][11] - 采用逐帧生成方式而非显式表示法,增强了模型泛化能力和对多样世界的适应性[12][13] 应用前景 - 可用于创建游戏世界、训练强化学习智能体、机器人研究等领域[9] - 为机器人领域提供近乎无限的训练场景,突破现实数据采集限制[33] - 是世界模型通向通用人工智能(AGI)的关键一步,能让AI在丰富模拟环境中训练[6][25] 未来发展 - 未来将重点关注真实感和交互性的提升,计划开放Genie 3模型[26][31] - 当前与完全准确模拟现实世界仍有差距,特别是在场景自由度和真实感方面[27][28][29] - 量子计算机可能成为未来运行高级世界模拟的硬件平台[36]
奥特曼的人设,塌在GPT-5
虎嗅· 2025-08-16 19:03
核心观点 - OpenAI CEO山姆·奥特曼在AGI定义和GPT-5宣传上存在前后矛盾,引发公众和投资人质疑 [4][5][6] - 奥特曼被指存在"撒谎微表情",其营销风格导致用户信任度下降 [7][8][9][10] - OpenAI商业模式和承诺频繁变动,从反广告到考虑广告收入 [18] - 公司内部管理问题曝光,包括资源分配混乱和高管内斗 [25][26] - 行业竞争加剧,OpenAI领先优势被蚕食,面临Anthropic、Google等对手挑战 [34][36] AGI定义争议 - 奥特曼半年内对AGI重要性表述出现多次反转,从"AGI即将到来"到"AGI术语无用" [2][3][4] - 其关于AGI的表述刻意保留退路,如"传统意义上的AGI"而非明确承诺 [16][17] - 定义模糊化导致外界对OpenAI技术路线产生困惑 [5] GPT-5营销翻车 - 产品预热采用神秘化手法(如"眩晕无力"描述),最终效果未达预期 [10] - Polymarket投票显示OpenAI支持率从75%暴跌至14% [15] - 网友发现奥特曼谈论GPT-5时出现疑似撒谎的微表情(抬头动作) [7][8][9] 商业模式变动 - 从公开反对广告到考虑"点击交易收入"模式 [18] - 早期承诺"非营利性"和"开源"未兑现,实际保留代码所有权 [11] - 付费商业用户从6月300万增至500万,显示商业化加速 [12] 公司管理问题 - 董事会指控奥特曼未坦诚沟通,涉及基金所有权和安全流程信息 [23][24] - 被前高管批评采用"心理虐待"管理风格,制造团队内斗 [25][26] - 历史争议包括与马斯克决裂时利用理念分歧获取控制权 [28] 行业竞争格局 - ChatGPT周活用户达7亿但面临Google等对手技术追赶 [12][13] - 核心人才外流,xAI、Anthropic等竞争者崛起 [34] - 行业需要多元技术路线而非单一公司主导 [36][37] 创始人形象影响 - 品牌高度依赖个人形象,信任坍缩速度快于技术迭代 [31] - 与乔布斯类比显示"现实扭曲力场"但缺乏持续成功支撑 [32][33] - 早期YC时期已显现权力掌控特质 [29]
AI竞赛愈演愈烈,Meta六个月内第四次重组AI团队
凤凰网· 2025-08-16 17:21
Meta AI团队重组 - 公司计划全面重组人工智能工作团队 这是过去六个月内第四次全面改革 [1] - 新成立的超级智能实验室将被分为四个小组:TBD实验室 产品团队 基础设施团队 基础人工智能研究(FAIR)实验室 [1] - 超级智能实验室于7月初成立 整合原有AI业务 目标开发超越人类能力的AI系统并推动通用人工智能(AGI)研究 [1] - 实验室由Alexandr Wang担任首席人工智能官 Nat Friedman担任联合负责人 [1] Meta在AI领域的战略布局 - 公司近期动作频繁 表明其正全力以赴加快通用人工智能研发 [2] - 计划斥资数千亿美元建设多个大型人工智能数据中心 [2] - 邀请PIMCO和Blue Owl Capital牵头为路易斯安那州数据中心扩张提供290亿美元融资 [2] - 以巨额薪酬在硅谷"挖角"招聘其他公司AI研究人员 [2] - 将年度资本支出预测下限上调20亿美元至660-720亿美元 [2] - 数据中心建设成本和员工薪酬成本上升将推动2026年费用增长率超过2025年 [2]
麻省理工大学:《通往通用人工智能之路》的研究报告
通用人工智能(AGI)发展现状 - AGI定义为实现经济价值领域超越人类的全自主系统 但专家认为需涵盖更广的智能维度如适应性重组能力[4] - 当前AI在专业领域(药物发现 代码编写)表现优异 但解决基础谜题能力远逊人类 显示认知鸿沟[2] - 最先进大型语言模型在ARC-AGI-2基准测试得分为0% 而人类接近满分 凸显适应性缺陷[4] AGI实现时间表加速 - GPT出现前AGI预测需80年 GPT-3发布后缩短至50年 2024年底预测进一步骤降至5年[3] - 行业领袖预测: Anthropic联合创始人认为"强大AI"可能2026年出现 具备跨界面自主推理能力[3] - 综合预测显示50%概率2028年前实现多项AGI里程碑 2047年机器全面超越人类概率达50%[4] 技术瓶颈与突破路径 - 计算能力需求: AGI可能需要超10^16 teraflops 2037年计算成本或超美国GDP[5] - 深度学习时代计算量翻倍时间从21个月缩短至5.7个月 需转向高效异构计算架构[5][6] - 硬件创新需结合CPU/GPU/NPU/TPU 配套软件工具实现跨平台代码运行[7] - 根本性障碍在于智能定义本身 需突破概率图谱技术基础 寻求类似Transformer的架构革命[7][8] 智能本质的重新定义 - 需建立超越人类成就的新框架 纳入流体智能/社交智能/具身智能等维度[8] - 智能被重新定义为"有效重组已知事物解决新问题的能力" 当前AI缺乏此核心特质[4] - 视觉感知/精细运动/创造力/情感互动等8项人类能力仍是AI显著短板[5] 行业生态发展趋势 - OpenAI CEO认为AGI将引发堪比电力/互联网的社会变革 创造超指数级社会经济价值[3] - 实现路径需硬件/软件/算法/定义的四重革命 形成统一生态系统[8][9] - 麦肯锡数据显示当前AI在色彩一致性/上下文理解/同理心等方面存在明显不足[5]
DeepMind CEO定义世界模型标准:不仅理解物理世界,还能创造它
36氪· 2025-08-14 09:57
DeepMind技术突破与战略布局 - 公司近期密集发布包括Deep Think、Genie 3等约50个项目,研发节奏显著加快,成果覆盖数学奥赛金牌、世界模型生成等领域 [3] - 世界模型Genie 3实现突破性进展,生成虚拟世界具备物理一致性(如水流、倒影等),验证了底层物理理解能力 [1][8][9] - 终极目标是开发融合语言、多媒体、物理推理的"全能模型"(Omni Model),推动AGI安全落地 [2][18] 思考型模型与AGI演进路径 - "思考型模型"通过叠加规划能力实现多路径并行推演与自我修正,是AGI核心路径 [3][4][7] - 模型能力呈现"参差型智能":可生成完整虚拟宇宙但可能在国际象棋中违规,反映推理与一致性短板 [1][12] - 早期游戏AI(如AlphaGo)奠定智能体系统基础,当前多模态模型已扩展至语言、物理等多领域 [3][7] Genie 3的应用前景 - 作为训练平台:支持AI智能体(如SIMA)在生成世界中执行任务,创造无限训练数据 [10] - 娱乐创新潜力:可能催生电影与游戏融合的新形态,公司透露长期布局游戏领域计划 [10][21] - 科学价值:生成世界的物理一致性为现实本质研究提供新视角 [11] 行业技术挑战与评测体系 - 现有评测基准(如AIME数学测试)接近饱和(Deep Think达99.2%),需开发覆盖物理直觉、安全性等的新评估体系 [13] - "游戏竞技场"成为重要评测场景,延续游戏AI传统优势,未来或引入AI自创游戏对战 [13] - 工具调用能力成为新扩展维度,需经验性平衡内化能力与外部工具使用(如数学程序、搜索引擎) [15][16] 开发者与产品化方向 - 建议开发者聚焦高价值工具构建,产品设计需预判1年后技术状态并支持3-6个月重大更新 [17] - 模型向系统进化:工具调用与规划能力结合可能带来指数级能力扩展 [17] - 网络生态将因智能体系统灵活使用工具发生根本性变革 [18]