通用人工智能(AGI)
搜索文档
前OpenAI研究员如何将一则爆红网络的AI预言变现?
财富FORTUNE· 2025-10-23 21:04
利奥波德·阿申布伦纳曾是OpenAI的一名研究员,他发表过一篇关于AI未来的宣言式文章并在网络爆红,随后他将这 份文件的核心观点转化为一家对冲基金的投资理念,目前该基金的资产管理规模超过15亿美元。图片来源:Josh Edelson courtesy of Situational Awareness 在当下这场席卷全球的AI热潮中,鲜有故事比利奥波德·阿申布伦纳的经历更引人注目。 这位23岁年轻人的职业生涯开局并不顺利:他曾在萨姆·班克曼-弗里德现已破产的FTX加密货币交易所 的慈善部门工作,之后在AI领域最具影响力的公司之一OpenAI度过了颇具争议的一年,并最终被解 雇。然而,在被该公司辞退仅两个月后,阿申布伦纳撰写了一份AI宣言,引发网络热议,美国总统唐 纳德·特朗普的女儿伊万卡甚至都在社交媒体上为其点赞。随后,他以这份宣言作为跳板,创立了一家 对冲基金,如今该基金的资产管理规模超过15亿美元。按照对冲基金的标准,这家基金规模一般,但对 于一个刚刚大学毕业的年轻人而言却堪称传奇。从哥伦比亚大学(Columbia)毕业仅四年,阿申布伦纳 就已经能与科技公司CEO、投资者和政策制定者私下里侃侃而谈,被他们视 ...
Meta大裁员,华人大佬田渊栋被裁了?!Alexandr Wang “嫡系”部门还在重金招聘
AI前线· 2025-10-23 12:12
Meta 首席 AI 官 Alexandr Wang 在备忘录中写道:"通过缩减团队规模,决策所需的沟通会更少,每个人都会承担更多责任,拥有更大的发挥空间和影 响力。" Wang 表示,美国员工将在太平洋时间早上 7 点前得知是否受影响。公司鼓励被裁员工申请内部其他职位,并预计其中大部分人能够在 Meta 内部重新 上岗。"这是一群极具天赋的同事,我们在公司其他部门仍然非常需要他们的能力。" 随后,华人 AI 科学家田渊栋在推特上发帖称,"今天,我和我的几位团队成员都受到了此次裁员的影响。欢迎联系我们 :)" 整理 | 褚杏娟 据 Axios 报道,Meta 内部人士透露,Meta 正在从其 AI 部门裁撤数百个岗位。 此次,Meta 将在其"超级智能实验室"内裁减大约 600 个岗位,该实验室目前共有数千名员工。裁员将涉及 FAIR(Fundamental AI Research)研究部 门、与产品相关的 AI 团队,以及 AI 基础设施团队,但不会波及新成立的 TBD Lab,甚至仍在积极招聘。 根据内部备忘录,Meta 认为其长期以来的 AI 团队已经变得过于官僚,希望通过这次组织调整,让团队运转更加高 ...
重磅应用密集上线,同时“硬刚”谷歌、亚马逊和Meta,OpenAI急了?今年要“烧”85亿美元
36氪· 2025-10-23 09:35
"这是一个以ChatGPT为核心、由人工智能驱动的浏览器。" 10月22日,OpenAI首席执行官山姆·奥尔特曼(Sam Altman)通过在线直播,正式发布了该公司首款AI浏览器ChatGPT Atlas。这款产品旨在为用户提供更 个性化、更具颠覆性的上网体验,并能代替用户执行预订、填表等一系列复杂任务。 此举被市场解读为OpenAI首次从应用层"杀入"互联网终端,正式"硬刚"谷歌Chrome在浏览器领域长达十余年的霸主地位。消息传出,谷歌母公司股价在 周二盘中一度跌近5%。 不过,ChatGPT Atlas也面临着质疑之声。有评论指出,Atlas可能是OpenAI为"截胡"谷歌潜在新品而推出的"半成品"。其智能体模式在执行复杂任务时, 速度和准确性也有待提升。 据OpenAI介绍,Atlas浏览器的核心功能深度整合了其强大的AI能力—— 上下文聊天侧边栏:用户可以在浏览任何网页时打开侧边栏,与ChatGPT 进行对话,让ChatGPT利用该页面的上下文来回答查询,无需离开当前页面。例 如,用户可以直接在Gmail页面上要求ChatGPT优化邮件措辞。 近期,OpenAI动作频频。就在10月初,OpenAI ...
重磅应用密集上线,同时“硬刚”谷歌、亚马逊和Meta,OpenAI急了?
每日经济新闻· 2025-10-22 22:12
产品发布与市场影响 - OpenAI于10月22日正式发布首款AI浏览器ChatGPT Atlas,该产品被定义为以ChatGPT为核心、旨在提供更个性化和颠覆性的上网体验,并能代替用户执行预订、填表等复杂任务[1] - 此举动被市场解读为OpenAI首次从应用层进入互联网终端,直接挑战谷歌Chrome的霸主地位,导致谷歌母公司Alphabet股价在消息传出后周二盘中一度下跌近5%[1][2][3] - 为打造此产品,OpenAI组建了包括前Chrome工程师达林・费舍尔和曾参与Chrome与Firefox开发的本・古杰尔在内的明星团队[3] 产品核心功能 - Atlas核心功能包括上下文聊天侧边栏,允许用户在任何网页上与ChatGPT对话,利用页面上下文回答查询而无需离开当前页面[4] - 浏览器记忆作为可选功能,开启后ChatGPT能记住用户浏览过的网站和内容关键细节,以提供更个性化和上下文关联的回答,此功能为用户账户私有且用户拥有完全控制权[4][5] - 智能体模式是核心竞争力,允许ChatGPT在获得用户授权后直接在浏览器中代替用户执行操作,如自动下单购物或同步协作软件任务,该功能目前仅以预览版形式向付费用户开放,Plus订阅用户每月任务限制为400次[5] 产品面临的挑战与竞争环境 - Atlas目前仅支持搭载M系列芯片的Mac电脑,将Windows和手机用户暂时排除在外[6] - 有评论指出Atlas可能是为“截胡”谷歌潜在新品而推出的“半成品”,其智能体模式与数月前发布的ChatGPT Agent功能类似,且侧边栏总结等功能在竞品如Perplexity的Comet浏览器中已有实现[6] - 智能体模式在执行复杂任务时速度和准确性有待提升,被独立研究员形容为“看着一个第一次使用电脑的人煞费苦心地学习使用鼠标”,并提及相关安全和隐私风险仍高[7] - 全球AI浏览器市场规模预计将从2024年的45亿美元增长至2034年的约768亿美元,市场竞争激烈,已有Perplexity的Comet、微软Edge的Copilot模式、Opera的Aria等产品,谷歌也计划将Gemini模型深度集成到Chrome中[9][10][11] - 截至2025年9月,谷歌Chrome在全球桌面浏览器市场份额约70.25%,微软Edge排名第二,市场份额为11.8%[11] 公司战略与商业化动力 - OpenAI首席执行官山姆·奥尔特曼认为人工智能为重新思考浏览器意义提供了十年一遇的机会,Atlas的终极目标是让用户从手动操作网页转向告诉AI做什么,使浏览器从被动内容展示窗口演变为主动服务平台[7] - 通过打造浏览器,公司旨在获取完整用户上下文为通用人工智能积累数据,并将每周活跃用户数超8亿的ChatGPT用户更紧密地绑定在自身生态内,直接掌握流量入口为未来商业化铺路[8] - 独立分析师本尼迪克特·埃文斯表示这是一场分发战略和数据收集战略,投资银行D.A. Davidson分析师吉尔·卢里亚认为集成聊天功能到浏览器是公司切入广告业务的先兆,可能从谷歌夺取搜索广告份额[8][12] - 公司在10月初48小时内接连推出“即时结账”功能和独立社交应用Sora App,挑战亚马逊和Meta,10月中旬又宣布ChatGPT将“解禁”成人内容,显示出在巨大财务压力下加速向盈利导向的商业巨头转型[13][14][16] - 尽管2025年上半年营收达43亿美元,但同期研发支出激增至67亿美元,预计今年现金消耗将高达85亿美元,公司设定了尽快实现130亿美元年收入的短期目标[14] - 德意志银行数据显示欧洲用户对ChatGPT支出出现停滞,过去四个月订阅服务在欧洲主要市场保持平稳,尽管每周活跃用户达8亿,但仅2000万为付费用户,自5月起欧洲消费者支出已停滞[17]
重磅应用密集上线,同时“硬刚”谷歌、亚马逊和Meta!OpenAI急了?今年要“烧”85亿美元
每日经济新闻· 2025-10-22 21:52
产品发布与市场反应 - OpenAI于10月22日正式发布首款AI浏览器ChatGPT Atlas,该产品被定义为“以ChatGPT为核心、由人工智能驱动的浏览器”,旨在提供更个性化、颠覆性的上网体验,并能代替用户执行预订、填表等复杂任务 [1] - 此举被市场解读为OpenAI首次从应用层进入互联网终端,直接挑战谷歌Chrome的霸主地位,消息导致谷歌母公司Alphabet股价在周二盘中一度下跌近5% [3][4] - 市场调研机构Market.us预测,全球AI浏览器市场规模将从2024年的45亿美元增长至2034年的约768亿美元 [12] 产品核心功能 - 上下文聊天侧边栏:用户可在浏览任何网页时与ChatGPT对话,AI能利用当前页面上下文回答查询,例如直接在Gmail页面上优化邮件措辞 [6] - 浏览器记忆:此为可选功能,开启后ChatGPT能记住用户浏览过的网站和内容关键细节,以提供更个性化的回答,该记忆功能为用户账户私有,用户拥有完全控制权 [6] - 智能体模式:该功能是Atlas的核心竞争力,允许ChatGPT在获得用户授权后,直接在浏览器中代替用户执行操作,如根据食谱自动在生鲜电商平台下单,目前仅以预览版形式向ChatGPT Plus、Pro和Business等付费用户开放,Plus用户每月任务限制为400次 [7] 产品局限性与市场竞争 - Atlas目前存在平台限制,仅支持搭载M系列芯片的Mac电脑,将Windows和手机用户暂时排除在外 [9] - 有评论指出Atlas可能是为“截胡”谷歌潜在新品而推出的“半成品”,其智能体模式在执行复杂任务时的速度和准确性有待提升 [3][9] - AI浏览器市场竞争激烈,初创公司Perplexity于今年7月推出Comet浏览器,微软Edge浏览器更新了Copilot模式,Opera推出了AI助手Aria,谷歌也计划将Gemini模型更深度集成到Chrome中以实现类似智能体功能 [12][13] - 截至2025年9月,谷歌Chrome在全球桌面浏览器市场份额约70.25%,微软Edge排名第二,市场份额为11.8% [13] 公司战略与商业化压力 - OpenAI首席执行官山姆·奥尔特曼表示,人工智能为重新思考浏览器的意义提供了一个十年一遇的机会,Atlas的终极目标是让用户从“手动操作网页”转向“告诉AI做什么” [10] - 通过打造自己的浏览器,OpenAI旨在获取完整的用户上下文,为打造通用人工智能积累数据,并将每周活跃用户数已超8亿的ChatGPT用户更紧密地绑定在自身生态内,直接掌握流量入口,为未来商业化铺平道路 [11][16] - OpenAI正面临巨大的财务压力,尽管2025年上半年营收达43亿美元,但同期研发支出激增至67亿美元,预计今年现金消耗将高达85亿美元,公司设定了尽快实现130亿美元年收入的短期目标 [17][18] - 近期OpenAI动作频频,包括在ChatGPT上线“即时结账”功能挑战亚马逊电商业务、推出独立社交应用Sora App挑战Meta、以及计划在2025年12月对成年用户“解禁”成人内容,这些被视为在财务压力下加速商业化转型的关键举措 [3][17][20]
OpenAI掌舵人三年演讲梳理:一文读懂Altman
虎嗅· 2025-10-22 18:05
公司战略与核心信念 - 公司的终极使命是构建通用人工智能(AGI),并将其视为继农业革命、工业革命和计算机革命之后最重大的技术变革[11] - 公司坚决反对秘密研发超级智能后突然发布,一贯主张“迭代部署”策略,即逐步发布能力更强的模型,让社会有时间适应、理解并共同制定规则[11] - 公司认为计算能力是未来AI发展的核心瓶颈和最宝贵资源,将其视为“新世界的货币”,并以此解释其大规模基础设施投资计划[14] - 公司战略从软件扩展到智能体和硬件,认为未来的AI交互范式是能主动执行任务的“智能体”,并需要全新的硬件载体[14] - 公司从“非营利”转向“有限盈利”结构是出于现实的资金需求,因为构建AGI所需的庞大算力规模使得非营利结构无法筹集足够资金[14] 技术发展与产品演进 - 公司最新的视频模型Sora 2实现了从“文本到视频”到“现实与虚拟融合”的跨越,扩展了AI视频创作的边界,使其成为强大的“后期合成与世界模拟”工具[10] - ChatGPT正朝着“AI操作系统”演进,通过APP SDK、AgentKit和Codex构建最重要的基础设施[10] - 公司与AMD达成一项数十亿美元的战略合作,以部署其下一代AI芯片,此前已与Nvidia、Oracle、三星和SK海力士等公司合作推进AI基础设施建设[10] - 公司对AGI的定义从早期模糊的“通过图灵测试”演变为更具体的“当一个系统能够自主发现新的科学知识时,对我来说就是超级智能”,将AGI视为加速科学进步的引擎[14] - 公司预测GPT-5相较于GPT-4的提升将如同GPT-4相较于GPT-3一样巨大,并预测到2027年底大多数人会同意已出现由AI驱动的重大新发现[14] 行业影响与未来走向 - 公司引领的AI竞争已深入到产业链最底层,未来的竞争是涵盖芯片设计、供应链管理、能源获取和全球数据中心布局的全方位工业竞赛[23] - 未来最有价值的AI人才将是能够将AI推理能力与特定科学领域(如生物、材料、物理)知识相结合的“跨界人才”[23] - 随着公司将“科学发现”设定为AGI的里程碑,“AI+科学”将成为下一个投资热潮,资本和人才将涌入利用AI进行药物研发、新材料探索和基础物理研究等领域[23] - 公司未来将深度介入芯片和系统设计,打造专为自家模型优化的“全栈系统”,使“软硬件协同设计”成为其核心竞争力[23] - 未来的GPT模型将不仅仅是生成文本或图像,而是作为一种“推理即服务”对外提供,鼓励开发者和企业利用该能力解决科学、工程等领域的复杂问题[23] 商业模式与沟通策略 - 公司CEO多次表达对广告驱动商业模式的厌恶,认为这会扭曲产品激励机制,坚持ChatGPT应通过订阅和API调用收费以确保为用户提供最佳答案[14] - 公司CEO自陈其身份从“研究者”到“消费产品CEO”的转变是“意外”,原本意图是运营一个AGI研究实验室而非一家大型消费互联网公司[14] - 公司CEO在沟通中擅长用宏大使命叙事包裹激进商业和技术战略,其言论具有高度一致性的长期愿景,总能回归“构建AGI并造福人类”的核心使命[8][22] - 公司CEO在多次访谈中坦诚面对不确定性,频繁使用“我不知道”“这很难”等词语承认认知局限,这种脆弱性表露增加了其言论的真实感[22] - 公司CEO的沟通策略存在内在矛盾,一方面呼吁政府加强监管防止AI失控,另一方面又以极快速度推进技术,承认严格监管可能扼杀创新[17]
OpenAI AI浏览器硬刚谷歌;华为招募顶尖AI人才
21世纪经济报道· 2025-10-22 10:58
人工智能与软件服务 - OpenAI推出AI浏览器ChatGPT Atlas,深度集成AI功能,挑战谷歌核心业务,导致谷歌母公司Alphabet股价盘中一度下跌近5%,最终收跌2.21% [2] - 微软宣布Windows 10支持终止,全面转向以AI功能为核心的Windows 11,并推出AI优化的Copilot+ PC硬件 [8] - 谷歌云平台正式商用Google Cloud G4 VMs,由英伟达RTX PRO 6000 Blackwell GPU支持,用于AI应用开发和物理AI工作负载 [13] 半导体与硬件技术 - 三星和SK海力士将提前展示HBM4内存,三星采用1c纳米工艺,SK海力士采用1b DRAM,形成差异化竞争 [12] - 苹果折叠屏iPad因技术瓶颈可能推迟至2029年或更晚上市,原计划2028年推出,预计售价约3000美元 [9] - 脑机接口公司Science Corporation宣布Prima视网膜植入物临床试验成功,首次让因感光细胞丧失而失明的患者恢复视力 [6][7] 企业战略与人才发展 - 华为启动全球AI人才招募计划,目标打造通用人工智能(AGI),为2025至2026年毕业生提供有竞争力的薪酬和计算资源 [4] - 微软CEO萨提亚·纳德拉2025年总薪酬为9650万美元,其中包括8420万美元的股票奖励 [5] 储能与数据中心 - 宁德时代加快587Ah储能专用电芯量产速度,以满足国内快速增长的市场需求,未来该产品出货占比将逐步提升 [10] - 普洛斯常熟东南数据中心二期项目实现100%签约,将支持一家头部互联网企业的大规模智算项目 [11] 资本市场与融资动态 - 中国电信2025年第三季度归属于上市公司股东的净利润为77.56亿元,同比增长3.60% [14][15] - 九识智能完成由蚂蚁集团领投的1亿美元B4轮融资,B轮融资总额达4亿美元,资金将用于无人驾驶技术研发和全球市场拓展 [16] - 纳芯微获得中国证监会备案,拟发行不超过4097.69万股H股在香港联交所上市 [17] - 中智科仪完成超亿元人民币A轮融资,资金将用于加码研发、拓展场景和强化服务 [18] 消费科技与创新应用 - 京东科技与Rokid合作发布全球首款智能眼镜购物应用JoyGlance,实现“所见即购买”,预计11月亮相,明年1月上线支付功能 [19]
哈佛&MIT:AI能预测,但它还解释不了“why”
36氪· 2025-10-22 08:56
研究背景与核心问题 - 哈佛与MIT的研究旨在探究大语言模型是否能构建“世界模型”,而非仅进行下一个词的预测 [1] - 实验选择轨道力学作为测试场景,因其在科学史上具有代表性,可类比于AI重演开普勒发现并测试其是否学会牛顿力学 [2] - 研究关注“预测与解释脱节”这一现代AI模型的根本性局限 [4] 实验设计与方法 - 研究使用1000万个模拟太阳系坐标序列(总计200亿个token)训练一个1.09亿参数的小型Transformer模型 [1][4] - 实验设计核心是检验模型预测行星运动时,是否会利用牛顿定律还是仅依赖“特定情境的经验法则” [4] - 后续测试还扩展到当前最先进的大语言模型以及“晶格问题”和“黑白棋”等其他场景 [9][10] 主要研究发现 - AI模型能精准预测行星轨迹,预测结果几乎完美,但其推导的受力向量杂乱无章,与牛顿定律毫无关联 [4][6] - 模型并未编码出牛顿定律的世界模型,而是依赖无法推广到其他情况的经验法则 [4][6] - 当使用新的银河系样本数据测试时,模型会编码出完全不同的另一套错误的“受力定律”,错误并不一致 [7][8] - 最先进的大语言模型同样表现出精准预测与错误解释脱节的问题,即便训练数据中已包含牛顿定律 [9] 对AI行业发展的启示 - 研究结果表明当前形态的LLM不足以实现真正的科学发现,其泛化能力仅限于“所熟悉的东西,或与所熟悉的东西相像的东西” [9][11] - AI未来发展需结合“晶化智力”(已有知识技能)与“流动智力”(经验迁移能力),而非单纯追求模型规模扩大 [12] - 行业需探索新方法(如Yann LeCun的JEPA框架)让AI掌握构建世界模型的能力,从“预测机器”进阶为能理解世界运行逻辑的“思考者” [12][14] - 科学的核心问题——精准预测与理解事物运行的“为什么”——将是AI未来需要攀登的高峰 [12][13]
AI大家说 | 哈佛&MIT:AI能预测,但它还解释不了“why”
红杉汇· 2025-10-22 08:06
实验核心发现 - 哈佛与MIT的实验表明,当前AI模型在预测行星轨迹时,虽能达到高精度,但并未编码出如牛顿定律般的“世界模型”,而是依赖特定情境的经验法则[3][8] - 模型预测的受力向量与真实的万有引力定律毫无关联,且其错误模式在不同测试样本(如不同银河系)中不一致,说明其无法构建稳定的、可推广的定律体系[10] - 该“预测与解释脱节”的缺陷在“晶格问题”和“黑白棋”等其他测试场景中同样存在,模型仅根据“下一个token可能性”对状态进行分类,而非理解底层规律[11] 实验设计与背景 - 研究选择轨道力学作为测试场景,因其在科学史上具代表性,旨在观察AI是否能重演从开普勒(经验规律)到牛顿(深层原理)的科学发现过程[4][5] - 实验使用1000万个模拟太阳系坐标序列(总计200亿个token)训练一个1.09亿参数的小型Transformer模型,以探究其预测逻辑[3][8] - 研究将AI模型统称为“基础模型”,其核心是数据驱动的“输入-预测输出”映射,与能刻画数据隐含状态结构的“世界模型”存在本质区别[6] 对AI行业发展的启示 - 研究结果并非否定AI价值,但指出以当前形态,大语言模型尚不足以实现真正的科学发现,需探索新路径[12][13] - 行业未来发展的一种思路是结合“晶化智力”(已有知识)与“流动智力”(经验迁移能力),例如通过JEPA框架等新方法进行探索[13] - 行业需共同解答的核心命题是如何让AI从“预测机器”进阶为能理解世界运行逻辑的“思考者”,这决定了AI在科学史上的最终地位[14]
合合信息推出多模态文本智能技术落地方案,助力AI实现智能推理
21世纪经济报道· 2025-10-21 16:29
行业发展趋势 - 多模态大模型正成为人工智能发展的重要方向,其利用文本、图像、音频、视频等多种信息形式进行表达、理解和交流 [1][4] - 根据2025年Gartner人工智能技术成熟度曲线,多模态AI将在未来五年内成为各行业提升所有应用和软件产品功能的核心技术 [4] - 行业对AI系统的需求正从“功能实现”向“业务赋能”深化,旨在推动AI系统从辅助工具进化为具备自主决策能力的业务伙伴 [15] 技术突破与创新 - 合合信息推出“多模态文本智能技术”方案,通过文本相关空间位置理解深层语义逻辑,实现对多模态信息的“立体化综合化理解” [3] - 哈尔滨工业大学车万翔教授分享“多模态思维链”技术,将推理逻辑分解为一系列可解释的跨模态推理步骤,以生成更精准可靠的结论 [4] - 南开大学周宇教授介绍系统化的OCR幻觉缓解方案,为提升多模态大模型的可视文本感知能力提供有效路径 [4][8] - 技术方案将文本智能认知程度从语义理解拓展到类人推理及自主机器决策,形成从感知到认知再到决策的技术实现路径 [15] 应用场景与案例 - 小红书hi lab团队分享基于单视觉语言模型的多语言文档布局解析工具“dotsocr” [9] - 华中科技大学刘禹良教授介绍首个覆盖甲骨文专家破译全流程的辅助考释框架AlphaOracle,在“劳”等字的辅助破译上取得突破 [11][12] - 合合信息文本智能技术帮助用户解决复杂场景下的文档图像问题,方案已在金融、医药、教育等专业领域开展应用 [8][15] - 技术方案处理对象从传统文档延伸至多种承载文本信息的媒介,如论文、财报、视频、自然场景,实现对业务流程的智能重构 [14][15]