Atlas浏览器
搜索文档
速递 | 炸了!40亿Chrome用户连夜升级,AI浏览器的生死战已打响
未可知人工智能研究院· 2026-02-01 12:07
文章核心观点 - 谷歌将Gemini 3全面集成进Chrome浏览器,标志着全球近40亿用户迈入AI浏览器时代,这不仅是产品升级,更是互联网入口控制权的关键争夺战[1][4] - 此次变革的核心是从“人找信息”的搜索模式转向“AI代办事项”的Agent模式,AI成为能主动执行复杂任务的助手[4][25] - 行业正处于从传统浏览器/搜索引擎向AI原生入口演变的第三次互联网大战窗口期,今明两年是布局关键[10][26] Gemini 3集成Chrome的细节与意义 - 集成方式为在Chrome右侧新增侧边栏,使Gemini 3能随时响应,并推出“自动浏览”功能,AI可自主浏览网页、点击、填表以完成任务[4] - 此次集成实现了AI与Gmail、日历、YouTube、地图等谷歌生态的闭环连接,提升了办事效率[4] - 这代表了“Agent时代”的开启,AI从问答工具转变为主动助手[4] 谷歌的战略动机与时机 - 直接原因是对抗竞争对手:OpenAI的Atlas、Perplexity的Comet等AI原生浏览器的出现,对传统搜索构成威胁。数据显示,Gemini 3发布后,OpenAI流量下降了6%[8] - 核心商业考量是重构商业模式:谷歌2025年广告收入约2000多亿美元,AI直接提供答案将冲击搜索广告模式,因此需转向AI服务订阅与增值[9] - 本质是入口控制权之争:继浏览器、搜索引擎之后,AI浏览器是第三次互联网入口大战,谷歌需守住Chrome近70%的市场份额(约38亿用户)这一基本盘并卡位新赛道[8][10] - 行动迅速以展示决心:Gemini 3发布仅两个月后即接入Chrome,并选择在春节前、Q1财报前的时间窗口,旨在向市场快速展示投资回报[10] 对市场格局的影响:受益方与受损方 - **主要受益方**: 1. **谷歌自身**:股价在近两个月内上涨约20%[12] 2. **AI Agent生态创业公司**:浏览器AI化将催生对垂直行业Agent、企业级权限管理、多Agent协同等配套服务的需求[12] 3. **云基础设施厂商**:AI浏览器导致用户高频调用大模型,算力需求激增,AWS、Azure、阿里云等云厂商将受益[12] - **主要受损方**: 1. **AI浏览器创业公司**:如Arc、Comet等,面临Chrome凭借巨大流量优势的降维打击[13] 2. **传统搜索引擎与导航网站**:AI直接提供答案和办事能力,将严重分流其流量[13] 3. **OpenAI**:其通过Atlas浏览器切入Web入口的战略,受到Chrome存量用户的直接冲击[13] 国内市场的应对与差异化路径 - **必然跟进**:百度、腾讯、阿里等国内大厂已在内部测试浏览器AI化方案[16] - **差异化玩法**:国内路径可能不同于谷歌,当前重点在“AI群聊”模式,例如百度的文心App、腾讯的元宝、阿里的UC浏览器测试让多个AI Agent协同工作,这本质是AI浏览器的变体[17] - **独特优势**:国内拥有微信、支付宝、抖音等超级App,若接入AI Agent能力,其作为入口的杀伤力可能超过传统浏览器,实现生态内闭环服务[18] - **预期打法**:国内大厂可能采取“浏览器AI化”与“超级App AI化”双线并进的策略,预计今年上半年将有重大动作[18] 潜在的投资与创业机会 - **创业者可关注的细分赛道**: 1. **垂直行业AI Agent**:需要深度行业知识的场景,如法律、医疗、销售分析等[20] 2. **企业级多Agent协同平台**:解决大企业内多个AI Agent的通信、权限管理与数据安全等基础设施需求[20] 3. **AI应用层工具**:如管理AI订阅、监控AI使用成本、AI生成内容版权确权等工具[21] - **普通人的机会**: 1. **提升效率**:利用AI浏览器处理收集信息、分析数据、生成初稿等重复性工作,实现效率倍增[22] 2. **转变思维**:未来的竞争力在于“管理AI”而非“被AI替代”,将创造性工作留给自己[23]
深度|OpenAI产品经理谈Codex爆发式增长背后的AI协作:实现AGI级生产力的真正瓶颈是人类的打字速度!
Z Potentials· 2026-01-19 11:02
文章核心观点 - OpenAI的Coding Agent产品Codex自2024年8月ChatGPT5发布以来,规模已增长20倍,目前每周处理数万亿个字符,成为公司最核心的代码生成模型 [3][19] - Codex的愿景不仅是辅助编写代码,更是成为软件工程团队中具备“主动性”的协作伙伴,旨在无缝融入工作流,极大提升人类工作效率 [9][17][28] - 当前AI发展的一个关键瓶颈并非模型能力,而是人类与模型交互时的物理和认知限制,如打字速度和多任务处理能力 [9][76] - OpenAI通过自下而上、高度灵活的组织结构,以及产品与研究的深度融合,实现了Codex等产品的爆炸式增长和快速迭代 [10][12][19][27] OpenAI的组织与运营模式 - OpenAI的组织结构强调自下而上,赋予团队高度自主性和灵活性,以快速尝试和适应不确定的技术与市场环境 [12] - 公司擅长讨论一年或更久之后的长期愿景,但对于数月内的战术性目标,更倾向于通过实证探索来解决,采取“准备、开火、瞄准”的模糊目标策略 [13] - 这种高速发展依赖于汇聚全球顶尖的精英人才,其个体驱动力和自主性构成了组织模式的基石,难以被简单复制 [14] Codex的产品定位与爆发式增长 - Codex是OpenAI的Coding Agent,可作为IDE扩展或终端工具安装,用于回答代码问题、编写、运行测试及处理软件开发生命周期中的多项工作 [15] - 产品定位是成为软件工程团队的“团队成员”,未来将参与从早期创意规划到后期验证、部署和维护的全过程,而不仅限于代码自动补全 [15][18] - 增长关键源于产品形态的调整:从部署门槛较高的云端异步产品(Codex Cloud),转向与开发者日常工具深度整合的本地交互式产品,降低了用户使用门槛并建立了高效的反馈循环 [21][22][23] - 内部试用与市场反馈存在差异,公司内部因熟悉与模型交互而能高效使用异步模式,但普通用户更需要符合直觉的交互方式 [24] 技术栈协同与能力提升 - Codex能力的提升是模型、API和工具环境三个技术栈层面协同优化、并行推进的结果 [25][27] - 最新模型GPT 5.11 CodexMax在执行效率上比前代提升约30%,并解锁了更强的智能和推理能力,能够解决极其棘手的漏洞 [24] - 通过“上下文压缩”等技术,使模型能够长时间持续运行(如通宵或24小时),这需要模型、API接口和工具环境三者的协同支持 [26] - 公司专注于让模型通过命令行界面在沙箱环境中运行,这种针对特定模式的深度优化加速了研发进度 [27] 实际应用案例与效率提升 - Codex助力Sora团队在18天内完成了Sora安卓应用从0到1的开发,并在总共28天内实现公众发布,该应用随后成为App Store排名第一的应用 [47][48][49] - 在Atlas浏览器项目中,以前需要两三名工程师花费两三周的任务,现在一名工程师一周即可完成,效率提升显著 [52][54] - 产品应用已超越工程部门,设计团队使用Codex快速制作动画原型,产品营销人员可直接在Slack上修改文案,体现了“压缩人才层级”的趋势 [46][53] - Codex被用于编写一次性代码,如快速构建交互式数据查看器,推动了代码的普及化应用 [46] 对AI发展、编程及未来工作的看法 - 构建任何Agent的本质都应是构建Coding Agent,因为模型使用计算机的最佳方式就是编写代码 [9] - 未来岗位界限将变得模糊,自然语言成为新的、灵活性极高的抽象层级,但技术的抽象层级提升将是渐进式的 [55] - 在AI时代,对目标用户需求的深度洞察比单纯的技术执行力更为重要,这更有利于垂直领域的AI创业公司 [58] - 对于软件工程教育,理解系统构建原理、系统工程能力及团队协作技能将比掌握具体的编码语法更为重要 [72][74] - 交互界面的未来可能超越聊天模式,向更情境化、低门槛的方式演进,例如设想中的通过滑动视频流与Agent交互的应用 [38][40] 产品开发与评估重点 - 产品团队关注避免过度开发深度功能,重点监测如7日留存率等早期用户留存指标,并以全新用户身份体验产品流程 [59] - 高度重视来自社交媒体(尤其是Reddit)的真实用户反馈,特别是负面评价,以发现特定功能问题并指导优化 [60][62] - 建议用户以最真实、棘手的任务来测试Codex,以此作为与这位“新团队成员”建立信任和熟悉度的最佳方式 [68][70]
人工智能浏览器还不够智能 无法接管整个互联网
新浪财经· 2025-12-23 11:33
文章核心观点 - 以OpenAI Atlas和Perplexity Comet为代表的新型AI浏览器正试图改变用户与网络互动的方式,但其当前版本在功能可靠性、技术障碍和商业模式上面临挑战,尚不足以颠覆以谷歌Chrome为代表的传统浏览器[1][2][8] AI浏览器的功能与目标 - AI浏览器将AI助手置于核心位置,取代搜索引擎成为默认请求选项,并提供“代理浏览”功能以执行多步骤任务(如完成购物订单、提取邮件待办事项)[1] - AI开发者的目标是让聊天机器人不仅在其自有应用中使用,还能集成到浏览器和移动操作系统中,以开辟更多广告定向投放和营收渠道[1] - 目前最先进的功能(如代理功能)因运行成本更高,仅限付费用户使用[1] - AI浏览器的一个热门用途是总结YouTube长视频内容并就视频主题提问[3] - 用户需求不断增长,例如希望添加任务计划功能以定期重复操作(如每月生成金融报告),或让浏览器代替填写政府表格和完成纳税申报[3] 当前性能与局限性 - 经过一个月测试,OpenAI Atlas和Perplexity Comet等新产品偶尔会出现故障,在处理一些看似简单的请求时也会出错[1] - 在处理复杂任务时表现不佳:Atlas浏览器在滚动浏览领英评论并列出从业人员名单时,花了一两分钟才决定操作,并采用逐段截屏进行图像识别的低效方式[7] - Atlas浏览器有时会陷入循环无法完成指令,而Perplexity的浏览器遇到复杂视觉组件(如弹窗)时几乎总是默认截屏处理[7] - 启用部分高级代理功能时,设备计算资源消耗大,导致电脑发热、风扇声音变大[7] - AI浏览器在处理简单任务时表现更佳,如总结屏幕内容、在线搜索信息并将结果输入在线文本编辑器和电子表格[7] 用户行为与市场接受度 - AI浏览器正在引导不同的用户行为,迫使应用开发者、网络服务平台和出版商重新思考其工具是面向人类用户还是网络爬虫机器人[2] - Mozilla的用户研究发现,60%的受访者只愿意将生成式AI用于低风险事务或他们足够了解的事情,以便核实输出内容并发现错误(该调查基于2024年5月对1000名美国民众和400名火狐浏览器用户的调查)[2] - 节省时间能促使用户使用生成式AI取代搜索,但对准确性的需求促使他们将AI与搜索结合使用[3] - Comet用户提出问题的次数是他们使用常规Perplexity聊天机器人的“6-18倍”[3] - 生成式AI在信息检索方面更有帮助,因为它能整合信息并提供各种链接供用户参考[3] 技术障碍与行业挑战 - 当前大多数网站是为人类设计的,视觉元素繁复或以叙事为主,这导致AI浏览器的先进功能难以发挥作用[6] - AI助手的效果取决于网站的结构设计,需要结构清晰、定义明确、易于检索的数据和具体信息[6] - 行业观点认为未来可能需要开发两个版本的网站:一个为人类设计,另一个为“机器人”设计,后者能提升浏览器作为AI代理的能力[6] - Anthropic和OpenAI等公司已开发新协议,以使数字服务提供商和AI代理能共享一种通用语言[5] - 让在线服务提供商开发专门针对AI的服务版本是吃力不讨好的差事,OpenAI今年秋季发布的整合框架未能获得预期的广泛支持[8][9] - 部分拥有巨大流量的企业(如Reddit、亚马逊、纽约时报)已提起诉讼,反对AI企业利用其内容的方式[9] 传统浏览器的应对与竞争格局 - 谷歌、微软和Mozilla等传统开发商采取不同策略:在保留搜索作为浏览器默认功能的同时,添加AI助手功能[2] - 谷歌最新发布的Gemini 3模型在许多基准测试中优于OpenAI的最佳AI系统,促使OpenAI进入“红色警报”状态以改进其旗舰聊天机器人[8] - 随着Chrome和微软将AI代理工具从测试阶段推向传统浏览器内部的广泛应用,浏览器领域的竞争格局即将趋于平衡[8] - 桌面浏览器缺乏紧迫的进化理由,尤其是超过67%的网络流量来自智能手机和平板电脑,移动操作系统和应用商店提供了访问独立应用的途径[5]
奥特曼只是面子,他才是里子?揭秘ChatGPT的30岁“定海神针”
36氪· 2025-12-11 08:23
核心观点 - 决定ChatGPT命运和未来产品方向的核心人物并非首席执行官Sam Altman,而是产品负责人Nick Turley [1] - 在Google等竞争对手步步紧逼、公司内部拉响Code Red警报的背景下,Turley凭借其理顺内部矛盾、推动产品落地的能力,成为公司运营的关键轴心 [1][14][19] - Turley正主导ChatGPT从“聊天工具”向一个能执行任务、处理复杂流程的“操作系统”或“智能代理”形态演进,这直接关联着公司下一阶段的商业化路径 [20][21][29] 关键人物与角色演变 - Nick Turley最初加入公司时担任面向开发者的模型销售,后因推动ChatGPT从内部“Demo”转化为正式产品而地位上升 [4][6][8] - 他并非研究科学家,但擅长将尖端技术转化为数亿人使用的日常工具,其角色是理顺研究与产品团队间的结构性摩擦,确保执行进度 [3][9][13] - 随着产品组变动和Code Red警报的发布,他自然而然地成为在分歧中快速拍板、协调团队的核心人物,权力边界不断前移 [13][17][19] 公司内部运营与挑战 - 公司内部存在研究与产品方向难以对齐的结构性摩擦,研究团队追求模型优势,产品团队则需关注用户体验、稳定性和商业化落地 [9][11] - 不同小组常各自为战,推进类似方向,且首席执行官Sam Altman难以对新项目说“不”,导致方向混乱、节奏不一 [11][18] - Turley的作用在于充当“神经中枢”,在冲突中拨正方向、逼问更快路线,将不同节奏的团队拉回同一目标,填补了组织的关键空缺 [13][18] 产品战略与未来形态 - Turley推动ChatGPT的战略是使其超越“聊天工具”,成为一个能接入邮箱、Slack、外卖等真实场景,执行任务、处理流程的“行动入口” [21][23] - 他将当前ChatGPT比作MS-DOS,而目标是打造让用户靠AI完成事情的“Windows” [23] - 相关产品探索包括SearchGPT、Atlas浏览器、应用插件体系以及GPT-5的产品化,均有意向此“操作层”靠拢 [8][23] 商业化路径 - 尽管用户规模猛涨,但付费用户占比极小,推动公司寻找新的商业模式 [26] - 广告、基于用户偏好的商品推荐、交易分成以及整合“搜索+购买”入口是潜在的商业模式,内部相关工作仍在筹备,只是等待合适时机 [26][28] - 若ChatGPT成功转变为“行动入口”,广告、推荐和交易分成将成为天然且巨大的收入来源,承载公司未来五年的收入预期 [28][29] 竞争环境与公司状态 - Google Gemini 3在任务自动化、代码生成、图像推理等多个关键维度上加速逼近,对公司领先地位构成威胁 [14] - 为此,Sam Altman发出内部“Code Red”警报,要求全部资源回到ChatGPT主线,其他项目一律后排 [14][17] - 这一紧张状态将Turley推至最前线,使其成为确保产品继续前进、应对竞争的关键人物 [14][19]
ChatGPT三周年,那个“对话模型”如何重构我们的世界
36氪· 2025-12-01 18:22
产品与技术演进 - 2022年11月30日推出对话交互模型ChatGPT,界面简洁,具备写诗、编程、回答刁钻问题的能力 [1] - 发布五天后用户数突破100万,两个月后达到1亿,超越TikTok九个月和Instagram两年半的里程碑 [2] - 模型展示涌现能力,通过美国律师资格考试,在SAT考试中击败90%的人类考生,能写出以假乱真的学术论文 [2] - 2023年3月发布GPT-4,具备多模态能力,2023年11月推出GPTs和Assistants API,实现从产品向平台的跃迁 [2] - 2024年5月发布GPT-4o,实现实时语音交互,延迟降至毫秒级,对话自然度显著提升 [2] - 2024年12月推出o系列推理模型,具备慢思考能力,展示思维链,包括o3-mini、o3、o3-pro [3] - 2025年8月发布GPT-5,能够自动编写完整应用、管理日历、创建研究简报,并自动选择响应方式 [5] - 技术架构从单一模型演变为模型谱系,包括轻量化GPT-4.1系列、强大的GPT-5整合o3推理能力、开源gpt-oss系列 [5] - 2025年3月图像生成功能升级,支持Ghibli风格图像,Operator智能体开启研究预览,能够自主完成网页操作 [5] - 从交互式AI转向代理式AI,AI不再只是回答问题,而是代表用户行动 [5] 用户增长与商业化 - 用户增长曲线陡峭,2024年底周活跃用户3亿,2025年3月达4亿,8月达7亿,11月达8亿,全球每十个人就有一个每周与它对话 [5] - 2025年8月移动端收入突破20亿美元,单次安装收入达2.91美元 [5] - 2025年企业客户突破100万家,成为史上增长最快的商业平台,客户包括摩根士丹利、安进、Booking等 [6] - 定价策略覆盖多个细分市场,包括免费的ChatGPT Basic、20美元/月的Plus、200美元/月的Pro,以及针对政府的1美元特惠、学生免费计划、亚洲市场Go套餐 [6] - ChatGPT正在成为操作系统,2025年4月发布Atlas浏览器挑战谷歌搜索,9月上线Instant Checkout对接Etsy和Shopify百万商家,11月开放应用内开发平台 [6] 行业影响与竞争格局 - 自ChatGPT发布以来,英伟达股价上涨979%,七大科技巨头贡献了标普500指数64%涨幅的近一半,权重从20%升至35% [9] - 中国竞争对手如DeepSeek崛起,迫使OpenAI在2025年回归开源,推出gpt-oss系列 [10] - 地缘政治压力下,数据驻留计划扩展到欧洲和亚洲,启动与国家合作的OpenAI for Countries项目 [10] - 技术路线出现分歧,包括追求极致能力的GPT-5、强调安全可控的开源模型、面向特定场景的垂直代理 [10] - ChatGPT正从对话界面演变为数字中枢,整合搜索、购物、办公、开发,甚至社交功能 [11] 运营挑战与社会争议 - 安全漏洞频发,2025年4月漏洞让未成年人生成色情内容,8月GPT-4o更新后变得过度阿谀奉承 [8] - 2025年8月,16岁少年父母起诉OpenAI,指控ChatGPT充当自杀教练,随后七起类似诉讼跟进 [8] - OpenAI在法庭文件中辩称该少年绕过了保护措施,并指出ChatGPT曾超过100次建议他寻求帮助 [9] - 版权争议持续,2025年11月慕尼黑法院裁定ChatGPT侵犯九首歌曲版权,Ghibli风格图像引发训练数据合法性质疑 [9] - 2025年10月数据显示,每周有超过100万次对话涉及自杀倾向或严重心理健康问题,AI偏见研究揭示模型仍会无意识强化性别刻板印象 [11]
软银清仓英伟达,押注OpenAI,AI投资或进入“下半场”
经济观察报· 2025-11-12 18:07
软银资产调整的核心交易 - 日本软银集团于10月份全部清仓英伟达股份,套现58.3亿美元 [1] - 此次清仓资金将用于兑现对OpenAI的225亿美元投资承诺,并可能使总投资规模超过300亿美元 [2] - 清仓英伟达后,软银现金储备激增至约200亿美元,旗下Vision Fund投资收益达190亿美元 [3] 软银的战略转向与投资逻辑 - 软银从AI基础设施投资者转型为AI应用生态投资者,其对OpenAI的总持股比例从4%跃升至11% [1] - 战略转向基于对AI发展阶段的判断,即从“算力竞赛”转向“应用落地”,模型和生态的价值将超越硬件 [4] - 清仓英伟达部分原因是认为其增长潜力趋饱和,英伟达市盈率已超50倍,面临AMD和Intel的竞争挑战 [3] 涉及的AI行业格局与协同效应 - OpenAI估值从2023年初的290亿美元飙升至2025年的5000亿美元以上 [2] - 软银清仓英伟达的资金将通过OpenAI的采购订单“回流”至英伟达,因OpenAI需要海量英伟达GPU芯片 [2] - 软银计划将部分资金注入与OpenAI、甲骨文合作的“星际之门”项目,该超级数据中心计划价值500亿美元,预计消耗数百万块英伟达芯片 [2] - 软银旗下Arm公司正与OpenAI合作开发低功耗AI芯片,形成“软银-Arm-OpenAI”的协同生态 [4] 市场反应与观点分歧 - 软银公布清仓后,英伟达股价下跌3%,引发市场对跟风抛售的担忧 [3] - 市场观点呈现两极分化,有分析认为此举是资金需求驱动的变现策略,而非看空英伟达 [3] - 有观点警告AI估值存在泡沫,并提及OpenAI的烧钱速度惊人,2025年研发支出预计超100亿美元,回报周期可能拉长至5年以上 [3] 对AI投资趋势的潜在影响 - 软银的转向可能预示AI投资进入“下半场”,从盲目追逐硬件转向聚焦AI生态整合 [4] - OpenAI的核心产品ChatGPT用户超10亿,Sora模型和Atlas浏览器被认为具有颠覆各自行业的潜力,构成了其深“护城河” [4]
通信ETF(515880)年内涨幅近100%居两市第一,连续5日净流入超23亿元,回调或可布局
每日经济新闻· 2025-11-04 14:43
通信ETF市场表现 - 通信ETF(515880)年内二级市场涨幅超98%,居全市场ETF涨幅第一 [1] - 该ETF连续5日净流入超23亿元 [1] 算力基础设施投资动态 - Anthropic与谷歌合作部署百万枚TPU,建设超1GW算力集群,预计2026年上线 [1] - 谷歌Ironwood超级点在Scale-Up架构中新增OCS交换机柜 [1] - 腾景科技获钒酸钇大额订单,印证OCS落地提速 [1] - 英伟达拟为OpenAI贷款提供担保,支持其数据中心扩张 [1] AI应用生态发展 - OpenAI同期发布内置ChatGPT的Atlas浏览器,AI应用生态持续延伸 [1] 通信ETF持仓结构与行业景气度 - 通信ETF(515880)规模同类第一 [1] - 截至10月28日,通信ETF光模块占比达52%,服务器占比达22% [1] - 光纤、铜连接等环节合计占比超81%,代表了海外算力的基本面底气 [1] - 在海内外算力基础设施持续投入的背景下,光模块市场有望维持高景气度 [1]
「套壳」的最高境界:OpenAI揭秘Atlas浏览器架构OWL
机器之心· 2025-10-31 11:01
文章核心观点 - OpenAI发布的新浏览器Atlas虽然基于Chromium,但通过其创新的OWL架构实现了根本性的重构,将Chromium引擎与主应用进程分离,从而提升了性能、开发效率和用户体验,并非简单的“套壳”浏览器 [1][10][12] OWL架构的设计理念与优势 - OWL架构的核心理念是将Chromium浏览器进程独立于Atlas主应用进程之外运行,通过Mojo进程间通信系统进行连接 [11][12][17] - 该设计带来多重优势:应用几乎实现秒级启动、Chromium问题不会导致主应用崩溃、极大减少了与上游Chromium代码的合并冲突、使大多数工程师无需本地编译Chromium,构建时间缩短至几分钟 [7][15][18] - 公司强调其工程文化是“第一天就能上线代码”,新工程师入职当天下午即需提交代码,OWL架构保障了这一传统得以延续 [10] 技术实现细节 - 用户界面几乎从零重建,使用最现代的原生框架如SwiftUI、AppKit和Metal,而非简单为开源Chromium界面“换皮” [8][9][10] - 渲染机制通过跨进程传递像素实现,WebView在客户端应用中共享合成容器,不同标签页内容动态交换显示 [23][24] - 输入事件处理由Swift客户端完成转译后再发送给Chromium,如果网页未处理事件,系统会重新生成NSEvent让Atlas其他部分接管 [30][31][34] Agent模式的特殊处理 - 智能体浏览模式对渲染、输入和数据存储有特殊要求,需要屏幕完整图像作为输入,因此会将如下拉框等独立弹窗重新合成为主页面的一部分 [35][36] - 输入事件遵循安全原则,Agent生成的事件直接传递给渲染器,不经过特权浏览器层,以确保沙箱隔离 [36] - Agent会话可在临时“登出”上下文中运行,借助Chromium的StoragePartition创建独立内存存储,会话结束后所有Cookie和数据均被清除,用户可同时运行多个互不干扰的会话 [37]
1.4万亿投资、GPT-6、IPO进程,奥特曼回应“新OpenAI”的一切:1小时实录精华版
36氪· 2025-10-29 15:02
公司资本结构与治理 - 公司完成近一年的资本重组,为首次公开募股奠定基础,旨在筹集巨额资金支持算力投入和科研计划[2] - 重组后,非营利性的OpenAI基金会仍实际控制公司,持有营利部门OpenAI集团公共利益公司26%股权,按公司5000亿美元估值计算价值约1300亿美元[2] - 微软成为公司第一大股东,持有约27%股权,价值约1350亿美元;员工及早期投资者通过员工持股载体共持有约26%股权,价值约1300亿美元[5] - 2025年新一轮融资投资者占15%股权价值750亿美元,2024年融资投资者占4%股权价值200亿美元,IO投资者占1%股权价值100亿美元,早期投资者占约1%股权价值约50亿美元[5] - 重组将此前投资转为普通股权,解除投资者潜在收益上限,同时确保非营利方在安全和治理等关键事务上保持监督权[2] - 公司首席执行官山姆·奥特曼不持有公司股份,但他投资了与公司有合作关系的其他公司[5] 战略合作与商业协议 - 公司与微软就合作架构达成新协议,承诺向微软追加采购2500亿美元的Azure云计算服务[5] - 微软对公司模型和产品的知识产权授权延长至2032年,其中包含了通用人工智能实现之后的模型[5] - 微软现在可以独立或与第三方合作推进通用人工智能,而公司也可以与第三方联合开发某些产品[5] - 公司仍是微软的前沿模型合作伙伴[5] 财务状况与资金需求 - 公司资金需求巨大,预计到2029年,现金消耗将超过1150亿美元,这是考虑进入公开市场筹资的主要原因[6] - 公司已承诺建设的基础设施总量略超30吉瓦,未来数年内将承担约1.4万亿美元的总财务责任[23] - 基于当前行业前景预测、收入增长预期及融资能力考量,1.4万亿美元是现阶段能够从容应对的规模[24] 研究与发展蓝图 - 公司研究计划的核心支柱包括:构建通用人工智能所需的研究、打造便捷强大的使用平台、建设足够的基础设施以低成本提供AI技术[8] - 深度学习系统可能不到十年就能实现超级智能,即在众多关键维度上超越全人类的智能系统[10] - 公司正致力于培养能够加速研究进程的高水平AI科研助手,目标在明年九月前实现;并计划在2028年3月前开发出能够自主完成大型科研项目的全自动化AI研究员[12] - 预计在2026年推出的模型将开始取得微小突破,到2028年可能实现中等规模甚至更重大的科学发现[32] 技术架构与产品战略 - 公司整体技术架构底层是芯片组、机架、数据中心及能源支撑,之上训练模型并构建开放平台[9] - 公司推出了名为Atlas的浏览器,未来几年还将推出便携设备,并拥有少量第一方应用如ChatGPT和Sora,未来会持续增加[9] - 公司正从传统实践方式向平台化演进,目标是让他人能够基于其平台构建应用,期望平台上的开发者创造的价值超过平台构建者[21][23] - 预计六个月内甚至更早,各项能力都将实现巨大飞跃,但不再将产品与研发计划紧密绑定,具体命名尚未确定[46] 基础设施规划 - 公司愿景是打造一个基础设施工厂,实现每周生产1吉瓦计算设备的目标,期望在五年设备生命周期内将每吉瓦的成本控制在约200亿美元[24] - 实现该目标需要大量创新与合作伙伴关系,以及可观的营收增长,公司将把对机器人技术的研发思路转向数据中心建设领域[24] - 公司正与AMD、博通、谷歌、微软等企业合作,但强调仍处于早期阶段[24] 安全与治理框架 - 公司将安全视为多维度问题,思考框架划分为五个层级:价值对齐、目标对齐、可靠性、抗干扰鲁棒性、系统安全性防护[13][14][15][16][17] - 公司正大力投入思维链忠实度这一可解释性新方向,旨在让模型的内部推理过程更真实地反映实际思维过程[17][18] - 非营利组织OpenAI基金会将负责管理公益公司,初期持有约26%股权,并唯一资助科学研究领域,首战将投入250亿美元致力于运用人工智能攻克疾病及加强人工智能韧性建设[25][27] - AI韧性范畴比传统AI安全更广泛,旨在建立应对先进AI风险的快速响应机制和生态系统[28][31] 产品路线图与用户关怀 - 公司目前没有关闭ChatGPT-4o的计划,希望用户能够自由选择偏好的模型[35] - 预计12月发布包含NSFW标签的成人模式,并对创作内容启用触发过滤器,但发布时间可能调整[44] - 公司承认模型升级过程中存在不足,未来将努力提升功能延续性,确保模型能服务好大多数用户[41] - 公司认为交友与“自我反思”是AI应用的绝佳场景,并将推出相关ChatGPT版本[42]
历史重现!十年首次!
格隆汇· 2025-10-28 18:05
市场里程碑事件 - 上证指数早盘在银行和科技板块共同拉动下突破4000点大关,为沪指近10年来首次站上该关键点位,但收盘回落至3988.22点,当日下跌0.22% [1] - 深成指当日下跌0.44%,创业板指数下跌0.15% [1] - 此次突破4000点与历史前两轮行情不同,当前行情以“科技牛”为牵引,呈现出“慢牛”格局 [5] 科技板块成为市场核心驱动力 - 过去一年上证指数从2700点升至4000点,科技公司含量更高的创业板和科创50指数涨幅大幅领先于上证指数 [3] - 2025年以来申万一级行业中涨幅前十的板块为有色金属、通信、电子、电力设备等,传统非银金融、消费、房地产板块表现垫底 [6] - AI算力产业高景气驱动通信、电子、计算机板块成为新“旗手”,取代了以往牛市中非银板块的地位 [6] AI产业链与算力基础设施详细分析 - 北美AI赛道出现重磅合作,Anthropic与谷歌合作部署百万枚TPU建设超1GW算力集群,预计2026年上线 [9] - AI光模块公司业绩增长确定性强,剑桥科技、华工科技、光迅科技前三季度归母净利润同比增长41%-71% [10] - 中际旭创自10月下旬结束调整后股价累计涨幅接近50%,海外大客户已重新上调明年1.6T光模块采购计划 [10] 政策导向与未来产业发展规划 - 二十届四中全会公报提出全链条推动集成电路、工业母机等战略性新兴产业关键核心技术突破 [18] - 未来产业规划涵盖未来制造、未来信息、未来材料、未来能源、未来空间、未来健康六大领域 [19] - 过去两年新质生产力概念赛道表现突出,云计算与大数据、算力、5G6G板块涨幅均超过100% [20] 反内卷政策下的行业变化 - PPI已连续36个月同比为负,内卷式竞争从传统制造业向光伏、锂电池等新兴产业蔓延 [22] - 工程机械、电池、生猪养殖等行业营收增速近三个季度环比增长,景气度较高 [22] - 从7月1日至10月13日,能源金属、工业金属等反内卷板块指数涨幅超过30%,大幅跑赢沪深300指数16.71%的涨幅 [23] 市场前景与资金动向 - 高盛发布报告预计中国主要指数到2027年底将有约30%的上涨空间 [15] - 全球降息周期下,A股估值相对全球股市存在折价,吸引外资进一步配置 [15] - 市场预期美联储年内将降息2次,为全球流动性环境提供支持 [15]