虎嗅
搜索文档
OpenAI的第一款AI浏览器,好像也就那样吧
虎嗅· 2025-10-23 15:06
产品发布与定位 - OpenAI于2025年10月21日正式发布首款AI浏览器Atlas,旨在将人工智能助手置于浏览体验核心,重新定义用户与网络交互方式,从被动信息获取转向主动任务执行 [1][2] - 公司试图通过推出AI浏览器转变身份,不再局限于提供基座大模型的AI工具提供商,而是重新思考浏览器作为用户接入互联网主要入口的角色 [2] - 在Atlas的设想中,未来的浏览器将成为智能代理的载体,帮助用户完成复杂数字化任务,并被视为AGI的主要界面 [25][26] 产品功能与技术实现 - Atlas在技术实现上倾向于采用DOM解析路径,该路径将网页元素转化为AI可读的结构化格式,任务成功率达89.1%,成本比视觉识别路径降低90% [4][5] - 产品设计上与现有MCP浏览器高度相似,侧边栏AI助手、网页内容总结、分屏浏览模式等功能与Comet、Opera Neon等竞品如出一辙,并无突破性创新 [5][6] - Atlas的agent模式需用户授权后执行操作,执行过程显示进度并可暂停,此功能与Opera Neon的"Neon Do"完全一致,但Atlas不支持创建可重复使用的操作流程 [6] - 产品基于Chromium内核,在DOM解析、网页元素识别等底层技术上与其他浏览器方案大同小异,且不支持所有Chrome插件 [8][10] 产品竞争劣势与挑战 - Atlas在功能上落后于主要竞品:其核心agent模式仅对付费用户开放,而Comet已实现免费(免费用户有使用频率限制);产品目前仅支持macOS,而Comet支持Windows、macOS和Linux [9] - 在任务处理能力上,Atlas的agent一次只能执行一个任务流程,而Comet的"Background Assistant"可后台同时处理多个任务;Opera Neon提供了网站、游戏等内容创作工具,Atlas并无此类功能 [9] - 产品存在技术漏洞,如访问网页时出现阻挡问题,需重复操作才能解决;执行简单指令如画爱心会出现错误;部分网站如纽约时报阻止其总结内容 [18][20][21] - 在涉及敏感操作如输入密码、确认支付时,Atlas与所有MCP浏览器一样必须切换回手动模式,这是整个生态尚未解决的核心挑战 [7][15][16] 市场竞争格局与生态系统 - AI浏览器竞争本质是生态系统竞争,Chrome拥有约30亿用户并整合谷歌AI模型Gemini,其背后Gmail、Google Drive等服务的无缝集成及Chrome Web Store超过10万个扩展程序构成强大壁垒 [30][46][47] - MCP协议作为开放标准通信协议,简化了AI模型与外部系统的集成,截至2025年10月已有超过200个第三方开发者贡献各类Server,涵盖数据分析、文档处理等多个领域 [32][33][35] - Atlas对苹果生态做了特殊支持,提供打开苹果智能的选项,可通过本地处理器总结网页并支持Siri唤醒,从而获得无缝跨应用体验,产品更像是对苹果新发布的M5芯片的广告 [37][38][39] 商业逻辑与战略意图 - 浏览器作为入口能将AI无缝集成到用户工作流,提高AI服务使用频率和粘性,并建立直接的用户付费关系,为OpenAI提供新的变现途径 [12][13][28] - OpenAI目前主要收入来自ChatGPT订阅服务和API调用费用,其ChatGPT拥有超过8亿用户,但付费用户占比不到5%,公司需要寻找新的商业模式 [28] - 浏览器可为OpenAI提供广告等商业可能性,但一旦涉及广告和搜索,公司将直接面对谷歌的竞争 [29][30] - 公司短期目标包括扩展到Windows、iOS、Android平台、建立开发者生态支持第三方AI应用集成,以及完善Agent模式功能提高任务执行成功率 [24] 行业影响与市场反应 - 在Atlas发布当日,谷歌股价盘中跌幅一度扩大至近5%,最低触及245美元,最终收跌2.21%,但这主要源于市场对谷歌AI Studio更新期待落空,而非Atlas直接影响 [41][42][45] - AI浏览器代表了下一代互联网交互方向,传统搜索引擎模式正被AI问答模式取代,用户希望直接得到答案而非搜索结果 [54] - 从长远看,AI浏览器可能只是过渡形态,最终形态将是能理解用户意图、主动完成任务、无缝连接各种服务的智能代理系统 [56]
独家|对话北京人形机器人创新中心CTO唐剑:世界模型有望带来具身智能的“DeepSeek时刻”
虎嗅· 2025-10-23 15:06
文章核心观点 - 世界模型被视为推动具身智能发展的关键路径,有望带来类似DeepSeek的低成本、高性能突破 [1][9] - 具身智能的复杂度远超自动驾驶,是智能系统的“天花板级”挑战,其发展更依赖长期数据积累而非短期突破 [7][8] - 公司通过“双模驱动”架构和引入奖励机制,在有限算力下开发出性能超越SOTA的世界模型 [9][10][11] 技术理念与方法 - 倡导“经验驱动”的控制方式,通过历史数据学习控制规律,而非依赖精确的数学建模 [3][4] - 以游泳运动员训练类比AI学习过程,强调通过反复实践积累经验而非先掌握理论 [5] - 在自动驾驶领域验证了端到端控制架构的有效性,并将其思路延伸至具身智能 [6] 世界模型的技术特点 - 采用世界模型与多模态大模型相互促进的“双模驱动”结构 [9][11] - 引入奖励机制和基于强化学习的微调,形成自我优化闭环 [9][10][11] - 使用GRPO算法微调多模态大模型,实现认知与物理交互的紧密闭环 [11][12] - 当前模型基于DiT架构,但未来可能迭代全新架构以更好捕捉物理规律 [19][20] 世界模型的应用价值 - 主要用途包括:与机器人大脑形成闭环、直接生成训练数据、作为机器人操作模型的一部分 [17] - 核心目标是提高机器人在开放环境中的泛化能力,这对商业和家庭场景至关重要 [21][22] - 通过蒙特卡洛树搜索等技术,让机器人在虚拟世界中模拟多种方案并选择最优路径 [11][17] 行业现状与挑战 - 具身智能尚未出现类似ChatGPT的“突破时刻”,数据量级、采集难度和成本远高于语言模型 [8][9] - 行业目前缺乏明确的Scaling Law,智能能力随数据、算力增长的规律未知 [13] - 世界模型在物理规律和时空一致性方面要求远高于视频生成模型 [18][19] - 具身智能落地将经历工业场景、商业场景、家庭生活场景三个阶段 [21]
3年干出280亿估值AI独角兽,AI创业的最佳路径是什么?
虎嗅· 2025-10-23 14:53
公司创始人背景与技术根基 - 创始人乔琳拥有复旦大学计算机科学本科与硕士学位,以及加州大学圣巴巴拉分校计算机科学博士学位,具备横跨中外的学术经历和扎实的理论功底 [1] - 在Meta公司主导PyTorch生态建设,带领300余人工程团队重构其底层架构,使其从科研工具成功适配数据中心、移动端及AR/VR设备,构建从模型研发到生产部署的全链路平台,成为全球AI框架生态的核心奠基人之一 [1][2] 公司创立与核心技术 - 乔琳离开Meta后创立Fireworks AI,专注于解决大模型推理的"效率痛点" [2] - 公司研发两大核心技术:Fire Attention推理引擎通过无损量化压缩技术将模型运行精度从16位降至8位甚至4位,大幅减少资源消耗;推测执行引擎通过一次预测多个词序列再反向验证,打破逐字生成的传统模式 [2][3] - 两项技术叠加使主流开源模型的推理速度较行业标杆vLLM提升12倍,同时成本降低53% [3] - 公司定位为同时具备开源灵活性与闭源易用性,并以"轻量"为优势提供定制化服务 [6] 商业模式与市场定位 - Fireworks AI采用"算力调度师"的轻资产模式,不直接购买硬件,而是整合全球科技公司、高校实验室的闲置GPU资源 [9] - 客户通过API上传数据即可调用整合后的算力,例如早期客户AI编程助手Cursor使用其API后,每月成本从200万美元买服务器降至15万美元,推理速度加快3倍 [9] - 公司专注于满足中小企业"小而精"的定制化需求,例如帮助银行调整信用评估模型以符合合规要求,或帮助药厂做分子模拟以适配特殊实验数据 [12] - 公司70%的客户是英伟达云服务覆盖不到的中小企业,其优势在于提供"懂行业的微调方案" [13] 业务进展与财务表现 - 2023年11月,公司自研的FireAttention推理引擎将GPU算力利用率从行业平均的65%提升至92%,使客户AI模型推理成本直接减半 [11] - 公司在算力突破后决定将新方向转向企业模型微调,此决策使其在半年后估值冲刺40亿美元 [11] - 至2024年,公司年化营收ARR突破1亿美元,并逼近3亿美元,80%的客户在复购时追加"微调服务" [10][15] - 知名客户包括Perplexity将70%的推理业务迁移至该平台,阿里Qwen团队使用其服务将原本需要两周的模型压缩调试缩短至3天完成 [10] 竞争格局与战略合作 - 英伟达从公司A轮投资方转变为竞争对手,于2024年3月收购推理服务商Lepton并推出自己的GPU云市场 [12] - 公司采取"差异化共存"战略,通过FireAttention引擎积累的微调数据反向为英伟达提供GPU优化建议,例如联合开发针对金融模型稀疏计算需求的专用算力调度插件,使GPU处理效率再提高15% [12] - 公司认为其核心机会在于细分市场,与巨头的通用算力服务形成互补 [13]
南京这座城市,为何让人又爱又恨?
虎嗅· 2025-10-23 14:33
老南京人看着金陵从从容旧都蜕变为今日新城,雍容气度犹在,却难忘街巷炊烟和那慢悠悠的时光。南 京这座城市,为何让人又爱又恨? ...
昔日电池霸主LG,为何惨败于中国?
虎嗅· 2025-10-23 14:06
公司历史市场地位 - 公司电池业务曾占据全球市场份额的27% [1] - 公司客户覆盖全球20大汽车品牌中的13家 [1] - 公司在与日本巨头松下的竞争中实现逆袭 [1] 公司当前市场状况 - 公司电池业务目前被中国企业掀翻在地 [1] - 公司从曾经的不可一世发展到如今的全线溃败 [1] - 公司电池业务被描述为被推下神坛 [1]
在工地为什么现在年轻人不愿意讨好领导了?
虎嗅· 2025-10-23 13:59
本文来自微信公众号:造价学长,作者:造价学长,题图来自:AI生成 近几次聚餐,发现一个有意思的现象:领导那桌还没来得及过来"打一圈"、发表令人振奋的讲话,员工 桌的年轻人已经走得差不多了,留下来的,大多是年长一点的工长。 要放在从前,年轻人多半会主动凑过去敬酒、说几句漂亮话,为自己的职业道路铺铺路。能留到最后 的,往往被认为"前途光明"。 但现在不一样了。大家好像只想安安静静吃完自己的饭,不愿在饭桌上多停留一秒。时代真的变了—— 年轻人,越来越不愿意讨好领导了。 我琢磨了一下,原因大概有这几个方面: 你喝了这顿酒,工作就会少一点吗? 第一,做这件事,真的有好处吗? 人性本质是趋利避害的。如果不能"趋利",那至少也得"我乐意"。 你喝了这顿酒,就能升职加薪吗? 你喝了这顿酒,就能提前休假回家吗? 都不会。 它只会让你半夜爬起来抱着马桶吐,只会让你第二天昏昏沉沉上工地"打灰"。 所以现在的年轻人,是真的"人间清醒"。 第二,不做这件事,真的有坏处吗? 除非你这工作好到外面没有匹配的岗位——那叫"有好处"。 可如果你既给不了好处,又制造不了坏处——那人家凭什么讨好你?你算老几? 第三,如果没有利害关系,那我喜不喜欢 ...
解读ChatGPT Atlas背后的数据边界之战
虎嗅· 2025-10-23 13:53
文章核心观点 - AI行业竞争的核心正从模型的基础智能水平转向对现实世界数据的理解深度,即“智能规模效应”(智能效能 = 大模型智能水平 × 现实理解纵深)[5][7][24] - 未来AI应用的胜负手在于谁能无限扩展自身的数据边界,从而获得更深的“现实理解纵深”,这构成了新的护城河[9][18][59] - 这场数据圈地运动将导致比PC和移动互联网时代更激烈的“赢家通吃”效应,竞争更趋向于零和博弈[52][58][67] 历史竞争格局演变 - Chrome浏览器的成功是谷歌在与微软竞争中取得优势的关键,为谷歌建立了自己的端和入口[1][2] - 在AI大模型背景下,竞争角色发生互换,OpenAI扮演了昔日谷歌的角色,而今天的谷歌则类似于昔日的微软[3] 智能规模效应解析 - 大模型的智能水平是AI的“基础智商”或“势能”,由模型架构、训练数据量、参数规模和计算资源决定[13][15][16] - 现实理解纵深是AI的“情境智商”,代表模型能接触和理解的特定、实时、私有数据的深度和广度[23] - 在智能水平达到阈值后,应用成败的关键迅速转向模型所能撬动的现实数据规模[24] 数据圈地运动的表现 - **从云端走向桌面与OS**:OpenAI的ChatGPT Altlas和Anthropic推出桌面端,旨在通过端云一体路线解决体验瓶颈,获取更多个人上下文数据[26][27][28] - **从静态走向实时**:Perplexity AI采用实时检索增强生成架构,解决LLM知识陈旧问题,在2024年初月活跃用户突破1000万[34][35][38] - **从公共走向私有**:Microsoft 365 Copilot通过Microsoft Graph索引企业私有数据,据称使用户在总结会议等任务上速度提升近4倍,平均每周节省1.2小时[40][42][46] - **从数字走向物理**:可穿戴设备和物联网是扩展数据边界的终极形态,旨在通过硬件接入实时物理世界数据[47][49] AI时代竞争本质变化 - PC和移动互联网时代竞争核心是“注意力”,用户迁移成本相对可控[53] - AI时代竞争核心转变为“上下文”或“现实理解纵深”,由于大模型的通用性,竞争强度被放大[55][58] - 深度嵌入工作流的AI应用因其积累的现实理解纵深而形成高粘性护城河,用户更换AI助手的成本极高,相当于知识清零重来[59][65][66] 未来挑战与趋势 - 数据边界无限扩展带来了隐私与信任的核心矛盾,用户对效能的渴望与对隐私的担忧并存[70][72] - 竞赛下半场不仅是关于抓取更多数据,更是关于谁能以更可信、更安全的方式处理数据[73] - AI的未来在于构建深度嵌入现实的专业助手,而非无所不知的数字上帝[75]
买量金融学(二):AI投放就能“稳赚不赔”?
虎嗅· 2025-10-23 13:13
AI投放的本质与现状 - AI投放本质是规则集的叠加,而非真正的智能算法 [1] - 算法工程师成本远高于传统买量员,成本效益是关键考量因素 [1] - 平台最具动力开发AI投放系统,因其边际成本低且收益可能翻数倍 [2] - 外部AI投放需持续适应平台算法变化,导致成本控制困难 [2] - 大甲方可自建自动化投放系统提升效率,但运维成本较高 [3] - 小公司可采用批量发布和数据拉取方案,外部采购成本从前几年5-7万/年降至更低价位 [3] 量化交易的发展与特征 - 量化交易1969年出现首支基金,已发展50余年 [4] - 目前投资机构普遍拥有量化系统,散户通过炒股APP即可使用 [5] - 条件单功能类似投放系统中的预算出价规则集,构成基础量化形态 [7] - 量化核心特征包括数据驱动、数学模型、程序化交易和风险控制 [13][14][15][16] - 高级量化运用卫星数据监测天气、停车场数量等指标预测市场走势 [12] 平台与参与者的博弈关系 - 平台是买量市场中的庄家,掌握算法主导权和完整数据 [18][19] - 其他甲乙方均为散户,缺乏平台数据全面性且API接口存在门槛 [20][21][22] - 平台算法变动可使散户量化策略失效,形成不对称竞争 [20] - 大客户出现投放事故可能获得广告金返还,小公司返还比例低或无响应 [30][31] 量化交易的风险与局限 - 量化并非战无不胜,过度杠杆可能导致黑天鹅事件中数日内破产 [23][25] - 人为操作错误输入可能引发巨额亏损,历史上有大量量化公司倒闭 [26][27] - 国内量化环境更为复杂,股市波动率为美国3倍以上,交易频率更高 [51][52] - 国内外市场策略不可简单套用,本土化调整至关重要 [53] AI投放的未来发展路径 - 理想状态是买量员与AI协同,基于多维度数据计算最优投放策略 [41] - 素材方面需AI实时监测市场热点,创意人员基于爆量要素进行输出 [42] - 平台方最有可能实现成熟AI投放,因资金优势可无上限投入资源 [44] - 三方工具在素材分析领域可能具备相对优势,但全AI流程仍遥远 [45] 买量员的职业发展前景 - AI投放成熟后仍需买量员制定策略,且岗位要求将持续提高 [46][47] - 需掌握基础原理、算法博弈、市场趋势、用户喜好及数据分析等综合能力 [47] - 入门级买量员中不持续学习者将被淘汰,优秀者薪资将随能力杠杆放大而提升 [48] - 顶尖人才多流向金融行业,美国顶尖宽客平均年收入达5.7亿美元 [49] - 平台算法优化岗位将吸引更多高端人才加入 [50]
四渡赤水,究竟神在哪儿?
虎嗅· 2025-10-23 13:01
四渡赤水堪称神来之笔,毛泽东用灵活的运动战让蒋介石摸不着头脑,红军如贪吃蛇般走位,国民党屡 屡被晃得团团转。今天这期视频就来聊聊被誉为神来之笔的军事奇迹——四渡赤水。 ...
第一批AI受害者,是中小学语文老师
虎嗅· 2025-10-23 12:54
近两三年爆发的人工智能正在冲击人类几千年来的语文通识教育,首当其冲的是被誉为课堂上的"园丁"的语文教师。 往小的点看,AI可能方便了学生,却惹恼和内卷了语文老师,甚至还对课堂上写满知识的黑板带来不利。 我们来举一个刚发生在老师身上的例子。 "这篇《我的暑假》里的构思,有些模块化的写作,比如'蝉鸣把夏天泡成了橘子汽水'类似的句子,上周刚在另一个学生布置的日记作业里见过,还有这 篇文言文翻译,连'我对'的位置都有几个学生大致一样。" 成都的李老师是一名小学语文老师,国庆回来后他对着电脑屏幕叹气,最近改日记,第一次觉得"批改"变成了"侦探游戏",才发生了上述的感叹。 放大来说,这事儿的影响也不小。 站在更宏观的视角,AI对语文教育的冲击,可以归为教育领域传统范式与新兴生产力之间的必然对话。如果有语文老师真怕自己被取代,那么我们反而 要追问,"语文教育究竟要培养什么"这一核心命题? 因为从通用人工智能爆发至今,越来越多的学生通过AI学习机、手机等智能硬件接触到了智能技术带来的便利,部分语文老师开始陷入了"甄别AI作 业""应对AI套路化表达"的困境。 但单纯把AI定义为语文老师的敌人,还是忽略了更本质的问题,AI能精 ...