AGI
搜索文档
关于AGI 和人类的未来,你一定要看看清华刘嘉教授的10 个观点
混沌学园· 2025-10-24 19:02
AGI的演化路径与核心特征 - AGI的核心是在开放环境中实现动态策略切换,具备任务切换和环境适应两大特点[4][5][6][7] - AGI演化分为三阶段:以大语言模型为代表的问答阶段、结合自主代理的任务执行阶段、以及目标驱动的生成式代理阶段[8] - 生成式代理是下一代智能体,无需具体指令即可完成目标,具备欲望、信念、意图和行动能力[11][12] 智能体能力构建维度 - 智能体需要具备多种技能、处理各种情况的能力以及与真实世界交互的具身智能[13][14] - 群体智能形成后会产生复杂博弈,进而催生"我"的概念和意识,进入全新智能阶段[14][15] - 智能发展三层次模型:任务特异模型→领域模型→具备看听思考规划能力的认知模型[16][17] 人工智能的情感维度与发展前景 - 当前大语言模型仅学习人类理性层面,缺乏情感温度,需要通过"身临"和"体验"来获得感性特征[21][22][23][24] - 大语言模型目前仍停留在机房内,尚未真正迈入世界获得真实体验[26] - AGI超越人类智能后将面临三种可能前景:友好协作、人机合一实现永生、或人类被取代[32][33] 行业活动与商业应用 - 混沌2025AI应用成果大课将展示200+优秀AI案例,覆盖制造、电商、大健康、教育等千行百业样本[35][41] - 活动汇聚2000多位AI创新者与领域专家,提供AI战略与能力构建的体系化行动指南[35][39][40] - 通过实战专家面对面交流,可立省百万咨询费,获得精准的AI产业链上下游资源对接[42][50]
OpenAI的第一款 AI 浏览器,好像也就那样吧
36氪· 2025-10-23 16:58
Atlas产品发布与定位 - OpenAI于2025年10月21日正式发布首款AI浏览器Atlas,旨在将人工智能助手置于浏览体验的核心,重新定义用户与网络的交互方式,从被动信息获取转向主动任务执行[1] - 公司试图通过推出AI浏览器转变身份,不再局限于提供基座大模型的AI工具提供商,而是争夺用户接入互联网的主要入口[1][5] - 在奥特曼的设想中,未来的浏览器将成为智能代理(AGI)的主要界面,帮助用户完成复杂的数字化任务[14] 技术路径与功能对比 - Atlas采用DOM解析技术路径,将网页元素转化为AI可读的结构化格式,任务成功率达89.1%,成本较视觉识别路径降低90%[2] - 产品在设计上与现有MCP浏览器高度相似,侧边栏AI助手、网页内容总结、分屏浏览等核心功能与Comet、Opera Neon等竞品如出一辙,并无突破性创新[2][3] - Atlas的Agent模式需用户授权后执行操作,执行过程显示进度并可暂停,此功能与Opera Neon的"Neon Do"完全一致,但后者还支持创建可重复使用的操作流程卡片[3] 产品短板与竞争劣势 - Atlas核心功能Agent模式仅对付费用户开放,而竞品Comet已实现免费(免费用户有使用频率限制)[4] - 产品目前仅支持macOS平台,而Comet已支持Windows、macOS和Linux,移动端也在开发中[4] - Atlas基于Chromium内核但不完全兼容Chrome插件,用户切换将失去大量已习惯的工具,Chrome Web Store拥有超过10万个扩展程序[21] - 产品存在技术漏洞,如访问网页时出现阻挡问题,部分网站(如纽约时报)阻止其内容总结功能[8][11] 市场格局与生态竞争 - Chrome浏览器在全球拥有约30亿用户,占据约三分之二的市场份额,并已整合谷歌自家的AI大模型Gemini[15][21] - Chrome背后是谷歌庞大的服务生态(Gmail、Google Drive、YouTube等),可实现跨设备数据同步,这种便利性是Atlas目前无法提供的[21] - AI浏览器的竞争是生态系统的竞争,MCP协议的开放性为生态竞争提供了基础,截至2025年10月已有超过200个第三方开发者贡献了各类Server[16] 商业逻辑与战略意图 - OpenAI目前主要收入来源是ChatGPT订阅服务和API调用费用,ChatGPT拥有超过8亿用户,但付费用户占比不到5%,公司需要寻找新的变现途径[15] - 浏览器可为OpenAI提供多种商业可能性,如广告,但一旦涉及广告和搜索就必须面对谷歌[15] - Atlas对苹果智能(Apple Intelligence)提供特殊支持,打开后可通过本地处理器总结网页,支持Siri唤醒,并与新版Mac Pro的M5芯片形成协同[18] 行业背景与技术演进 - Anthropic于2024年11月推出MCP(模型上下文协议)作为开放标准通信协议,统一了不同大模型调用外部工具的标准,催生了本质相似的AI浏览器[16] - AI浏览器代表了下一代互联网交互方式的发展方向,传统的搜索引擎模式正被AI问答模式逐步取代[26] - 从技术发展趋势看,AI浏览器可能只是一个过渡形态,最终形态将是能够理解用户意图、主动完成任务、无缝连接各种服务的智能代理系统[26]
OpenAI的第一款AI浏览器,好像也就那样吧
虎嗅· 2025-10-23 15:06
产品发布与定位 - OpenAI于2025年10月21日正式发布首款AI浏览器Atlas,旨在将人工智能助手置于浏览体验核心,重新定义用户与网络交互方式,从被动信息获取转向主动任务执行 [1][2] - 公司试图通过推出AI浏览器转变身份,不再局限于提供基座大模型的AI工具提供商,而是重新思考浏览器作为用户接入互联网主要入口的角色 [2] - 在Atlas的设想中,未来的浏览器将成为智能代理的载体,帮助用户完成复杂数字化任务,并被视为AGI的主要界面 [25][26] 产品功能与技术实现 - Atlas在技术实现上倾向于采用DOM解析路径,该路径将网页元素转化为AI可读的结构化格式,任务成功率达89.1%,成本比视觉识别路径降低90% [4][5] - 产品设计上与现有MCP浏览器高度相似,侧边栏AI助手、网页内容总结、分屏浏览模式等功能与Comet、Opera Neon等竞品如出一辙,并无突破性创新 [5][6] - Atlas的agent模式需用户授权后执行操作,执行过程显示进度并可暂停,此功能与Opera Neon的"Neon Do"完全一致,但Atlas不支持创建可重复使用的操作流程 [6] - 产品基于Chromium内核,在DOM解析、网页元素识别等底层技术上与其他浏览器方案大同小异,且不支持所有Chrome插件 [8][10] 产品竞争劣势与挑战 - Atlas在功能上落后于主要竞品:其核心agent模式仅对付费用户开放,而Comet已实现免费(免费用户有使用频率限制);产品目前仅支持macOS,而Comet支持Windows、macOS和Linux [9] - 在任务处理能力上,Atlas的agent一次只能执行一个任务流程,而Comet的"Background Assistant"可后台同时处理多个任务;Opera Neon提供了网站、游戏等内容创作工具,Atlas并无此类功能 [9] - 产品存在技术漏洞,如访问网页时出现阻挡问题,需重复操作才能解决;执行简单指令如画爱心会出现错误;部分网站如纽约时报阻止其总结内容 [18][20][21] - 在涉及敏感操作如输入密码、确认支付时,Atlas与所有MCP浏览器一样必须切换回手动模式,这是整个生态尚未解决的核心挑战 [7][15][16] 市场竞争格局与生态系统 - AI浏览器竞争本质是生态系统竞争,Chrome拥有约30亿用户并整合谷歌AI模型Gemini,其背后Gmail、Google Drive等服务的无缝集成及Chrome Web Store超过10万个扩展程序构成强大壁垒 [30][46][47] - MCP协议作为开放标准通信协议,简化了AI模型与外部系统的集成,截至2025年10月已有超过200个第三方开发者贡献各类Server,涵盖数据分析、文档处理等多个领域 [32][33][35] - Atlas对苹果生态做了特殊支持,提供打开苹果智能的选项,可通过本地处理器总结网页并支持Siri唤醒,从而获得无缝跨应用体验,产品更像是对苹果新发布的M5芯片的广告 [37][38][39] 商业逻辑与战略意图 - 浏览器作为入口能将AI无缝集成到用户工作流,提高AI服务使用频率和粘性,并建立直接的用户付费关系,为OpenAI提供新的变现途径 [12][13][28] - OpenAI目前主要收入来自ChatGPT订阅服务和API调用费用,其ChatGPT拥有超过8亿用户,但付费用户占比不到5%,公司需要寻找新的商业模式 [28] - 浏览器可为OpenAI提供广告等商业可能性,但一旦涉及广告和搜索,公司将直接面对谷歌的竞争 [29][30] - 公司短期目标包括扩展到Windows、iOS、Android平台、建立开发者生态支持第三方AI应用集成,以及完善Agent模式功能提高任务执行成功率 [24] 行业影响与市场反应 - 在Atlas发布当日,谷歌股价盘中跌幅一度扩大至近5%,最低触及245美元,最终收跌2.21%,但这主要源于市场对谷歌AI Studio更新期待落空,而非Atlas直接影响 [41][42][45] - AI浏览器代表了下一代互联网交互方向,传统搜索引擎模式正被AI问答模式取代,用户希望直接得到答案而非搜索结果 [54] - 从长远看,AI浏览器可能只是过渡形态,最终形态将是能理解用户意图、主动完成任务、无缝连接各种服务的智能代理系统 [56]
OpenAI元老Karpathy 泼了盆冷水:智能体离“能干活”,还差十年
36氪· 2025-10-21 20:42
智能体发展时间框架 - 智能体距离真正成熟还需要十年时间,而非明年爆发 [2] - 当前智能体如Claude、Codex尚不成熟,缺乏多模态能力、持续学习能力和完整认知结构,无法胜任实际工作 [2] - 智能体发展的核心瓶颈在于认知组件不完整,需要系统性工程突破而非单纯计算力提升 [2] AI训练范式与架构革新 - 强化学习存在根本缺陷,其试错学习机制与人类学习方式背道而驰 [11] - 未来AI的关键方向是去知识化,保留核心算法让模型具备自我成长能力 [4] - 需要重建认知结构,当前Transformer仅相当于大脑皮层,缺乏情绪、空间记忆等关键组件 [4] - 真正的智能体需要突破上下文窗口限制,构建长期记忆系统 [4] - 未来认知核心可能仅需十亿参数,关键在于从低质量数据中提取高质量认知结构 [34][35][36] 代码生成能力现状 - 大语言模型在代码生成上存在显著认知缺陷,远未达到自动化AI工程程度 [6] - 模型在结构化、精细化工程设计上表现无力,容易产生幻觉 [7] - LLM训练于常规代码,倾向于防御性编程,无法理解用户架构意图 [7] - 模型有效应用场景包括语言翻译、非关键任务编程和自动补全加速 [9] - 当前LLM编程工具是连续演化的结果,而非突破性革命 [10] AGI落地路径与经济影响 - AGI定义为能完成任何经济价值任务且不逊于人类的系统,但首先应用于数字知识型工作 [38] - AGI将渐进式嵌入经济,不会瞬间颠覆世界,预计占GDP的2% [39][50] - 未来工作模式将是80%由Agent执行加20%人类监督的滑动式自主性 [40] - 代码是LLM最理想的落地沙盒,因其高度结构化、基础设施完备且经济回报明确 [42][43][44] - 部署路径从最结构化任务开始,逐步向上下游迁移,最终重构工作定义 [48][49] 人类学习机制与AI启示 - 人类学习通过思考、发问和讨论构建结构性理解,而非简单预测下一个token [22] - 模型存在悄无声息的崩溃现象,缺乏认知多样性,丧失探索能力 [26] - 做梦可能是进化出的反过拟合机制,通过随机游走维持认知灵活性 [28][29] - 人类记忆差是学习能力的前提,迫使抽象和模式提取,而模型记忆过多缺乏抽象 [32] - 未来AI需要构建梦境机制维持高熵状态,避免陷入死亡回路 [30][31] 自动驾驶技术挑战 - 自动驾驶是不能出错的AI任务,需要将错误概率压到接近零,而非功能完善80%就能上线 [59] - 当前最大障碍是常识推理,涉及社会理解而不仅是计算机视觉任务 [60] - 大语言模型是概率引擎而非保障引擎,不能承诺永远不出错 [61] - 自动驾驶需要全社会协同系统,包括监管、基础设施和伦理判断 [61] - 落地过程将是缓慢、渐进、区域化的系统替代,从高速公路物流开始扩展 [62][63] 智能演化与文化传承 - 人类智能是极端罕见的生物现象,智能不是演化必然终点 [51][52] - 人类独特性在于通过语言、模仿和教育跨代复制知识,绕开基因瓶颈 [53][54][56] - AI训练是为了让其成为文化的下一个节点,扩展文明操作系统 [57][58] - 文化复制可在一天内完成更新,相比基因演化的百万年是一大捷径 [55]
DeepSeek新模型被硅谷夸疯了!
华尔街见闻· 2025-10-21 18:13
核心观点 - DeepSeek发布的新模型DeepSeek-OCR采用“上下文光学压缩”技术,通过将文本信息压缩到图像中,利用视觉token高效处理长文本,显著降低大模型计算开销 [1][13][14] - 该模型参数规模为3B,但在主流文档解析基准OmniDocBench上取得新SOTA,实现“以小博大”的效能突破 [1][15][16] - 模型开源后迅速获得业界高度关注,在GitHub斩获3.3K star,HuggingFace热榜第二,并被评价可能开源了谷歌Gemini的核心商业机密,或是通往AGI的新路径 [7][10][11] 技术原理与架构 - 核心思想是“将视觉作为文本压缩媒介”,利用一张图片能包含大量文字且占用token更少的特性,实现文本信息的高效压缩 [5][14] - 模型由两大核心组件构成:编码器DeepEncoder负责将图片转为高度压缩的视觉token,解码器DeepSeek3B-MoE-A570M负责从视觉token中重建文字 [13][19][20] - 编码器采用“先局部处理,再压缩,后全局理解”的串行设计,通过16倍卷积压缩器将1024x1024图片产生的4096个token大幅削减至256个,控制内存开销 [21][22] - 模型支持从Tiny(512x512, 64token)到Gundam(动态分块,近800token)等多种输入模式,可灵活调整压缩强度以适应不同任务需求 [23][24][25] 性能表现与效率 - 在压缩率小于10倍时,模型OCR解码准确率高达97%;即使压缩率达到20倍,准确率仍保持在60%左右 [6] - 仅用100个视觉token,性能就超过了每页使用256个token的GOT-OCR2.0模型;Base版本使用256个视觉token即在OmniDocBench上达到0.137的整体性能指标 [18][19] - 数据生成效率极高,仅凭一块A100-40G GPU,每天就能生成超过20万页的优质LLM/VLM训练数据 [6] - 模型具备复杂图像解析能力,支持金融报表、化学分子式、数学几何图、100多种语言等 [25] 行业影响与潜在应用 - 该方法被评价为“AI的JPEG时刻”,为AI记忆架构打开了新路径,卡帕西等专家高度认可其“图像比文字更适合LLM输入”的理念 [8][9] - 研究团队提出用光学压缩模拟人类遗忘机制的脑洞想法,将近期记忆渲染为高分辨率图像,远期记忆渐进式压缩,为模型处理超长上下文提供新思路 [34][35][36][37] - 该技术路径被视为统一视觉与语言的方法,可能是通往AGI的大门之一 [11] - 模型延续了论文一作Haoran Wei在阶跃星辰时期主导的GOT-OCR2.0技术路径,团队核心成员Yaofeng Sun和Yukun Li持续参与DeepSeek多款模型研发 [27][28][29][31][32]
Karpathy泼冷水:AGI要等10年,根本没有「智能体元年」
36氪· 2025-10-21 10:15
AGI发展时间线 - 行业普遍鼓吹的“智能体元年”存在过度预测,更准确的描述应为“智能体的十年”[3][4] - 当前智能体仍处于非常初期的阶段,需要大约十年的持续研究工作才能让其真正可用[4][5] - 基于在AI行业约15年的经验和个人直觉,预测AGI的到来还需要10年时间[5][6][7] AI技术架构演进 - 预测未来10年AI的核心架构仍可能基于Transformer,但形态会有所演化[8] - 根据“时间平移不变性”,10年后仍将使用前向后向传播和梯度下降来训练巨大的神经网络,但所有组件都会变得更大[9][10] - 算法改进仅能将误差减半,进一步提升必须依靠更大的数据、更强的计算力和更优的软件系统,算法、数据、硬件与系统的进步缺一不可[12] 智能体现状与挑战 - 当前智能体存在智能不足、多模态能力弱、无法自主操作电脑等主要问题[4] - 智能体在认知上存在缺陷,缺乏持续学习能力,这些基础性问题的解决约需十年[5] - 在编码任务中,“手写+自动补全”是目前最佳选择,智能体擅长样板代码但处理“智力密集型代码”能力不足[13][15][16][17][18][20] 强化学习与模型训练 - 强化学习虽不完美,但相比过去仅模仿人的方法,仍是目前最优解[21][22] - 强化学习过程会产生大量噪声,且大语言模型充当评委时易被对抗性样本欺骗,存在泛化能力不足的问题[23][24] - 未来可能需要引入“元学习”或合成数据机制来改进模型评估,但目前尚无实验室在大规模通用环境下成功实现[26][27] 人工智能与人类学习对比 - 当前大模型仅通过预测下一个词学习,缺乏人类通过反思、讨论整合知识的“思考”过程[28] - 人类“不擅长记忆”是进化优势,迫使其学习可泛化模式,未来AI应减少机械记忆,更多依靠思考与探索[28][30] - 真正的智能不在于记忆更多,而在于理解与泛化,需要构建大模型压缩记忆工作,重点发展认知部分[30] AI对社会与工作的影响 - 通用人工智能被定义为能够以人类或更好的表现完成任何有经济价值任务的系统,但已从最初定义中移除了物理性任务[31] - 放射科医生和呼叫中心等工作未被完全自动化,因其涉及复杂工作场景,理想状态是AI完成80%工作量,人类监督完成剩余20%[32][33][34] - 更看重AI与人类的互补关系,而非替代关系,现实中许多工作比呼叫中心员工的工作复杂得多[35][36] 超级智能与社会自动化 - 超级智能被视为社会自动化进程的自然延伸,将出现越来越多从事数字工作和体力工作的自主实体[37] - AI驱动的自动化会显得“非常陌生和奇怪”,当世界在计算机集群上运行时,人类可能逐渐失去对正在发生的事情的控制和理解[37] - 从工业革命开始,递归式自我改进和智能爆炸已持续数百年,我们处于“智能爆炸”中已有几十年[37][38]
华为招募全球顶尖AI人才,余承东发声
观察者网· 2025-10-21 09:41
公司战略与目标 - 公司发布全球顶尖AI人才招募令 旨在打造世界一流的AI团队并构建领先世界的大模型 以攀登通用人工智能(AGI)的巅峰 [1] - 公司常务董事被任命为产品投资评审委员会(IRB)主任 核心任务是带领公司在人工智能领域取得全球领先地位 被内部视为打赢AI关键战役的核心领导人 [8] - IRB负责对公司重大战略方向的资源投入和项目立项进行关键决策 以确保资源高效聚焦核心战略目标 [8] 人才招募要求 - 对求职者的要求包括学术先锋 需要成绩优异 具备扎实数理功底与持续学习能力 或拥有重量级科研成果/论文/专利 或曾在国际顶级竞赛获奖 [3] - 要求求职者具备技术热情 对人工智能领域怀揣坚定技术信仰与热忱 有志于成为技术领军人物 [3] - 要求求职者具备创新思维 勇于创新突破 精于洞察 穿透技术本质并愿意付诸实践 [3] 人才待遇与资源 - 公司将提供行业内具有竞争力的薪酬 [5] - 公司将提供攻克全球前沿AI技术难题 参与打造世界领先大模型项目的机会 并有机会与图灵奖 菲尔兹奖获得者共事 [5] - 公司将提供充足的算力 供入职者自由调度 [5] 招聘对象与岗位详情 - 招募对象为2026年毕业的国内高校本科生与硕士研究生 以及2025至2026年毕业的国内高校博士生与海外高校本硕博学生 [7] - 本硕岗位招聘AI软件工程师 AI算法工程师 AI数据工程师等 [7] - 博士岗位招聘AI算法 大模型算法 多模态算法 大模型应用 机器学习等 [7] - 工作地点包括深圳 北京 上海 东莞 南京 武汉 杭州 西安等多个城市 [7]
某巨头史上最大规模裁员!遣散费最高超400万;曝阿里夸克秘密开展C计划AI业务,或对标字节豆包;格力朱磊曝友商买水军丨雷峰早报
雷峰网· 2025-10-21 08:41
格力电器市场争议 - 格力电器市场总监朱磊公开质疑网络出现大量内容一致的视频,对比小米空调1700元与格力空调3000多元的价格,并暗指小米创始人雷军[4] - 网友核查发现相关视频实际在贬低小米、抬高格力品质,并调侃朱磊曝光的是格力自身的水军[4] - 朱磊后续回应称出现汽车博主用统一话术为其辩护,并强调“再高明的公关套路也无法与良知为敌”[5] - 格力此前通报某MCN机构诋毁格力被判赔偿16万元,朱磊转发时提及“不群”但否认指华为[5] 阿里巴巴AI业务动态 - 阿里夸克被曝内部秘密推进代号“C计划”的AI业务,由夸克核心团队主导,通义实验室高级别成员参与[8][9] - 该计划与对话式AI应用相关,首个成果即将落地,内部猜测代号“C”可能代表“Chat”或对标字节“豆包”[9] - 夸克方面未就相关消息作出回应[9] 美光科技中国市场调整 - 美光公司因未通过中国网络安全审查,计划停止向中国数据中心供应服务器芯片,完全退出该市场[9] - 中国大陆和香港销售收入曾占美光总收入约25%,约一半中国客户收入面临风险[10] - 美光在中国大陆收入占比从2023年14.03%降至2024年12.1%,2025年进一步跌至7.1%[10] - 禁令后美光仍投资超过43亿元升级西安封装测试工厂,并与福建晋华达成全球和解[10] 字节跳动短剧业务拓展 - 红果短剧开启小范围内测短剧带货功能,观看时自动弹出“搜同款”商品提示,该功能复制自抖音电商[10] - 2025年6月红果用户规模同比增长179.0%,月活达到2.12亿,超越优酷的2.006亿月活[11] - 抖音方面对短剧带货功能暂无官方回应[10] 美团组织与人才建设 - 美团CEO王兴宣布软硬件服务负责人肖飞、Keeta负责人仇广宇加入S-team最高管理团队[11] - 肖飞2014年加入美团,现任软硬件服务负责人;仇广宇2022年加入,负责境外业务[11] - 过去五年美团内部晋升多名副总裁及以上高管,其中大多数为“80后”[12] 大疆组织人员变动 - 大疆海外门店负责人Vincent(屈炀)近期离职,业务暂由销售负责人Charlie接管,公司正紧急招聘新负责人[12] - 今年以来大疆销售部门人员变动频繁,拉美地区负责人等核心销售员工离职后加入影石和追觅等竞争对手[12] - 消息称大疆未与部分核心人员签订竞业协议,导致其将公司策略复制至竞对[13] 格力电器员工福利 - 格力电器向员工发放TOSOT G7型号手机,该手机由魅族设计生产,系统锁定底层无法刷Flyme系统[14] - 格力TOSOT G7外观神似魅族18X,采用高通骁龙870处理器,后置6400万像素三摄[14] 美团机器人技术展望 - 美团王兴兴表示具身智能若实现则距离AGI(通用人工智能)不远,AGI将成为人类终极发明[16] - 其认为当前一代人非常有实现机会,因未来50年具身智能可能实现,且算力芯片能力强大[16] 奇瑞汽车行业观点 - 奇瑞董事长尹同跃认为汽车行业竞争已进入“极致”阶段,需靠极致品牌能力、创新、制造效率与低供应链成本突围[17] - 其设想汽车终极形态是“出行自由”,未来人人或无需拥有汽车,汽车本身将进化成“无所不能的机器人”[17] DeepSeek AI技术突破 - DeepSeek-AI团队开源DeepSeek-OCR模型,参数量3B,利用视觉模态压缩长文本上下文[19] - 当文本token数量不超过视觉token的10倍时,模型OCR精度达97%;压缩比20×时准确率保持约60%[20] - 在OmniDocBench测试中,使用100个视觉token超过GOT-OCR2.0,不到800个token优于MinerU2.0[20] - 实际生产中可在单块A100-40G显卡上每天生成超过20万页训练数据[20] 京东汽车业务进展 - 京东汽车更新新车参数,采用高强度笼式设计,高强度钢占比超70%,车身抗冲击性提升18%[22] - 车辆麋鹿测试成绩超75km/h,整备质量超同级车型300kg,轮距宽于行业45mm[22] - 京东汽车释放多个高薪岗位,部分年薪突破百万元,为“国民好车”上市储备人才[22] - “国民好车”由京东联合广汽、宁德时代推出,001号车以1元起拍价开启预订,最终成交价由用户竞拍决定[23] 法拉第未来车型进展 - 法拉第未来宣布FX品牌首款MPV车型Super One达成重大里程碑,进入年底首车下线冲刺阶段[25] - 公司已与供应商签署首批零部件采购协议,零部件完成付款并即将起运[25] - Super One采用FF EAI具身智能体6×4技术架构,前脸为LED显示屏设计,瞄准明星名人、商务人士和家庭用户[25][26] 元戎启行智驾交付成绩 - 元戎启行宣布辅助驾驶累计交付量超13万辆,9月单月突破3万辆,成为少数实现“单月3万+全系标配城市NOA”的第三方供应商[28] - 交付量提升来自魏牌高山、蓝山及吉利银河M9三款车型销量背书,魏牌高山9月以7768辆获新能源MPV销量冠军[28] - 公司交付曲线呈现跨越式增长,从2025年6月单月1万辆升至9月3万辆,3个月内实现3倍增长,增速超行业15%~20%平均水平[28] 宇树科技机器人发布 - 宇树科技发布H2仿生人形机器人,高180cm重70kg,关节总数达31个,较7月发布的R1提升约19%[28][29] - H2机器人可进行芭蕾舞、中国武术表演和模特走秀,动作灵活稳定,几乎无生硬感觉[29] - 产品增加仿生人脸,网友评论其为“世界上最像人的仿生机器人”,但也被认为恐怖谷效应拉满[30] 爱诗科技融资与业绩 - 爱诗科技完成1亿元人民币B+轮融资,由复星锐正、同创伟业等投资,用于技术研发和市场拓展[32] - 公司旗下PixVerse与拍我AI用户规模突破一亿,年度经常性收入(ARR)超过4000万美元,产品MAU超1600万[32] - 公司2024年11月正式商业化,不到一年时间收入增长超过10倍[32] 支付宝广告调整 - 支付宝宣布暂停AI健康管家AQ在首页的广告投放,因广告创意与用户理解存在显著偏差,遭大量用户投诉[32] - 蚂蚁集团于今年6月发布AQ应用,整合支付宝账号与医疗资源,打造AI问诊到就医服务闭环[33] 华为与江淮汽车合作 - 尊界汽车微信公众号账号主体由华为终端变更为江淮汽车,预计后续由江淮负责运营[35] - 尊界S800车型上市4个月累计大定突破1.5万辆,在70万以上超豪华轿车9月销量排行榜中位列第一[35] - 江汽集团与华为在今年6月签署战略合作协议,计划推动华为智能汽车解决方案在江汽车型平台搭载[35] 视觉中国AI合作进展 - 视觉中国表示与字节剪映的合作已有收入确认,该项合作是公司在AI应用领域的重要布局[35] - 公司正与国内领先AIGC内容生成服务商合作,推动AI生成+版权商业模式落地[35] 苹果eSIM功能规划 - 苹果确认未来在中国大陆推出eSIM快速转换功能,国行iPhone Air用户换机时无需再跑营业厅[36] - 国行iPhone Air在海外开通eSIM后回国可正常使用,但仅支持双eSIM卡,海外机型可开通8张以上eSIM[36] 梅赛德斯-奔驰裁员计划 - 梅赛德斯-奔驰实施大规模裁员,约4000名员工接受遣散方案离职,资深管理人员最高可获得50万欧元补偿金(约合人民币415万)[38] - 该转型计划面向约4万名员工开放,公司希望通过外包、不补空缺及遣散费等方式,到2027年每年节省约50亿欧元[38] 特斯拉管理层动态 - 马斯克公开威胁若得不到高额薪酬将离开特斯拉或辞去CEO职务,特斯拉股东即将对其新薪酬方案进行投票[38] - 有报道指出即使公司市值增长低于标普平均水平,马斯克仍可能获得价值200亿至400亿美元的报酬[39] 苹果AI团队变动 - 知名爆料人称苹果基础模型团队失去领导者和创始成员,以及十几名顶尖AI研究人员,高级管理岗也加入离职行列[39] - 分管“答案、知识和资讯”团队的Ke Yang即将跳槽至Meta,其任职时长仅数周,前主管罗比·沃克也刚离职[40] - 苹果机器学习和AI战略高级副总裁约翰·詹南德雷亚权能被削减,新Siri开发已转交软件部门,公司可能在面试外部候选人替换其职位[40] 特斯拉新车规划 - 特斯拉确认新一代Roadster将在今年如期亮相,首席设计师称其将突破物理极限,0–100km/h加速目标不到1秒[40][41] - 该车型将提供完全独特的车身喷漆选择,计划在2025年底前正式展示并演示[41] - Model Y标准版美国起售价39990美元(约合28.4万元人民币),被描述为在价格之上有高端感[41] Waymo外卖配送合作 - 美国外卖平台DoorDash与谷歌Waymo合作,将无人驾驶出租车纳入外送服务体系,测试区域覆盖菲尼克斯大都会区816公里[43] - 用户可通过DoorDash应用程序选择Waymo无人车配送,餐品送达后自助开启车辆后车厢提取[43] - 目前仅DoorDash自营店铺可使用该服务,未来将逐步扩大合作范围[43] 兰博基尼电动化战略 - 兰博基尼暂缓全面电动化,将在未来十年保留内燃机,因高端客户仍追求“声音与情感”[44] - 公司考虑将原计划的全电动GT车型Lanzador改为插电式混动版本,首款纯电SUV已推迟至2035年后[44] - 公司称全球每年生产8000万辆汽车而其仅销售约一万辆,因此对二氧化碳排放影响不大[44] OpenAI联合创始人AI观点 - OpenAI联合创始人Andrej Karpathy认为AI智能体距离“功能完善”还需约十年时间,当前智能体不够智能且不好用[45] - 其批评行业造工具速度超过AI本身能力,理想状态是人类与AI协作而非被排除在外[45] - Karpathy自称相比旧金山AI圈乐观氛围其时间预期悲观5到10倍,但相比完全否定AI者仍属乐观[45]
腾讯研究院AI速递 20251021
腾讯研究院· 2025-10-21 00:01
AI基础设施与算力 - 甲骨文推出全球最大云端AI超级计算机OCI Zettascale10,由80万块NVIDIA GPU组成,峰值算力达16 ZettaFLOPS,计划于2026年下半年向客户提供服务[1] - 该超算采用独创Acceleron RoCE网络架构,通过每块GPU的NIC充当小型交换机连接多个隔离网络平面,以降低通信延迟并确保故障时自动切换路径[1] 大语言模型进展 - 谷歌Gemini 3.0疑似以lithiumflow(Pro版)和orionmist(Flash版)马甲上线评测,Gemini 3 Pro成为首个能精确识别钟表时间的AI模型,在SVG绘制和音乐作曲方面表现出色[2] - 谷歌向所有开发者开放Gemini API调用谷歌地图工具功能,可整合2.5亿个地点的位置感知,按每1000条有事实依据的提示收费25美元,支持路线规划等场景[7] - DeepSeek开源3B参数OCR模型DeepSeek-OCR,通过光学二维映射技术实现长文本上下文压缩,压缩率小于10倍时OCR精度达97%[3] AI应用与产品创新 - 元宝AI录音笔推出新功能,基于腾讯天籁降噪技术实现录音转写,并具备“内心OS”功能解读发言人弦外之音,支持多人发言智能拆分[4] - Vidu Q2参考生功能正式上线,推理速度比Q1版本快3倍,支持多主体一致性生成,免费用户可生成最长30秒视频,付费用户最长可延长至5分钟[5][6] - 宇树发布180cm仿生人形机器人H2,体重70kg,关节总数31个比前代增加约19%,可跳芭蕾舞和表演武术,应用场景扩展至娱乐演示和陪伴服务[9] AI性能评测与市场表现 - 实盘交易实验显示DeepSeek V3.1在1万美元本金下盈利超3500美元排名第一,仅进行5次交易,而Gemini 2.5 Pro进行45次交易成为赔钱最多的模型[8] - DeepSeek-OCR模型在OmniDocBench测试中仅用100个视觉token超越GOT-OCR2.0,单张A100-40G GPU每天可生成超20万页训练数据[3] 行业专家观点 - Karpathy预测AGI仍需十年时间,认为强化学习效率极低像“通过吸管吸取监督信号”,需要新的学习机制[10] - 提出“认知核心”概念,建议通过精简LLMs和提高泛化能力,预测未来模型将先变大再变小,最终收敛向更小更专注的认知内核[11]
Analyst Explains Why NVIDIA (NVDA) is Investing In Its Own Customers
Yahoo Finance· 2025-10-20 21:17
文章核心观点 - 英伟达是当前人工智能基础设施资本开支热潮的最大受益者,其投资于自身客户的行为被解读为旨在加速实现通用人工智能,以维持并推动其巨大的市场需求 [1][2] - 尽管业绩表现极为强劲,但有观点对人工智能数据中心建设的狂热可能导致的产能过剩表示担忧,这种担忧尚未成为现实 [3][4] 英伟达的客户集中度与收入构成 - 在2026财年第二季度,三家直接客户分别占英伟达应收账款的23%、19%和14% [2] - 公司几乎所有收入均来自人工智能相关的基础设施开支,在最近一个季度,467亿美元的总收入中有413亿美元来自此类客户 [2] 对人工智能投资周期的看法 - 当前的繁荣周期与互联网泡沫不同,其本质是资本密集型的技术资本开支,这意味着市场低迷时真正的行业领导者将有机会脱颖而出 [1] - 如果主要科技公司因投资回报率不足而放缓开支,或者投资者察觉到资本开支的疲软,英伟达的股价将首当其冲受到影响 [2] 英伟达近期业绩与市场地位 - 公司第一季度业绩极为稳健,尽管对中国特定的数据中心产品进行了减记,并在指引中排除了未来中国的贡献,但中国以外地区的需求评论非常令人鼓舞 [4] - 英伟达的增长超出了预期,并且以巨大优势超越了竞争对手的ASIC产品,尽管面临供应限制 [4] - 有基金在当季基准上涨46%的情况下,对英伟达持低配立场,原因是担心中短期人工智能数据中心的狂热建设可能导致产能过剩 [4]