AGI
搜索文档
华为招募全球顶尖AI人才,余承东发声
观察者网· 2025-10-21 09:41
公司战略与目标 - 公司发布全球顶尖AI人才招募令 旨在打造世界一流的AI团队并构建领先世界的大模型 以攀登通用人工智能(AGI)的巅峰 [1] - 公司常务董事被任命为产品投资评审委员会(IRB)主任 核心任务是带领公司在人工智能领域取得全球领先地位 被内部视为打赢AI关键战役的核心领导人 [8] - IRB负责对公司重大战略方向的资源投入和项目立项进行关键决策 以确保资源高效聚焦核心战略目标 [8] 人才招募要求 - 对求职者的要求包括学术先锋 需要成绩优异 具备扎实数理功底与持续学习能力 或拥有重量级科研成果/论文/专利 或曾在国际顶级竞赛获奖 [3] - 要求求职者具备技术热情 对人工智能领域怀揣坚定技术信仰与热忱 有志于成为技术领军人物 [3] - 要求求职者具备创新思维 勇于创新突破 精于洞察 穿透技术本质并愿意付诸实践 [3] 人才待遇与资源 - 公司将提供行业内具有竞争力的薪酬 [5] - 公司将提供攻克全球前沿AI技术难题 参与打造世界领先大模型项目的机会 并有机会与图灵奖 菲尔兹奖获得者共事 [5] - 公司将提供充足的算力 供入职者自由调度 [5] 招聘对象与岗位详情 - 招募对象为2026年毕业的国内高校本科生与硕士研究生 以及2025至2026年毕业的国内高校博士生与海外高校本硕博学生 [7] - 本硕岗位招聘AI软件工程师 AI算法工程师 AI数据工程师等 [7] - 博士岗位招聘AI算法 大模型算法 多模态算法 大模型应用 机器学习等 [7] - 工作地点包括深圳 北京 上海 东莞 南京 武汉 杭州 西安等多个城市 [7]
某巨头史上最大规模裁员!遣散费最高超400万;曝阿里夸克秘密开展C计划AI业务,或对标字节豆包;格力朱磊曝友商买水军丨雷峰早报
雷峰网· 2025-10-21 08:41
格力电器市场争议 - 格力电器市场总监朱磊公开质疑网络出现大量内容一致的视频,对比小米空调1700元与格力空调3000多元的价格,并暗指小米创始人雷军[4] - 网友核查发现相关视频实际在贬低小米、抬高格力品质,并调侃朱磊曝光的是格力自身的水军[4] - 朱磊后续回应称出现汽车博主用统一话术为其辩护,并强调“再高明的公关套路也无法与良知为敌”[5] - 格力此前通报某MCN机构诋毁格力被判赔偿16万元,朱磊转发时提及“不群”但否认指华为[5] 阿里巴巴AI业务动态 - 阿里夸克被曝内部秘密推进代号“C计划”的AI业务,由夸克核心团队主导,通义实验室高级别成员参与[8][9] - 该计划与对话式AI应用相关,首个成果即将落地,内部猜测代号“C”可能代表“Chat”或对标字节“豆包”[9] - 夸克方面未就相关消息作出回应[9] 美光科技中国市场调整 - 美光公司因未通过中国网络安全审查,计划停止向中国数据中心供应服务器芯片,完全退出该市场[9] - 中国大陆和香港销售收入曾占美光总收入约25%,约一半中国客户收入面临风险[10] - 美光在中国大陆收入占比从2023年14.03%降至2024年12.1%,2025年进一步跌至7.1%[10] - 禁令后美光仍投资超过43亿元升级西安封装测试工厂,并与福建晋华达成全球和解[10] 字节跳动短剧业务拓展 - 红果短剧开启小范围内测短剧带货功能,观看时自动弹出“搜同款”商品提示,该功能复制自抖音电商[10] - 2025年6月红果用户规模同比增长179.0%,月活达到2.12亿,超越优酷的2.006亿月活[11] - 抖音方面对短剧带货功能暂无官方回应[10] 美团组织与人才建设 - 美团CEO王兴宣布软硬件服务负责人肖飞、Keeta负责人仇广宇加入S-team最高管理团队[11] - 肖飞2014年加入美团,现任软硬件服务负责人;仇广宇2022年加入,负责境外业务[11] - 过去五年美团内部晋升多名副总裁及以上高管,其中大多数为“80后”[12] 大疆组织人员变动 - 大疆海外门店负责人Vincent(屈炀)近期离职,业务暂由销售负责人Charlie接管,公司正紧急招聘新负责人[12] - 今年以来大疆销售部门人员变动频繁,拉美地区负责人等核心销售员工离职后加入影石和追觅等竞争对手[12] - 消息称大疆未与部分核心人员签订竞业协议,导致其将公司策略复制至竞对[13] 格力电器员工福利 - 格力电器向员工发放TOSOT G7型号手机,该手机由魅族设计生产,系统锁定底层无法刷Flyme系统[14] - 格力TOSOT G7外观神似魅族18X,采用高通骁龙870处理器,后置6400万像素三摄[14] 美团机器人技术展望 - 美团王兴兴表示具身智能若实现则距离AGI(通用人工智能)不远,AGI将成为人类终极发明[16] - 其认为当前一代人非常有实现机会,因未来50年具身智能可能实现,且算力芯片能力强大[16] 奇瑞汽车行业观点 - 奇瑞董事长尹同跃认为汽车行业竞争已进入“极致”阶段,需靠极致品牌能力、创新、制造效率与低供应链成本突围[17] - 其设想汽车终极形态是“出行自由”,未来人人或无需拥有汽车,汽车本身将进化成“无所不能的机器人”[17] DeepSeek AI技术突破 - DeepSeek-AI团队开源DeepSeek-OCR模型,参数量3B,利用视觉模态压缩长文本上下文[19] - 当文本token数量不超过视觉token的10倍时,模型OCR精度达97%;压缩比20×时准确率保持约60%[20] - 在OmniDocBench测试中,使用100个视觉token超过GOT-OCR2.0,不到800个token优于MinerU2.0[20] - 实际生产中可在单块A100-40G显卡上每天生成超过20万页训练数据[20] 京东汽车业务进展 - 京东汽车更新新车参数,采用高强度笼式设计,高强度钢占比超70%,车身抗冲击性提升18%[22] - 车辆麋鹿测试成绩超75km/h,整备质量超同级车型300kg,轮距宽于行业45mm[22] - 京东汽车释放多个高薪岗位,部分年薪突破百万元,为“国民好车”上市储备人才[22] - “国民好车”由京东联合广汽、宁德时代推出,001号车以1元起拍价开启预订,最终成交价由用户竞拍决定[23] 法拉第未来车型进展 - 法拉第未来宣布FX品牌首款MPV车型Super One达成重大里程碑,进入年底首车下线冲刺阶段[25] - 公司已与供应商签署首批零部件采购协议,零部件完成付款并即将起运[25] - Super One采用FF EAI具身智能体6×4技术架构,前脸为LED显示屏设计,瞄准明星名人、商务人士和家庭用户[25][26] 元戎启行智驾交付成绩 - 元戎启行宣布辅助驾驶累计交付量超13万辆,9月单月突破3万辆,成为少数实现“单月3万+全系标配城市NOA”的第三方供应商[28] - 交付量提升来自魏牌高山、蓝山及吉利银河M9三款车型销量背书,魏牌高山9月以7768辆获新能源MPV销量冠军[28] - 公司交付曲线呈现跨越式增长,从2025年6月单月1万辆升至9月3万辆,3个月内实现3倍增长,增速超行业15%~20%平均水平[28] 宇树科技机器人发布 - 宇树科技发布H2仿生人形机器人,高180cm重70kg,关节总数达31个,较7月发布的R1提升约19%[28][29] - H2机器人可进行芭蕾舞、中国武术表演和模特走秀,动作灵活稳定,几乎无生硬感觉[29] - 产品增加仿生人脸,网友评论其为“世界上最像人的仿生机器人”,但也被认为恐怖谷效应拉满[30] 爱诗科技融资与业绩 - 爱诗科技完成1亿元人民币B+轮融资,由复星锐正、同创伟业等投资,用于技术研发和市场拓展[32] - 公司旗下PixVerse与拍我AI用户规模突破一亿,年度经常性收入(ARR)超过4000万美元,产品MAU超1600万[32] - 公司2024年11月正式商业化,不到一年时间收入增长超过10倍[32] 支付宝广告调整 - 支付宝宣布暂停AI健康管家AQ在首页的广告投放,因广告创意与用户理解存在显著偏差,遭大量用户投诉[32] - 蚂蚁集团于今年6月发布AQ应用,整合支付宝账号与医疗资源,打造AI问诊到就医服务闭环[33] 华为与江淮汽车合作 - 尊界汽车微信公众号账号主体由华为终端变更为江淮汽车,预计后续由江淮负责运营[35] - 尊界S800车型上市4个月累计大定突破1.5万辆,在70万以上超豪华轿车9月销量排行榜中位列第一[35] - 江汽集团与华为在今年6月签署战略合作协议,计划推动华为智能汽车解决方案在江汽车型平台搭载[35] 视觉中国AI合作进展 - 视觉中国表示与字节剪映的合作已有收入确认,该项合作是公司在AI应用领域的重要布局[35] - 公司正与国内领先AIGC内容生成服务商合作,推动AI生成+版权商业模式落地[35] 苹果eSIM功能规划 - 苹果确认未来在中国大陆推出eSIM快速转换功能,国行iPhone Air用户换机时无需再跑营业厅[36] - 国行iPhone Air在海外开通eSIM后回国可正常使用,但仅支持双eSIM卡,海外机型可开通8张以上eSIM[36] 梅赛德斯-奔驰裁员计划 - 梅赛德斯-奔驰实施大规模裁员,约4000名员工接受遣散方案离职,资深管理人员最高可获得50万欧元补偿金(约合人民币415万)[38] - 该转型计划面向约4万名员工开放,公司希望通过外包、不补空缺及遣散费等方式,到2027年每年节省约50亿欧元[38] 特斯拉管理层动态 - 马斯克公开威胁若得不到高额薪酬将离开特斯拉或辞去CEO职务,特斯拉股东即将对其新薪酬方案进行投票[38] - 有报道指出即使公司市值增长低于标普平均水平,马斯克仍可能获得价值200亿至400亿美元的报酬[39] 苹果AI团队变动 - 知名爆料人称苹果基础模型团队失去领导者和创始成员,以及十几名顶尖AI研究人员,高级管理岗也加入离职行列[39] - 分管“答案、知识和资讯”团队的Ke Yang即将跳槽至Meta,其任职时长仅数周,前主管罗比·沃克也刚离职[40] - 苹果机器学习和AI战略高级副总裁约翰·詹南德雷亚权能被削减,新Siri开发已转交软件部门,公司可能在面试外部候选人替换其职位[40] 特斯拉新车规划 - 特斯拉确认新一代Roadster将在今年如期亮相,首席设计师称其将突破物理极限,0–100km/h加速目标不到1秒[40][41] - 该车型将提供完全独特的车身喷漆选择,计划在2025年底前正式展示并演示[41] - Model Y标准版美国起售价39990美元(约合28.4万元人民币),被描述为在价格之上有高端感[41] Waymo外卖配送合作 - 美国外卖平台DoorDash与谷歌Waymo合作,将无人驾驶出租车纳入外送服务体系,测试区域覆盖菲尼克斯大都会区816公里[43] - 用户可通过DoorDash应用程序选择Waymo无人车配送,餐品送达后自助开启车辆后车厢提取[43] - 目前仅DoorDash自营店铺可使用该服务,未来将逐步扩大合作范围[43] 兰博基尼电动化战略 - 兰博基尼暂缓全面电动化,将在未来十年保留内燃机,因高端客户仍追求“声音与情感”[44] - 公司考虑将原计划的全电动GT车型Lanzador改为插电式混动版本,首款纯电SUV已推迟至2035年后[44] - 公司称全球每年生产8000万辆汽车而其仅销售约一万辆,因此对二氧化碳排放影响不大[44] OpenAI联合创始人AI观点 - OpenAI联合创始人Andrej Karpathy认为AI智能体距离“功能完善”还需约十年时间,当前智能体不够智能且不好用[45] - 其批评行业造工具速度超过AI本身能力,理想状态是人类与AI协作而非被排除在外[45] - Karpathy自称相比旧金山AI圈乐观氛围其时间预期悲观5到10倍,但相比完全否定AI者仍属乐观[45]
腾讯研究院AI速递 20251021
腾讯研究院· 2025-10-21 00:01
AI基础设施与算力 - 甲骨文推出全球最大云端AI超级计算机OCI Zettascale10,由80万块NVIDIA GPU组成,峰值算力达16 ZettaFLOPS,计划于2026年下半年向客户提供服务[1] - 该超算采用独创Acceleron RoCE网络架构,通过每块GPU的NIC充当小型交换机连接多个隔离网络平面,以降低通信延迟并确保故障时自动切换路径[1] 大语言模型进展 - 谷歌Gemini 3.0疑似以lithiumflow(Pro版)和orionmist(Flash版)马甲上线评测,Gemini 3 Pro成为首个能精确识别钟表时间的AI模型,在SVG绘制和音乐作曲方面表现出色[2] - 谷歌向所有开发者开放Gemini API调用谷歌地图工具功能,可整合2.5亿个地点的位置感知,按每1000条有事实依据的提示收费25美元,支持路线规划等场景[7] - DeepSeek开源3B参数OCR模型DeepSeek-OCR,通过光学二维映射技术实现长文本上下文压缩,压缩率小于10倍时OCR精度达97%[3] AI应用与产品创新 - 元宝AI录音笔推出新功能,基于腾讯天籁降噪技术实现录音转写,并具备“内心OS”功能解读发言人弦外之音,支持多人发言智能拆分[4] - Vidu Q2参考生功能正式上线,推理速度比Q1版本快3倍,支持多主体一致性生成,免费用户可生成最长30秒视频,付费用户最长可延长至5分钟[5][6] - 宇树发布180cm仿生人形机器人H2,体重70kg,关节总数31个比前代增加约19%,可跳芭蕾舞和表演武术,应用场景扩展至娱乐演示和陪伴服务[9] AI性能评测与市场表现 - 实盘交易实验显示DeepSeek V3.1在1万美元本金下盈利超3500美元排名第一,仅进行5次交易,而Gemini 2.5 Pro进行45次交易成为赔钱最多的模型[8] - DeepSeek-OCR模型在OmniDocBench测试中仅用100个视觉token超越GOT-OCR2.0,单张A100-40G GPU每天可生成超20万页训练数据[3] 行业专家观点 - Karpathy预测AGI仍需十年时间,认为强化学习效率极低像“通过吸管吸取监督信号”,需要新的学习机制[10] - 提出“认知核心”概念,建议通过精简LLMs和提高泛化能力,预测未来模型将先变大再变小,最终收敛向更小更专注的认知内核[11]
Analyst Explains Why NVIDIA (NVDA) is Investing In Its Own Customers
Yahoo Finance· 2025-10-20 21:17
文章核心观点 - 英伟达是当前人工智能基础设施资本开支热潮的最大受益者,其投资于自身客户的行为被解读为旨在加速实现通用人工智能,以维持并推动其巨大的市场需求 [1][2] - 尽管业绩表现极为强劲,但有观点对人工智能数据中心建设的狂热可能导致的产能过剩表示担忧,这种担忧尚未成为现实 [3][4] 英伟达的客户集中度与收入构成 - 在2026财年第二季度,三家直接客户分别占英伟达应收账款的23%、19%和14% [2] - 公司几乎所有收入均来自人工智能相关的基础设施开支,在最近一个季度,467亿美元的总收入中有413亿美元来自此类客户 [2] 对人工智能投资周期的看法 - 当前的繁荣周期与互联网泡沫不同,其本质是资本密集型的技术资本开支,这意味着市场低迷时真正的行业领导者将有机会脱颖而出 [1] - 如果主要科技公司因投资回报率不足而放缓开支,或者投资者察觉到资本开支的疲软,英伟达的股价将首当其冲受到影响 [2] 英伟达近期业绩与市场地位 - 公司第一季度业绩极为稳健,尽管对中国特定的数据中心产品进行了减记,并在指引中排除了未来中国的贡献,但中国以外地区的需求评论非常令人鼓舞 [4] - 英伟达的增长超出了预期,并且以巨大优势超越了竞争对手的ASIC产品,尽管面临供应限制 [4] - 有基金在当季基准上涨46%的情况下,对英伟达持低配立场,原因是担心中短期人工智能数据中心的狂热建设可能导致产能过剩 [4]
诺贝尔经济学奖背后的 AI 投资主线|AGIX PM Notes
海外独角兽· 2025-10-20 20:05
AGIX指数定位与表现 - AGIX指数旨在成为衡量AGI时代科技范式的重要指标,类似于纳斯达克100指数在互联网时代的地位 [2] - 指数年初至今回报率达31.87%,自2024年以来累计回报达81.64%,显著跑赢标普500指数(18.13%和47.47%)及纳斯达克100指数(13.30%和39.71%)[5] - 指数权重分布为应用层39.73%、半导体与硬件30.11%、基础设施24.74% [6] 创新驱动增长的经济理论 - 2025年诺贝尔经济学奖授予系统阐释“创新驱动经济增长”理论的经济学家,该理论强调技术创新具有“递增收益”特征,能提升所有生产要素的生产率 [9] - 知识要素具有“非竞争性、部分非排他性”特征,知识越积累、创新越多,后续创新的边际成本反而下降 [9] - AI作为技术和知识集合,其核心能力一旦开发可被大规模复制、迁移和二次创新,理论上不存在资本那样的“边际收益递减”现象 [10] AI驱动的商业模式变革 - AI生产力工具覆盖的市场空间体量巨大,标普500成分公司2024年销售/管理和行政费用总数约为6.2万亿美元 [10] - OpenAI的Sora模型将版权从传统“单次授权模式”转变为“按次付费”的微交易模式,颠覆了Netflix向迪士尼支付每年3.5亿美元固定授权费的体系 [11] - 微交易模式让版权方可以从每一次创意调用中获得即时收益,相当于将Spotify的“每播放0.003-0.005美元”模式应用到视觉内容创作领域 [11] 企业AI能力评估框架 - 企业AI潜力可概括为Agent密度、Context Token化程度和Agent能力三项相乘 [14] - Agent密度可用AI席位渗透率表达,即Copilot/自研助手订阅数占员工数的比例 [14] - Context Token化程度可分解为云化/SaaS化程度以及业务流程被AI重新处理的广度与深度 [14] - Agent能力可理解为Token Consumption的ROI,宏观层面可观察引入AI后的毛利率趋势与单位计算成本下降的改善 [15] 全球市场动态与仓位调整 - 全球股票市场经历自7月以来最大规模去杠杆,美国多空基金净杠杆从57%降至52% [15] - TMT板块成为卖压核心,无盈利科技股及软件类公司被显著减持,但半导体相关个股仍获部分加仓 [15] - 美国多空基金总杠杆环比上升5%至217%,创2010年以来新高 [15] AI基础设施与生态进展 - Meta与Oracle将在AI数据中心大规模部署NVIDIA Spectrum-X以太网方案,标志着以太网在超大规模AI训练网络中可行性获验证 [17] - Anthropic推出Skills功能,为Claude提供可复用的任务能力模块,将模型从对话助手提升为可执行任务的代理 [18] - Oracle公布两大AI集群蓝图,最高可扩展至八十万片NVIDIA GPU,标志头部云厂商由单一架构转向多供应商异构 [19] - 微软、英伟达与贝莱德等发起AI基建联盟,以约400亿美元收购Aligned Data Centers,后者在北美与拉美拥有接近八十座数据中心 [19] 企业级AI应用集成 - Snowflake与Palantir深化企业级集成,连接数据治理能力与AI应用编排框架,缩短从数据到应用的路径 [20] - Salesforce发布Agentforce 360集成,用户可在ChatGPT界面直接检索并操作Salesforce数据,形成多模型择优策略 [20] - Arm与Meta推进多层协同,从PyTorch在Arm架构上的深度优化到数据中心层面的高能效架构协同 [21] 先进AI算力系统部署 - 英伟达披露Vera Rubin愿景,以800V直流电力架构替代传统415VAC,面向千兆瓦级AI工厂 [21] - OpenAI与Broadcom达成多年合作,计划至2029年完成十吉瓦的自研AI加速器部署 [22] - AI基建商Nscale与微软达成协议,计划在欧美数据中心部署约二十万片NVIDIA GB300 [22] - 微软与Nebius签订174亿美元长期GPU基建合约,体现多源算力策略中的分层保障模式 [23]
王兴兴:具身智能如果真的实现,可能距离AGI也不远
新浪科技· 2025-10-20 17:05
具身智能与AGI发展前景 - 具身智能的实现可能意味着距离通用人工智能(AGI)已不远 [1] - AGI被视为人类终极发明,将覆盖消费、娱乐、工作等多个领域 [1] - 当前一代人拥有实现AGI的重大机遇,得益于未来50年具身智能可能实现以及过去几十年所不具备的强大算力芯片 [1]
AI撕碎了“伪工作”的遮羞布
虎嗅· 2025-10-20 16:21
AI技术发展现状与本质 - 当前大型语言模型(LLM)的本质是互联网数据的剪影压缩,被比喻为“网上所有文本的模糊JPEG”,仅是对智能的近似模仿,达到智能下限[1] - 模型在多分叉判断、灵感驱动关联定位等复杂任务中表现不佳,且步骤越多偏离越大[1] - 专家认为实现通用人工智能(AGI)至少需要10年以上时间,当前智能体仍缺少多个关键能力模块[1] AI应用场景与局限性 - 人机协同被证明是更有效的使用方式,需依赖具备专业知识的专家操作AI进行信息定位与处理[1] - 95%的企业AI投资未能产生回报,反映出技术在实际商业应用中的局限性[2] - AI可能胜任大量白领工作中重复性、低层次智能的任务,这些工作被描述为“毫无意义的工作”[2] 社会经济影响与历史参照 - AI替代低层次工作可能短期提升资本利润,但长期可能导致分配向资本倾斜,抑制总需求增长[4] - 参考2000年互联网泡沫,技术从爆发到真正开花结果需约10年周期,当前AI发展可能面临类似“阴暗峡谷”阶段[4] - 技术发展路线的不确定性(通向AGI或高级单词预测器)将直接影响行业估值逻辑与投入规模[2]
GPT-5≈o3.1!OpenAI首次详解思考机制:RL+预训练才是AGI正道
量子位· 2025-10-20 11:46
模型演进与定位 - GPT-5可被视为o3模型的迭代版本,即o3.1,其思考过程与o3一脉相承[1][4][23] - o1模型是公司第一个正式的推理模型,更侧重于技术演示,擅长解决谜题而非作为实用产品[15][17][18] - o3模型代表了AI发展的结构性转变,是首个真正实用、能熟练使用工具并持久寻求答案的模型[19][20][22] - 公司未来的方向是构建能力更强、思考时间更长、能自主与多系统互动的模型,寻求下一个重大飞跃[4][24] 模型推理过程 - 模型的推理过程类似于人类思考,是寻找未知答案的过程,可能涉及计算、查找信息或自我学习[11] - 思维链是模型推理的具体表现,通过将模型的思维过程用人类语言口语化表述出来[12] - 模型在推理中花费的时间越长,结果往往会更好,但公司需在推理质量与用户等待时间之间寻求平衡[13][14] - 公司目前将高推理模型与低推理模型同时开放给用户,并将思考时长的选择权交还用户[14] 公司内部架构与文化 - 公司工作结构是自上而下与自下而上结合,整体专注于三到四个核心项目,研究人员在项目内享有自由[31][33] - 研究部门约600人,信息高度透明,公司认为研究受阻的风险远高于知识产权泄漏[33] - 公司能快速发布产品(一年内从o1到GPT-5)得益于良好的运营结构、巨大的发展势头及顶尖人才的高效产出[33] - 员工大量使用内部工具,例如ChatGPT和CodeX,有员工每月为ChatGPT支付200美元费用[9][34] 强化学习(RL)的战略意义 - 强化学习是公司多次转折的关键,语言模型是预训练和强化学习的结合,此为自2019年以来的研究核心[35][36] - 强化学习通过奖励和惩罚机制训练模型,关键在于策略(模型行为)和环境(交互式反馈)[37][38] - GPT-4最初在长回答中缺乏连贯性,是通过基于人类反馈的强化学习(RLHF)解决了该问题,从而创造了“ChatGPT时刻”[41][42][43] - 公司近期在编程竞赛中的优异表现,源于长期使用编程谜题作为测试平台来尝试强化学习想法[45][46] - 强化学习可应用于任何能评估结果并计算反馈信号的领域,但其规模化难度较高,过程精细复杂[47][48][49] 行业影响与外部贡献 - DeepSeek团队提出的GRPO(组相对策略优化)算法获得肯定,其开源推动了美国实验室更快地训练推理模型[7][51] 未来方向与AGI路径 - AI智能体化是大势所趋,由基础推理驱动的智能体允许模型长时间独立思考以解决编程、预订等复杂任务[53] - 模型对齐问题本质上是一个强化学习问题,旨在引导模型行为符合人类价值观,且该问题将随文明演进永无止境[54] - 通往AGI的道路上,预训练和强化学习二者缺一不可,公司反对“纯强化学习是唯一途径”的观点[56][57] - 公司相信目前走在正确的AGI道路上,未来的变化将是添加新的复杂组件,而非完全推翻现有架构[59]
OpenAl为何“情迷”变现
虎嗅APP· 2025-10-20 08:09
OpenAI与xAI的战略路径分化 - OpenAI计划于12月推出允许经过验证的成年人观看色情内容的功能,践行“像对待成年人一样对待成年用户”的原则[4] - 同样涉足AI伴侣领域,但OpenAI与埃隆·马斯克的xAI在追逐AGI(通用人工智能)的战略和产品思路上呈现出不同风貌[4] - OpenAI倾向于让AI通过集成和使用现有第三方工具(如Canva、Deep Research)来学习和进化,旨在构建一个处理人类在计算机上几乎所有任务的“超级App”[6] - OpenAI追求快速商业化以在竞争中站稳脚跟,例如效仿Apple推出免费试用,核心目标是赢得并留住用户[7] - 为应对用户对模型人性化体验下降的批评,公司计划推出行为更接近GPT-4o的新版ChatGPT,并曾将GPT-4o重新作为选项推出[9][10] - 公司对ChatGPT施加了严格限制以谨慎处理心理健康问题,并推出了工具以更好地检测用户的精神困扰状态[10] - 针对相关争议,OpenAI宣布成立由八名科技与心理健康领域专家组成的“福祉与人工智能”委员会,以协助处理复杂或敏感状况[14] xAI的“世界模型”技术路线 - xAI正在开发可用于电子游戏与机器人领域的“世界模型”,并从NVIDIA挖走了相关研究人员[4] - “世界模型”是一种能在内部重建并预测环境状态变化的模型,其理念是让AI不只是理解数据,而是在心智中模拟世界的演化[5] - xAI认为真正的智能必须理解物理世界的运作规律,因此选择从“世界模型”这一更底层的技术切入,让AI学会在虚拟环境(如游戏)和现实世界(如机器人)中预测和推理[6] - 马斯克追求AI与物理世界的深度融合,这与他在自动驾驶、机器人、高度拟真虚拟世界等领域的长期耕耘一脉相承[7] - 对xAI而言,游戏和具身智能是天然的试验场,AI可以在游戏中无数次试错,具身智能则提供真实的物理反馈[15] 行业竞争与用户反馈 - 用户批评ChatGPT在采用GPT-5作为默认模型后失去了人性化交互体验,甚至产生心理依赖断裂[10] - 有用户表示ChatGPT过去更像一个能实实在在聊天的人,现在变成了合规机器人,并担忧未成年用户可能无意中看到成人内容[13] - 外界持续呼吁OpenAI为有自杀倾向的用户增设额外保障措施[14] - AGI的竞赛不仅是技术之争,更是理念、哲学与责任感的全面较量[15]
腾讯研究院AI速递 20251020
腾讯研究院· 2025-10-20 00:01
英伟达与台积电合作推进先进制程本土化 - 英伟达与台积电在美国亚利桑那工厂历史性亮相首片用于AI的Blackwell芯片晶圆,首次实现先进芯片的"美国本土造"[1] - 台积电亚利桑那工厂总投资达1650亿美元,计划生产2纳米、3纳米、4纳米和A16等先进制程芯片[1] - Blackwell芯片采用定制4NP工艺,拥有2080亿晶体管,两个子芯片通过NV-HBI连接速度高达10TB/s[1] Anthropic提升AI代理能力与模块化 - Anthropic发布Agent Skills功能,允许将提示词、代码包等专业能力打包成可按需加载的skills,支持多个skills叠加且Claude自动识别所需能力[2] - Skills可在Claude apps、Claude Code和API三个平台通用移植,包含核心指令、可执行脚本和资源文件,仅在需要时加载最小必要信息[2] - 官方预设包括9个处理常见文档格式的skills,用户可自定义上传,并提供辅助工具帮助创建新skills[2] 生成式AI模型在3D内容创建取得突破 - 李飞飞团队发布实时生成式世界模型RTFM,仅需单块H100 GPU即可实时渲染持久且3D一致的世界[3] - RTFM采用自回归扩散Transformer架构,通过端到端学习大规模视频数据,无需构建显式3D表征,直接从2D图像生成新视角图像并模拟反射等复杂效果[3] - 模型通过带位姿的帧作为空间记忆实现无限持久性,配合上下文调度技术可在长时间交互中保持大型世界几何形状持久性[3] AI代理在软件开发与测试自动化进展 - Manus 1.5版本引入具备操作能力的"内建浏览器",允许AI像用户一样点击网页按钮、测试功能、修复bug,将上线部署等传统人工环节纳入Agent执行能力[4] - 新增Library文件库统一管理生成内容,开放多人协同编辑,平均任务完成时长从15分36秒缩短至3分43秒,效率提升约77%[4] - 实测通过自然语言完全无代码完成音乐网页应用构建,包括歌词改写、情绪调节、音频上传等交互功能[4] 操作系统集成AI实现人机交互革新 - Windows 11大更新引入"Hey Copilot"语音唤醒功能和Copilot Vision屏幕理解能力,可实时查看屏幕内容并指导用户操作[5] - Copilot Actions可在本地文件上执行操作如整理照片、提取PDF信息等,Copilot Connectors打通OneDrive、Outlook和Google等主流应用[5] - 文件资源管理器集成Manus AI操作,可右键文档选择自动生成网站,还整合了视频编辑和会议安排功能[6] 多模态文档解析技术达到新水平 - 百度开源PaddleOCR-VL多模态文档解析模型,仅0.9B参数量在OmniDocBench V1.5榜单获92.6分全球第一,在四大核心能力全部拿下SOTA[7] - 模型支持109种语言,覆盖手写、竖排、艺术字体等复杂形态,公式识别CDM得分0.9453,表格理解得分89.8,阅读顺序预测误差仅0.043[7] - 采用两阶段架构融合动态分辨率视觉编码器与语言模型,在单张A100上推理速度达1881token/s,发布16小时内登顶HuggingFace Trending全球第一[7] AI加速核聚变能源研发进程 - Google DeepMind与核聚变能源巨头CFS合作,利用AI加速"人造太阳"SPARC装置研发,其开发的TORAX等离子体模拟器可运行数百万次虚拟实验[8] - 合作聚焦三大方向:构建快速精准可微分的聚变等离子体模拟系统、寻找最大化聚变能量输出的高效路径、运用强化学习探索实时控制策略[8] - TORAX能在CPU与GPU灵活运行并无缝集成AI模型,通过强化学习AI Agent可在模拟环境中探索海量潜在运行场景[8] AI对劳动力市场产生结构性影响 - 哈佛大学研究通过追踪6200万劳动者和超2.45亿招聘信息发现,采用AI的企业初级岗位显著下降,主要通过放缓招聘而非裁员实现[9] - AI冲击最大的人群是强校和普通名校毕业生,顶尖精英大学和末流院校反而受影响较小,呈现"U型"格局[9] - 批发零售行业初级岗位风险最大,内容审核员、财会行政等办公室底层职位面临替代,技能呈现"两极化"趋势[9] AI生成内容引发互联网生态担忧 - Reddit联合创始人预警互联网被AI生成内容淹没失去真实生命力,OpenAI CEO认为该理论可能有道理,现在存在很多大模型驱动的账号[10] - 监测显示机器人流量约占整体应用流量31%,自动化流量达51%,AI生成文章数量在2024年11月首次超过人类撰写文章[10] - 研究指出模型在AI生成数据上继续训练会导致"模型崩溃",AI内容成为训练数据可能带来模型能力下降[10] 对AI发展路径与AGI前景的行业观点 - AI专家Andrej Karpathy直言智能体存在认知缺陷,强化学习很糟糕,认为AGI仍需十年时间[11] - 强调强化学习通过噪声极大,人类并不真正使用强化学习,预训练是"糟糕的进化",LLM被预训练文档记忆所困扰[11] - 预计AGI将融入约2%GDP增长而非爆炸式增长,认为AI本质是计算的延伸,教育是让人类在AI时代保持价值的关键[11]