Workflow
AGI
icon
搜索文档
清华百川楼挂牌启用后,就地圆桌开聊AI医疗
量子位· 2025-12-27 12:59
文章核心观点 - AI医疗是通向通用人工智能(AGI)的终极复杂场景之一,其发展愿景超越工具属性,指向系统级、可长期陪伴与决策的智能体 [7][14][25] - 发展AI医疗需平衡技术创新与医疗现实,关键在于构建能体现临床思维、提升疗效并被医患接受的产品,而非仅追求技术指标 [32][33][34][40] - 进入AI医疗领域需保持清醒的合作策略,避免被传统医疗需求带偏技术方向,并鼓励跨界学习与宏大志向 [63][55][60] AI医疗的愿景与价值 - **医学是AGI的试金石**:医学拥有11个一级学科,其高度复杂、非线性的特性使其成为AGI最广阔也最困难的应用场景 [13][14] - **构建医学信息基础设施**:核心是打造能整合论文、病历、指南、影像等多模态信息的医学大模型,成为医疗核心信息基础设施 [16][17] - **推动医学科学化**:AI的价值在于推动医学向更可验证、可推理的“科学”方向演进,而不仅是替代医生 [28][29] - **重塑医患关系**:未来患者将被大模型“武装”,对医生提出更高要求,倒逼医疗服务模式进化 [21][22] - **超越工具属性**:目标应是打造系统级、可持续陪伴、决策与优化的智能体,这本身已接近AGI,是“操作系统”级别而非单一应用 [24][25][26] AI医疗的评估与实践挑战 - **评估标准转向临床价值**:在应用阶段,Benchmark重要性下降,核心评估三件事:AI是否体现临床思维、医生是否愿意接受、最终是否提升疗效 [32][33][34] - **技术难点在于深度耦合**:医疗对准确性、可解释性要求极高,需将图像分割、识别、结构理解与生成模型深度耦合,形成统一体系 [42][43][44] - **数据异构性带来挑战**:医学数据包含极专业的文本、物理尺度跨度大的图像及大量结构化数据,妥善处理这些问题将对通用大模型产生反向升级 [45][46] - **最大挑战非技术层面**:主要难点在于严谨的医疗监管体系限制了创新速度,以及如何在保持医生权威和信任的前提下让AI参与决策 [49][50][51][52] 企业策略与市场切入点 - **定位陪伴式AI智能体**:技术核心是打造具备长期记忆、动态规划和任务调度能力的陪伴式AI,而非一次性问答工具 [37][38] - **市场策略平衡专业与实用**:与顶尖医院合作获取专业背书,但产品成功的关键在于患者是否愿意用、医生是否能因此减负 [39][40] - **形象比喻阐明价值**:公司策略被形容为“给患者造矛,给医生造盾”,旨在同时赋能患者和医生 [41] - **警惕合作陷阱**:与医生合作必要,但需避免被其需求定义技术方向,防止项目因追求短期利益(如发论文、融资背书)而偏离正确产品道路 [63][64][66][67][69] 对从业者与年轻人的建议 - **寻找跨界创新点**:真正的创新常源于无路之处,需广泛接受其他领域知识,借鉴概念、模型和方法进行迁移 [55][56][57] - **树立宏大志向**:人工智能是百年一遇的时代机遇,优秀人才应立志成为“帅才、将才”,而非满足于顺势而下的工程师角色 [59][60][61] - **保持清醒的合作观**:进入AI医疗领域需对“合作”保持清醒,寻找有变革性想法的医生伙伴,避免被大多数医生的浅层需求牵引 [63][69][71] - **以兴趣为持久动力**:医学与AI领域都非常艰苦,仅追逐风口难以持久,找到真正的兴趣点至关重要 [54]
2026年ChatGPT要加广告了,最懂你的AI都开始出卖你
36氪· 2025-12-26 21:08
文章核心观点 - 生成式AI行业面临巨大的商业化压力,订阅收入模式难以覆盖高昂的运营成本,导致以OpenAI为代表的公司正积极探索在AI产品中植入广告作为核心变现手段 [4][8][12] - AI广告的植入方式(如优先展示赞助内容、侧边栏广告)及其潜在的“内容投毒”(GEO)风险,可能比传统互联网广告更具隐蔽性和误导性,侵蚀用户信任 [4][24][42][46] - AI Agent(智能体)的发展可能重塑广告生态,使AI成为用户与各类应用之间的新入口,从而掌握流量与广告分发的核心权力,引发与传统应用平台之间的零和博弈 [49][52][55][57] AI行业商业化模式转向 - 硅谷早期设想的类似Netflix的SaaS订阅模式(如每月20美元)在2024年已基本破产,行业面临收入增长跟不上用户增长和成本支出的困境 [7][8][17] - OpenAI的年化收入约为120多亿美元,但烧钱速度可能是公开数据的三倍,高昂的预训练和推理成本是主要压力 [29] - ChatGPT约有3500万付费用户,仅占其周活跃用户的5%,订阅收入虽是主要来源但覆盖成本有限,迫使行业寻找新收入来源 [31][33] - 在AI产品中植入广告被视为最稳定、最快的“回血”方式,是覆盖大部分用户成本的直接手段,预计2025-2026年将有更多AI产品试探性地上线广告 [8][12][34][35] 主要AI公司的广告化进程与策略 - **OpenAI的探索与转变**:公司员工已制作多种广告展示原型图,计划在用户提出相关问题时优先显示“赞助内容”,例如在回答中插入广告或于界面侧边栏展示 [4][5][24][26] - OpenAI CEO Sam Altman的态度从最初反对广告转变为认可“有用且不讨人厌”的广告形态,并公开物色“广告负责人”,同时引入拥有广告系统经验的高管(如CFO Sarah Friar)和首席营收官以加速商业化 [21][23][26] - 公司目标是将广告设计得尽量“不打扰用户”,例如在对话特定阶段(如用户点击推荐链接后)才出现赞助商家信息,并考虑添加“本回答包含赞助内容”的声明 [26] - **Google的谨慎态度**:尽管有媒体称Google计划于2026年在Gemini AI中植入广告,但其全球广告部负责人已公开否认,称Gemini App目前没有广告也没有相关计划,显示出公司在公开层面的谨慎 [18][19] - **行业竞争与囚徒困境**:只要有一家主要公司坚持不加广告,其他公司就会有顾虑;若多家同时迈出这一步,则顾虑将被集体摊平,加速行业整体的广告化进程 [17][18] AI广告的形态、风险与挑战 - **新型广告形态**:AI广告可能并非简单照搬现有形式,而是基于深度对话数据的新型数字广告,能够根据用户聊天记录展示高度相关的广告,达到类似真人顾问的推荐效果 [24][58] - **隐蔽性与高风险**:传统网页广告有明确标识,用户有戒心;而拟人化的AI可能让用户忘记其商业意图,将广告伪装成中立建议,危险性更高 [39][40][46] - **“内容投毒”(GEO)威胁**:利益方通过“生成式引擎优化”技术,优化特定网页内容以确保被AI优先引用并编入答案,使商业推广隐藏在“权威建议”核心中,比传统软文更可怕 [42][43][44] - **现有挑战**:截至今年6月,ChatGPT仅2.1%的查询涉及购物,为培养用户习惯并积累广告数据,OpenAI已接入Stripe、Shopify、Zillow、DoorDash等支付和电商功能 [35] AI Agent发展对广告生态的颠覆性影响 - **成为新入口与流量控制者**:AI Agent具备跨应用操作能力,可能成为用户默认的上网入口,使传统超级App沦为“后端服务”,从而掌握决定用户看到什么内容和广告的权力 [49][52][55] - **引发零和博弈**:豆包手机助手因获得系统级权限、可跨App操作而被各大App以“安全”理由集体“拉黑”,这预演了未来AI Agent与传统应用平台之间的入口之争 [50][51][53] - **重塑广告投放逻辑**:在AI Agent主导的世界里,广告主首先需要说服的是帮用户做决策的Agent,而非直接面向用户;大部分广告团队需重新思考投放策略 [55][57] - **加剧数据与权力集中**:AI助手积累大量用户隐私数据(偏好、习惯、位置等),若用于广告定向,针对性将空前强大;同时,兼具Agent和广告平台身份的AI将拥有决定用户选择与所见内容的双重权力 [58][59] - **对内容产业的冲击**:Google的AI概览功能预计将导致许多出版商网站流量流失25%,预示着当AI成为聚合平台,内容提供方可能失去直接面向用户的渠道和品牌存在感 [55] 行业趋势与用户应对 - 2026年,人类可能需要为AI安装“广告拦截器”(Adblock for intelligence),以拦截渗透在AI回答中、伪装成中立建议的软性广告 [4][62] - 在AI试图深度介入决策的时代,保持怀疑并拥有“拒绝被喂养”的能力变得至关重要 [63]
冷静看待VLA:不是救世主,也不是“垃圾”
自动驾驶之心· 2025-12-26 17:18
文章核心观点 - 文章对当前视觉语言动作模型的研究现状进行了批判性分析,认为许多研究在任务设置、环境复杂性和方法透明度上存在显著不足,但同时也肯定了其潜在价值并提出了改进方向[1][8] - 文章认为纯粹的端到端训练方法难以实现真正的通用人工智能,而更倾向于采用结构清晰、训练量小的显式思维链方法[5][8] - 文章指出,在复杂环境下,基于学习的方法相比依赖精确坐标的传统方法可能更具优势,因其更接近人类通过感知误差不断修正行为的方式[4] VLA模型的当前局限与批评 - 任务设置过于简单,主要集中在“抓-放”类操作,缺乏复杂任务挑战[6] - 实验环境高度简化,多为纯色背景、仅放置1-2个物体、无遮挡且大部分是2D平面任务[6] - 模型训练本质上是数据量巨大的“升级版行为克隆”,系统呈现黑盒特性,难以解释模型的实际能力[6] - 部分研究存在实验内容与态度问题,被评价为“劣币驱逐良币”[8] VLA模型的潜在优势与改进思路 - VLA模型并非完全黑盒,例如NVIDIA的CoT-VLA工作展示了可拆分为三层的思维链,其思考模式与人类相似[1] - 真正的挑战在于让模型学会泛化,关键在于设计好子目标嵌入以保证其在遮挡、复杂背景及3D空间中的表现[2][3] - 有效的子目标嵌入应具备语义性、上下文相关性、能指明目标大致区域,并通过融合MLP保证可微性[7] - 在复杂环境下,基于学习的方法相比依赖精确坐标的传统方法可能更具优势,因其更接近人类通过视觉观测感知误差并修正动作以逼近目标的行为方式,无需每一步都遵循完美路线[4] 实现通用AGI的路径探讨 - 纯粹的端到端训练难以产生真正的通用人工智能,AGI需要的是少量样本学习及依靠推理逻辑处理新任务的能力,而非依赖海量数据的“死记硬背”[5] - 倾向于采用显式的VLA思维链方法:由大模型负责拆解任务,动作头根据子目标进行训练与执行,该方法训练量小、结构清晰,便于资源有限的研究者实施[8] - 只要任务拆解得足够细致和准确,无论后续采用基于模型还是基于学习的策略,效果都会不错[8] VLA模型的典型工作流程 - 大语言模型将语言指令拆解为子任务[6] - 视觉语言模型根据当前图像和子任务生成子目标嵌入[6] - 策略模型根据子目标嵌入和当前感知输出动作[6]
马斯克宣战,太空可见,把AI超算涂成这样,微软破防了
36氪· 2025-12-26 10:34
公司战略与目标 - 公司创始人马斯克在X平台宣告,xAI计划在不到5年内,拥有超过其他所有公司总和的AI算力 [1] - 公司将通过极端规模和物理算力堆叠来实现其AI野心,其战略是“宏大+硬核”的物理算力,而非“微+软”的云叙事 [3][5] - 公司认为,真正决定AI上限的是宏观尺度的硬件与能量 [5] - 公司快速扩展电力和数据容量的能力,被视为实现超越人类智能的超级智能、并成为最强大的人工智能公司的关键因素 [31] 算力基础设施:Colossus超算中心 - xAI位于美国田纳西州孟菲斯的Colossus超算中心,是目前全球规模最大的商用AI超算中心之一,用于训练大型AI模型 [5] - Colossus 1于2024年下半年启动,是公司的“算力起跑线”,核心目标是快速获得可用算力,但存在规模扩展的效率和稳定性上限 [9] - Colossus 2项目于2025年3月7日启动,公司收购了孟菲斯一个100万平方英尺的仓库及相邻地块,旨在构建可长期、持续扩展的“原生超算级工程” [9] - 到2025年8月22日,Colossus 2的119台风冷冷水机组已就位,提供约200MW的冷却能力,足以支撑约11万张GB200 NVL72 GPU [10] - 公司仅用6个月就完成了Colossus 2同等规模的基础设施建设,而Oracle、Crusoe和OpenAI通常需要15个月 [10] - 据行业机构估计,Colossus 2到2025年第三季度的物理数据中心容量将超过Meta的Superintelligence集群和Anthropic的现有算力储备 [10] 能源供应策略 - 面对田纳西州的监管阻力,公司跨州在密西西比州的Southaven买下一座废弃发电厂,以解决Colossus 2的电力问题 [13] - 密西西比州监管机构允许公司临时运行燃气轮机12个月,无需复杂许可 [13] - 公司通过与Solaris Energy Infrastructure合作,利用其庞大的移动涡轮机队来满足电力需求 [14] - 在Colossus 2未来约1.7GW的电力需求中,Solaris将提供超过1.1GW;到2027年,Solaris提供的可用电力预计将突破1.5GW [15] - 公司实际上构建了一个独立的电网帝国,通过州界一侧的燃气轮机和另一侧的Tesla Megapack储能系统为数据中心供电 [13][15] 财务状况与融资 - Colossus 2的资本支出高达数百亿美元,而公司的收入微乎其微 [16] - 公司传闻中的9位数年度经常性收入很大一部分来自X平台的内部转账 [16] - 公司正寻求400亿美元的新一轮融资,估值逼近2000亿美元 [19] - 中东资本已入局,包括沙特王国控股公司、卡塔尔投资局和阿联酋的Vy Capital [18] - 未来可能看到中东主权财富基金出钱、xAI出技术,在沙特或阿联酋的沙漠中建立下一个大规模AI数据中心的交易 [22] - 创始人马斯克还可以抵押Tesla和SpaceX的股票来获取资金 [20] 公司文化与技术路径 - 公司文化极致“硬核”,工作强度高,以“007”为常态 [23][24] - 公司拥有像Jimmy Ba这样的顶尖人才,并维持着惊人的工程推进速度 [25] - 在产品侧,公司没有在传统的“代码生产力”赛道上死磕,其Grok 4在编程能力上被Claude Sonnet和GPT-4压制 [25] - 公司选择了一条独特的强化学习路径,将赌注押在情感与互动上,认为通往AGI的钥匙可能在于情商和同理心 [26][27][28] - 公司推出了面向消费者的虚拟角色产品Ani,并利用全球数亿用户与Ani的互动来构建一个前所未有的强化学习环境 [29] 行业竞争与市场影响 - 公司的宣言直接将其置于与Google、OpenAI、Anthropic、Meta、Amazon、Microsoft等竞争对手的对立面 [3] - 公司通过Colossus超算中心,在AI算力军备竞赛中获得了重要筹码 [34] - 数千兆瓦的电力、数十万张GPU的算力扩张,正在形成一个巨大的资金黑洞,每一秒都在燃烧现金 [31][32] - X平台正在通过整合xAI技术来提高广告变现效率,但这比起数百亿美元的训练成本,不过是杯水车薪 [33] - 当训练支出远超推理收入时,市场存在金融脆弱性,泡沫在积聚 [36]
2025AI盘点:10大“暴论”
36氪· 2025-12-26 08:52
行业趋势与概念演变 - “Vibe”概念在AGI领域广泛传播,从Vibe Coding扩展到Vibe Everything,成为一种具有颠覆性气质的叙事,预计明年将继续存在 [2] - Prompt Engineering被认为已过时,Context Engineering成为行业热词,其更广阔的系统性定义推动了Agent和Infra类创业公司获得融资 [8][9] - 关于大语言模型发展路径出现分歧,Yann Lecun和Ilya Sutskever均对Scaling提出批评,但Scaling实践仍在继续,例如马斯克宣布将在2026年推出6万亿参数的Grok 5模型 [27][28] 人形机器人领域动态 - 2025年人形机器人估值大涨,但“泡沫论”阴影持续,部分公司创始人私下承认存在资本泡沫 [6] - 行业竞争焦点从“融资PR”转向“订单PR”,但对商业化场景的探索进展有限,主要场景仍集中在教育、舞蹈演出,AI陪伴有破圈趋势但主力产品非人形 [6] - 行业内部围绕“数据与模型”关系展开论战,VLA模型架构受到质疑,世界模型和大小脑架构兴起,同时数据采集工厂和数据集探索增多以解决数据紧缺问题 [9][10] AI基础设施与全球竞争 - 英伟达CEO黄仁勋表态“中国将赢得人工智能竞赛”,折射出中美成为AI体系化竞赛主导者的现状 [12][13] - AI算力需求激增导致电力供应成为关键瓶颈,摩根士丹利报告称若电力供应无法跟上,美国电网可能在2028年出现高达20%的电力缺口,缺电量达44GW [24] - 为应对电力挑战,微软、Meta、亚马逊等硅谷巨头开始投资核能,同时大量资本涌入核聚变领域 [25] 产品形态与生态变革 - 行业领袖预测传统手机和APP将消失,被智能体取代,豆包手机的发布被视为对此趋势的早期实践 [15][16] - OpenAI的首代硬件可能于明年出现,预示着原生AI硬件的发展 [17] - AI生成内容呈双刃剑效应,一方面辅助创作出精品内容并催生新市场(如AI成人内容市场规模预计2025年约25亿美元,年增速约27%),另一方面导致“Slop”(AI垃圾内容)泛滥,引发对内容生态的担忧 [31][32] 商业与资本前景 - OpenAI CEO Sam Altman激烈回应做空质疑,公司宣布累计1.4万亿美元的算力投入计划,但其年收入仅130亿美元,估值在5000-7000亿美元之间,2030年收入目标为2000亿美元 [19] - 市场对AI远景有共识,但对当前资产价格和投入产出比存在分歧,OpenAI的商业化变现能力被视为行业信心的重要风向标 [20][21]
保时捷中国回应“郑州中原保时捷中心疑似跑路”;深蓝董事长回应和小鹏对比丨汽车交通日报
创业邦· 2025-12-25 18:10
保时捷经销商经营异常事件 - 保时捷中国回应郑州中原保时捷中心疑似闭店跑路事件 表示高度关注该授权经销商经营异常情况 目前正与警方和相关部门在现场核查事实[2] - 保时捷中国对事件给车主及消费者带来的困扰与担忧致歉 承诺将积极推动事件妥善处理 并将消费者合法权益放在首位[2] - 多位网友反映郑州中原保时捷中心“人去楼空” 涉及消费者金额从数万元至数十万元不等[2] 深蓝汽车与小鹏汽车的智能驾驶对比 - 深蓝汽车董事长邓承浩回应网友关于小鹏M03与深蓝L06的对比试驾体验 感谢用户对深蓝的认可 并称小鹏是可敬的友商[2] - 深蓝汽车表示未来将继续专注于以安全为基石的智能辅助驾驶研发[2] - 此前长安汽车在重庆被授予首块L3级自动驾驶专用正式号牌“渝AD0001Z” 并于12月23日正式上路通行[2] 阿维塔12南极测试项目 - 阿维塔回应旗下车型阿维塔12南极之旅引发的争议 称此次行程与中国极地科考船“雪龙”号航行计划紧密衔接[2] - 阿维塔12于今年11月启程 12月7日抵达南极中山站 将跟随中国极地科考队在南极驻留至2027年4月[2] - 阿维塔12将在南极度过长达16个月的时间 以进行经历极地不同季节及环境变化的车辆测试及技术验证[2] 马斯克对特斯拉FSD技术的评论 - 马斯克在社交平台回应一位用户称赞特斯拉FSD自动驾驶体验的视频 该用户称特斯拉汽车能够“像人类一样看待世界,理解世界”[2] - 马斯克表示汽车AI是光子输入 控制输出 就像人类一样 并称这是通往AGI(通用人工智能)的道路[2] - 马斯克解释其原理为“压缩光子输入并将其与执行器输出相关联” 类比人类处理信息的方式[2]
字节AI1080天闪电逆袭:从后知后觉到AGI全面发力
21世纪经济报道· 2025-12-25 11:56
公司AI战略转型历程 - 公司用三年时间完成从初期落后到构建全栈AI能力的战略转型,截至2025年12月,其火山引擎已有超50万家企业接入AI相关能力 [1][2] - 2023年初GPT-4发布后,公司内部因在生成式AI竞赛中落后而感到焦虑,当时公司尚无统一大模型战略,多个业务线各自为战 [2][4] - 2023年3月GPT-4发布后,公司高层意识到差距,迅速成立“大模型专项”,明确以“快速追赶、聚焦应用”为核心目标 [5] 早期AI布局与挑战 - 公司AI技术积累可追溯至2016年成立的AI Lab,团队规模在2018年达到150人,覆盖多个前沿方向 [4] - 随着抖音、TikTok占据市场优势,AI Lab的定位在2020年从集团级前瞻项目转为技术中台,研究重心集中在优化推荐和提升广告转化,而非构建通用智能 [4] - 在大模型新范式面前,公司既无统一战略也无核心底座,资源分散,方向模糊,2020年年中AI Lab负责人马维英离开 [4] 组织架构重组 - 2024年初,公司启动彻底的AI体系重组,AI业务从“支持职能”升级为“一级战略”,核心调整是拆分出两大独立单元Seed与Flow,与主要业务线平级 [5] - Seed团队整合原AI Lab下属的NLP组、视频生成模型团队PixleDance、智能创作团队等分散力量,确立“多模态优先、高效训练、低成本部署”的技术路线 [7] - 为保障长期创新,公司对Seed团队取消季度考核,改为年度OKR评估,并允许团队投入20%的资源用于探索性研究 [7] 技术研发与团队建设 - 2025年2月,曾任Google DeepMind研究副总裁的吴永辉正式入职并接管Seed团队,成为团队转折点 [6][7] - 2025年公司持续迭代多模态大模型,采用“基础模型+任务模型”的模块化架构,2025年12月发布的豆包大模型1.8针对多模态Agent场景进行定向优化 [9] - 创始人张一鸣于2025年4月宣布亲自带队新加坡AI实验室,聚焦多模态大模型、AI智能体、自研AI芯片三大前沿方向 [9] 产品创新与商业化 - Flow部门采用“特种兵小组”模式,每个产品由3–5人组成独立单元,拥有高度自主权,聚焦AI产品快速落地与迭代 [8] - 依托公司全域流量,推出一系列爆款应用,包括豆包App、Coze平台、Seedance视频生成工具等,并通过流量网络形成协同效应 [8] - 截至2024年12月,豆包MAU达7523万,稳居国内AI原生应用首位,AI原生APP整体MAU突破1.2亿,同比增长232% [8] 生态建设与成本优化 - 火山引擎推出“AI节省计划”,通过阶梯式折扣帮助企业最高节省47%的成本,同时开放豆包大模型API、Seedance视频生成API等核心能力 [9] - 截至2025年12月,火山引擎披露已有超50万家企业接入公司AI相关能力 [2] 硬件与全球化布局 - 2025年下半年加快AI硬件布局,包括与歌尔股份合作开发的AR眼镜预计2026年量产,OlaFriend AI耳机第二代进入研发测试,豆包手机助手深度植入合作机型,PicoVR设备接入豆包多模态能力 [10] - 公司AI竞赛已进入深水区,海外OpenAI、Google DeepMind持续领跑,国内百度、阿里、华为等大厂也在加大投入,DeepSeek等创业公司快速崛起 [11]
马斯克回应特斯拉FSD“像人类一样”驾驶
金融界· 2025-12-25 10:14
公司技术进展 - 特斯拉首席执行官马斯克在社交平台回应称,特斯拉FSD(完全自动驾驶)系统能够“像人类一样看待世界,理解世界”,并形容其体验“就像是科幻小说里的情节”[1] - 马斯克阐述其技术原理为“汽车AI是光子输入,控制输出”,并指出这是“通往AGI(通用人工智能)的道路”[1] - 马斯克进一步解释,系统通过“压缩光子输入并将其与执行器输出相关联”来实现对周围世界的理解,其运作方式“就像我们(人类)做的那样”[1] 行业竞争地位 - 根据一位用户的评价,特斯拉汽车目前所实现的自动驾驶能力,“世界上还没有其他汽车能做到这一点”[1]
Dwarkesh最新播客:AI 进展年终总结
36氪· 2025-12-25 07:15
AI发展现状与AGI时间线 - 以强化学习为核心的“中训练”正成为大型语言模型的重点突破方向,前沿科技公司正通过此方法将大量具体技能预先植入模型[3] - 当前对强化学习中训练的极度乐观态度与宣称AGI临近的观点存在根本矛盾,如果模型已接近类人学习者,这种基于“可验证结果”的训练路径是走不通的[14] - 为模型预置大量具体技能的做法,恰恰是AGI还很远的证据,因为如果模型泛化能力很强,就不需要单独构建那么多强化学习环境来教它操作特定工具[3][16] AI模型能力与泛化挑战 - 人类劳动力的价值在于其训练成本不笨重,能根据需要灵活掌握新技能,而当前AI缺乏稳健高效的方法来习得工作中大量需要的公司特定、情境特定技能[4][23] - 每天人类需处理上百件需要判断力、情境感知及工作中习得技能的事情,仅靠预置一组固定技能,连一份工作都无法完全自动化[24] - 在机器人等领域,根本问题是算法而非硬件或数据,人类只需很少训练就能远程操控硬件完成有用工作,这反衬出当前AI缺乏类人学习核心[19] AI经济扩散与市场潜力 - 企业有很强动机雇佣AI劳动力,因为经过验证的AI员工可以无损无限复制,且不存在招聘中的“柠檬市场”问题[5][29] - 当前AI未在企业广泛部署、未在编程外创造大量价值,本质是模型能力不足,而非技术扩散需要时间,所谓“经济扩散滞后”是为能力不足找借口[6][28] - 如果AI能力真达到AGI水平,其扩散速度会快得惊人,企业完全愿意每年花费数万亿美元购买token,因为知识工作者年总薪酬高达数十万亿美元[29] 技术演进路径与规模定律 - 预训练阶段的扩展定律非常清晰,算力数量级提升会导致损失函数稳定下降[10] - 但将预训练规模化的乐观经验移植到带可验证奖励的强化学习上缺乏依据,有研究指出,要强化学习获得类似GPT级别的提升,总算力规模可能需要提升到一百万倍[11][33] - 持续学习将是AGI之后模型能力提升的主要驱动力,预计前沿团队明年会发布持续学习雏形功能,但达到人类水平可能还需5到10年[13][40] 评估框架与未来影响 - 将AI模型智能与“中位数人类”对比会系统性高估其能创造的价值,因为知识工作的巨大价值来自最顶尖的一小撮人[12][35] - 一旦模型真正达到顶级人类水平,其影响力可能是爆炸式的,因为这意味着服务器上运行着数十亿个类人智能体,能复制、融合彼此全部学习成果[12][25] - 模型在“看起来很厉害”上的进步速度符合短时间线派预测,但在“真正变得有用”上的进展速度更符合长时间线派判断[32]
「数字AGI」已死?亚马逊内部重组,撕掉纯算法派最后的遮羞布
36氪· 2025-12-24 19:17
亚马逊AGI战略重组核心观点 - 亚马逊通过组织架构与人才整合 将大模型、自研芯片、量子计算及机器人技术深度结合 旨在打造一个集“算力-大脑-身体”于一体的物理实体AGI 而非局限于对话框的软件智能 [1][3][14] 组织架构与领导层调整 - 亚马逊CEO Andy Jassy宣布进行组织调整 将Nova大模型团队、自研芯片部门与量子计算研究整合进同一体系 [1] - 任命以工程交付能力著称的Peter DeSantis统筹此次整合 DeSantis是云基础设施掌舵人及自研芯片计划的幕后推手 [4][5] - 机器人与强化学习领域代表人物、UC Berkeley教授Pieter Abbeel正式加入亚马逊AGI体系 [3][6] 战略路径:全栈闭环与算力主权 - 公司将AGI视为一项需要长期工程投入的系统工程 而非单纯的研究课题 [5] - 通过垂直整合打破对Nvidia等第三方算力的依赖 将自研芯片(如Trainium 2系列)与Nova模型进行“像素级”优化 旨在实现成本领先和算力主权 [5] - 对比以微软和OpenAI为代表的“云端智慧”派及谷歌的“全能选手”派 亚马逊选择第三条路:以场景倒逼模型 以闭环重塑生态 [11] 技术方向:具身智能与物理数据 - 公司认为AGI的最终进化必须通过与物理世界的实时互动来实现 即“具身智能” [8] - 引入Pieter Abbeel旨在突破互联网高质量文本数据耗尽的瓶颈 利用亚马逊全球庞大的物流仓储及超过75万台工业机器人(如Proteus自主移动机器人)作为收集物理规律数据的完美样本 [5][8][11] - 当对手依赖网络文本数据时 亚马逊可利用现实中的重力、阻力、摩擦力数据来训练真正理解物理法则的AGI [13] 竞争优势与行业影响 - 亚马逊拥有全球超过75万台工业机器人 其物理运营场景本身就是一个持续运行的、规模极端庞大的真实数据源 [11][13] - “重资产”和物理场景构成了极高的竞争门槛 让依赖第三方算力、缺乏物理落地场景的初创公司陷入被动 [13] - 此次重组预示着AI行业从“实验室时代”迈向“大工业时代” 未来的AGI竞争将只属于极少数能实现“全栈闭环”的巨头 [14]