学习

搜索文档
盘一盘,2017年Transformer之后,LLM领域的重要论文
机器之心· 2025-06-29 12:23
机器之心报道 机器之心编辑部 这两天 Andrej Karpathy 的最新演讲 在 AI 社区引发了热烈讨论,他提出了「软件 3.0」的概念,自然语言正在成为新的编程接口,而 AI 模型负责执行具 体任务。 Karpathy 深入探讨了这一变革对开发者、用户以及软件设计理念的深远影响。他认为,我们不只是在使用新工具,更是在构建一种全新的计算范式。 回顾 LLM 的发展历程:自 2017 年 Transformer 架构问世以来,我们见证了 GPT 系列的一路高歌猛进,以及多模态能力和端侧应用的全面开花。整个 领域正以前所未有的速度演进。 要深入理解这场变革的本质,我们需要回到技术的源头。那些奠定今天 AI 能力的关键论文,不仅记录着算法的演进轨迹,更揭示了从传统编程到自然语言 交互这一范式转变的内在逻辑。 此前我们通过 50 个核心问题回顾了 LLM 的基础概念 。今天,我们将梳理自 2017 年以来 LLM 领域的重要论文。本文从 X 用户 Pramod Goyal 的论文 盘点中精选了 22 篇进行详细介绍,其余论文将在文末列出供读者参考。 奠基理论 Attention Is All You Need ...
锲而不舍落实中央八项规定精神丨重庆渝中、甘肃平凉等地坚持问题导向 推动学习教育走深走实
央广网· 2025-06-29 10:28
政府服务优化与企业便利化 - 重庆渝中区推广一站式对企服务模式,提供帮办、代办服务,解决企业办事慢、多头跑等问题 [1] - 渝中区重点梳理企业实际难题244个,涵盖政策扶持、融资需求、用工对接等多个领域,已推进解决210多个 [1] - 甘肃平凉升级一网通办、一窗受理,联动多部门打通堵点,为企业和群众办事提效、减负 [1] 企业反馈与服务效率提升 - 开林企业管理集团有限公司表示一站式服务节省大量时间和精力,办事更加方便 [1] - 甘肃平凉市民反馈不动产过户业务办理时间从跑三个部门窗口缩短到一个窗口一小时完成 [2] 整改措施与成效 - 平凉出台集中整治工作推进措施,围绕28类问题制定70条具体措施 [2] - 平凉已征求群众意见建议600多条,为民办实事684件,推动整改落地见效 [2]
3D芯片的挑战
半导体行业观察· 2025-06-29 09:51
公众号记得加星标⭐️,第一时间看推送不会错过。 来源:内容 编译自西门子 。 3D IC 技术是指将多个硅片或晶圆以垂直堆叠的方式集成,从而形成一个可作为单个器件运行的三维 结构。与传统的二维集成电路(将元件分布在平面上)不同,3D IC 利用垂直方向的空间来堆叠和互 连多层有源电子元件。这种先进的方法显著缩短了元件之间的物理距离,从而提高了性能,降低了功 耗,并缩小了尺寸。 3D IC 的基本架构依赖于几项关键技术创新: 3D集成的演变 半导体行业迈向 3D 集成的进程反映了追求更高性能和更强大功能的自然进程。传统的 2D 集成虽然 已经成功了几十年,但随着对更复杂、更强大的电子系统的需求不断增长,开始显露出局限性。这导 致了中间解决方案的发展,例如 2.5D 集成,即将多个芯片并排放置在中介层上。 先进的基板集成工具 促成了这一发展,支持日益复杂的集成方法。从二维到三维集成的转变标志着 制造工艺、材料科学和设计方法的显著改进。 这一演变过程中的关键里程碑包括: 市场格局和行业趋势 全球 3D IC 市场正经历前所未有的增长,这得益于多个领域日益增长的需求。持续的技术进步以及 各种应用对更复杂电子系统的需求 ...
市委常委会暨市委理论学习中心组召开会议
南京日报· 2025-06-29 09:12
统战工作 - 会议强调统战工作是党委必须做好的分内事 必须学深悟透习近平总书记关于做好新时代党的统一战线工作的重要思想 [1] - 会议指出要聚焦产业科技创新 改革集成突破 民营经济发展 营商环境优化等重点任务 发挥统一战线智力密集 人才荟萃 联系广泛的独特优势 [1] 全面从严治党 - 会议指出当前反腐败斗争形势仍然严峻复杂 要以零容忍态度纵深推进全面从严治党 正风肃纪反腐 [2] - 会议强调要深化廉洁政治建设 聚焦"两个维护"强化政治监督 健全风腐同查同治机制 持续整治群众身边不正之风和腐败问题 [2] - 会议要求坚持严管厚爱相结合 严肃整治不作为乱作为问题 同时用好容错免责 澄清正名机制为担当者撑腰 [2] 学习教育整改 - 会议强调要把严的要求贯穿学习教育始终 以钉钉子精神集中整治作风领域突出问题 注重源头治理标本兼治 [2] - 会议要求突出抓基层抓落实 以转作风促发展的务实成效检验学习教育成果 [2] 发展规划 - 会议听取"十五五"规划编制有关工作汇报 [3]
赵一德在深入贯彻中央八项规定精神学习教育年轻干部代表座谈会上强调涵养优良作风 脚踏实地干事 在推动高质量发展现代化建设中展现更大作为
陕西日报· 2025-06-29 07:33
根据提供的新闻内容,该文章主要围绕年轻干部作风建设展开,不涉及公司和行业相关内容。因此无法按照要求提取公司和行业相关的关键要点。以下是新闻的核心内容总结: 会议概况 - 6月27日在西安召开年轻干部代表座谈会,省委书记赵一德出席并讲话 [1] - 会议主题为深入贯彻中央八项规定精神学习教育 [1] - 6名年轻干部作交流发言 [1] 赵一德讲话要点 - 强调年轻干部要深刻认识中央八项规定是长期有效的铁规矩 [1] - 要求年轻干部找准差距不足,深挖问题根源,动真碰硬整改 [1] - 提出年轻干部要当好党的光荣传统和优良作风的忠实传人 [1] 对年轻干部的要求 - 加强政治修养,提高政治判断力、领悟力、执行力 [2] - 树立正确政绩观,与人民群众站在一起 [2] - 投身"三个年"活动和"八场硬仗"等重点任务 [2] - 提升学习转化能力、解决问题能力和专业能力 [2] - 筑牢拒腐防变防线,保持清廉政治本色 [2] 组织工作要求 - 各级党委要把年轻干部培养作为重要战略任务 [2] - 拓宽成长渠道,从严教育管理监督 [2] - 加强关心关爱,营造良好成长环境 [2]
2025年如何从小白进阶成为AI/ML专家:助你拿下offer的修炼路线图
36氪· 2025-06-29 07:05
AI/ML学习路径 核心观点 - 文章提出2025年AI/ML领域高效进阶的八步法,强调从Python基础到专精领域的系统性学习路径,直击企业认可的实战能力需求 [1][13][19] 分步总结 第一步:Python核心库 - 掌握Python语法、函数、面向对象编程及AI专用技巧是基础前提 [2] - 需熟练使用NumPy(数值计算)、Pandas(数据处理)、Matplotlib/Seaborn(可视化)等库,学习周期3-4周 [4] 第二步:数学基础 - 线性代数(矩阵/向量空间)、概率统计(贝叶斯/假设检验)、微积分(梯度/优化)是理解模型的核心,周期4-6周 [4][5] 第三步:机器学习基础 - 监督/无监督学习、强化学习、深度学习是分水岭,需通过吴恩达课程等资源建立工程思维,周期6-8周 [6][8] 第四步:实践项目 - 通过构建真实项目(如小型GPT模型)积累经验,推荐《Scikit-Learn实战》等资源,需持续实践 [8][9] 第五步:MLOps - 部署、监控及维护生产环境模型的技能是专业分界线,学习全栈深度学习架构需3-4周 [9][10] 第六步:专精领域 - 需选择NLP、Transformer、计算机视觉等方向深入,强化细分领域竞争力 [10][11] 第七步:前沿追踪 - 通过ArXiv论文平台及领域专家(如OpenAI研究者)保持技术敏感度 [11][12] 第八步:面试准备 - 需掌握模型原理解释、系统设计等能力,针对性学习高频考题,周期4-6周 [12][13]
减了会议,多了调研(锲而不舍落实中央八项规定精神·一线见闻)
人民日报· 2025-06-29 05:49
"这哪行?暴雨来了,肯定得涝!"姜旺对张青云说,"必须抓紧按照排水渠的标准,挖深、拓宽、延 长。" "村里一时拿不出这么多钱……"张青云说。 "得要这么深,才不怕暴雨。"跳进排水渠,姜旺用身体作尺,量了量渠深。 "放心!这渠深1米、宽80厘米。"一旁的黄狮村党支部书记张青云说。 抢夏收、忙夏播、抓防汛,这段时间,河南省南阳市西峡县五里桥镇党委书记姜旺奔忙在田间地 头,"现在会议少了,有更多时间抓具体工作了。" 深入贯彻中央八项规定精神学习教育开展以来,西峡县积极推进减会议、减报表、优调研,让干部腾出 更多时间和精力,到一线办实事。 以精简会议为例,西峡县推行"多会合一",将同类型的会议套开。以往,县农业农村局、水利局、交通 运输局、住房和城乡建设局都要召开防汛会议,今年全县安全生产、抗旱、防汛3个会议套开。今年以 来,西峡县召开各类会议数量同比下降35%,会议时长缩减50%以上。 减了会议,多出来的时间用在哪里?西峡县要求干部——"不能只在空调房里听汇报,必须直插基层一 线,去解决实际问题。" 来到黄狮村的猕猴桃园,姜旺发现,路旁只有一条灌溉用的水沟。 刚在这处检查完,又有村民找过来:"修渠把路给弄断了,我们 ...
市政府召开党组(扩大)会议:在一体推进学查改上再加力再深化,确保学习教育取得实效
长江日报· 2025-06-28 15:44
政府会议核心内容 - 会议传达学习了中央第三指导组指导督导湖北见面会精神以及省委党的建设工作领导小组会议暨深入贯彻中央八项规定精神学习教育推进会精神 [1] - 会议强调深入贯彻中央八项规定精神学习教育是今年党建工作的重点任务 要求全市政府系统统一思想行动 确保学习教育取得实效 [1] - 会议要求以推动解决突出问题为重点 结合巡视巡察、整治形式主义等重点工作 明确查摆问题清单 完善集中整治台账 [2] 整改工作要求 - 对中央指导组指出的问题照单全收、立行立改 确保学有质量、查有力度、改有成效 [2] - 在查摆问题上要见人见事见思想 在整改问题上动真碰硬 坚决防止虚假整改、纸面整改 [2] - 着力补齐制度短板 坚持"当下改"与"长久立"相结合 针对薄弱环节强化建章立制 [2] 工作目标与要求 - 以接受指导督导为契机 推动党员干部提振精神状态、激发干事动力 努力以一流作风创造一流业绩 [2] - 市政府党组要切实扛牢主体责任 各级领导干部要以身作则、以上率下 带头学查改 [2] - 目标是为全省加快建成中部地区崛起的重要战略支点做出更大贡献 [2]
从后训练回到预训练,LLM+RL 的潜力兑现有有机会走更远吗?
机器之心· 2025-06-28 13:22
从后训练回到预训练,LLM+RL的潜力分析 - 强化学习(RL)与大型语言模型(LLM)结合的技术路径从后训练阶段延伸至预训练阶段,通过将文本生成重构为序贯决策问题,引入对未来"累积奖励"的评估机制[2] - LLM传统监督学习范式面临高质量标注数据成本高、人类知识存在边界等局限,而RL通过模型与环境交互生成数据,并将监督信号从"生成式"退化为"验证式",降低了对数据质量和标注难度的要求[3] - 微软研究院与清北研究者提出的"Reinforcement Pre-Training(RPT)"技术将RL应用于预训练阶段,在部分推理基准上表现超越传统方法训练的更大模型[4] RL在预训练阶段的技术突破 - RPT方法将下一个词元预测(NTP)任务重塑为可验证的推理任务,利用海量无标注文本数据作为RL训练资源,通过生成思维链(CoT)再预测token的方式规避传统RL方法的局限[5] - 该方法突破了RLHF依赖标注数据、RLVR受限于标准答案等约束,但尚未在更广泛文本和基础模型上验证,且存在计算资源消耗大的问题[5] - 行业早在2022年就开始关注RL预训练课题,南京大学AI学院副院长等专家曾系统分析过RL中少有预训练模型的原因[6] 技术演进趋势与挑战 - LLM+RL路线从后训练向预训练延伸,显示出技术潜力但面临理论缺陷、实现难度和任务适配等多重挑战[4] - 当前RL预训练方法虽能部分解决数据依赖问题,但计算效率、泛化能力等核心瓶颈仍未完全突破[5] - 行业需持续探索如何平衡RL的序贯决策优势与LLM的生成能力,该领域的技术突破可能重塑模型训练范式[2][3][4]
OpenAI 4 名王牌研究员“叛变”,Meta 上亿美元的签约奖金终于花出去了
AI前线· 2025-06-28 13:13
Meta AI人才争夺战略 - Meta近期从OpenAI挖角4名核心研究人员加入其新成立的超级智能实验室 包括强化学习专家特拉皮特·班萨尔和曾参与建立OpenAI苏黎世办公室的卢卡斯·拜尔等三人 这些人才此前在DeepMind实验室也有任职经历 [1] - 公司为挖角OpenAI员工曾开出单笔高达1亿美元的签约奖金 但部分研究人员因OpenAI提供更高薪资和发展空间而拒绝邀约 [2] - 除OpenAI外 Meta还从ScaleAI挖角其CEO亚历山大·王 同时以143亿美元投资获取该公司49%股份 并计划收购语音AI开发商PlayAI以吸纳其技术团队 [2] Meta AI技术布局 - 超级智能实验室目标开发能超越人类表现的多任务AI模型 该部门成立背景与Llama 4 Behemoth大型语言模型性能问题直接相关 原定今年发布的该模型因技术问题已推迟 [1] - 计划聘请AI领域顶级投资人丹尼尔·格罗斯和前GitHub CEO纳特·弗里德曼 二人目前任职的Safe Superintelligence公司与Meta实验室目标高度重合 [3] - 2025年将投入650亿美元建设数据中心基础设施 包括配备超130万块英伟达显卡的超大规模数据中心 [3] 行业人才竞争动态 - OpenAI采取加薪和职业发展承诺等策略应对Meta挖角 显示头部AI企业间人才争夺白热化 [2] - Meta通过"人才+并购"双轨策略快速扩张AI能力 除直接招聘外 还以收购PlayAI等初创公司方式获取整建制团队 [2][3] - AI芯片领域出现新竞争者 某中国AI芯片公司成立5年估值超百亿 正争夺"国产GPU第一股"称号 [5]