语言模型(LLM)

搜索文档
一堂「强化学习」大师课 | 42章经
42章经· 2025-04-13 20:01
强化学习(RL)基础概念 - 强化学习是机器学习中解决多步决策问题的算法框架 其特点在于没有标准答案 通过最终反馈机制评判结果好坏[6] - 与传统监督学习不同 RL不需要标注数据 而是通过环境交互获得奖励信号 更接近人类解决问题的逻辑[6][7] - 典型应用场景包括游戏(如乒乓球)和复杂任务(如行程规划) 每个决策步骤会影响最终结果[6] RL与LLM的结合发展 - OpenAI首次在InstructGPT中将RL与LLM结合 解决大模型指令遵从问题 衍生出RLHF技术[10][11] - RLHF通过人工标注数据训练奖励模型 使LLM输出更符合人类需求 但本质是对齐而非增强模型能力[12][13] - RL实现"慢思考"机制 通过延长推理过程(token量增加)提升LLM准确性 形成inference time scaling范式[14][15] 行业技术路径分化 - OpenAI聚焦Agent范式 实现多轮交互和虚拟世界操作 完成从单轮到多轮的跃迁[20][21] - Anthropic专注编程能力 在简单问题快速响应与复杂问题深度思考间取得平衡[17][30] - DeepSeek探索通用泛化能力 通过理科训练与文科调校结合实现平衡输出[18][31] 技术实现关键要素 - 基建框架决定迭代效率 7B模型训练周期从7天缩短至2天可提升3倍试错机会[33] - 数据质量比数量更重要 针对性训练数据可显著提升模型性能[33] - 理解能力依赖LLM预训练 决策能力依赖RL 二者形成乘法效应缺一不可[23][24] 行业应用与人才现状 - RL人才稀缺源于技术门槛高 论文引用量比NLP/CV少一个数量级 工业级应用场景有限[39][40] - 开源框架AReaL-boba实现7B模型SOTA性能 推动RL技术普及[43] - 创业公司需把握技术窗口期 在终局到来前快速验证产品 而非追求长期技术优势[37][38] 企业组织架构建议 - 预训练与后训练团队需紧密协作 成员需具备跨领域知识避免能力盲区[36] - 按目标划分专业团队(多模态/RLHF等) 同时保持技术路线的灵活性[36] - Agent公司需储备RL人才 尽管当前技术门槛较高但未来可能成为标配能力[37]
人工智能芯片大赢家
半导体芯闻· 2025-04-07 19:07
AI技术发展及市场前景 - AI技术和应用正以惊人速度加速发展,GenAI/LLM领导者Nvidia预计2030年成为首家市值达10万亿美元的公司[1] - 大型语言模型(LLM)功能和成本效率快速提升,ChatGPT周活跃用户超5亿且持续增长[1] - 数据中心资本支出预计2028年达1万亿美元,2030年可能达1.4万亿美元[1] 数据中心半导体市场格局 - 数据中心相关半导体年出货量已超2200亿美元(不包括电源芯片)[3] - 预计2030年数据中心半导体支出超5000亿美元,占整个半导体行业50%以上[4] - 市场高度集中,九家公司占据几乎所有数据中心半导体收入:Nvidia、台积电、博通、三星、AMD、英特尔、美光、SK海力士和Marvell[6] GPU/AI加速器市场 - GPU/AI加速器占数据中心半导体支出60%,市场规模预计2030年达3000-4000亿美元[6][7] - Nvidia占据主导地位,近期季度收入约330亿美元,博通约40亿美元,Marvell约10亿美元,AMD不足10亿美元[8] - Nvidia利润率约75%,博通约65%,定制ASIC可降低成本约40%[7][10] 网络设备市场 - 网络设备占数据中心支出5-10%,预计增长至15-20%[11] - Nvidia的NVLink技术提供强大竞争优势,博通是主要交换机芯片供应商[11] - 光子学和激光技术重要性提升,主要参与者包括Coherent和Lumentum[11] CPU市场 - AMD近期季度x86 CPU出货量39亿美元,英特尔33亿美元[13] - Nvidia基于ARM的CPU(Grace)可能2030年前超越x86出货量[13] 内存市场 - HBM收入约250亿美元,完全来自数据中心,利润率远高于DDR和闪存[14] - 美光和SK海力士在HBM开发领先,三星落后[14] 其他芯片市场 - ASPEED主导BMC市场,80-90% AI主板采用其芯片[15] - 电力传输芯片市场规模巨大,48V系统和复杂PMIC需求增长[15] 半导体代工市场 - 台积电几乎生产所有高价值非内存芯片,50%以上收入来自AI/HPC[16] - 三星和英特尔面临技术挑战,但AI需求可能超过台积电产能[18] 行业整合趋势 - 市值万亿美元巨头可能收购AMD、英特尔等公司以确保AI领导地位[6] - 无法快速扩张的半导体公司可能被收购或淘汰[19]
阿里的理想,腾讯的现实
创业邦· 2025-03-25 11:09
以下文章来源于20社 ,作者贾阳 20社 . 关注年轻人的钱包、工作和生活。 来源丨20社(ID:quancaijing_20she) 作者丨贾阳 图源丨电影《无间道》 去年观察中国互联网公司,最重要的指标是"回购"。 Capex视角下 阿里腾讯作风大不同 腾讯本周发布了2024年Q4财报,万众瞩目的Capex终于出炉。 腾讯"计划在2025年进一步增加资本支出,并预计资本支出将占收入的低两位数百分比。"也就是说,腾讯今年的Capex将达到 千亿级别。 在内外都缺乏新故事可讲的时候,各个公司在"成长性"上令人失望,那么回馈股东成了负责任公众公司的一致选择。 今年则大不相同。经历了连续数年的低迷周期后,巨头们纷纷进入投资周期,加入AI军备竞赛。Capex(Capital Expenditure),也就是资本开支,成为了最受关注的指标。 腾讯的Capex去年Q4开始飙升 不过,各家公司对AI Capex的力度、态度又有一些微妙差别。 阿里高歌猛进,一鼓作气。腾讯则相对更步履款款。字节砸钱力度同样大。美团试探而克制…… 将这些结合起来,我们可以大致看到中国AI产业的独特图景了。 腾讯的投资从去年就开始加速,Q4资本 ...
杨立昆“砸场”英伟达:不太认同黄仁勋,目前大模型的推理方式根本是错的,token 不是表示物理世界的正确方式|GTC 2025
AI科技大本营· 2025-03-21 14:35
责编 | 王启隆 出品丨AI 科技大本营(ID:rgznai100) 黄教主的演讲 感觉才没过几天,今年的 GTC 英伟达大会也即将迎来尾声了。 而今年比尔·达利则是对话"AI 教父" 杨立昆 (Yann LeCun),很有前后呼应的感觉。 但 GTC 并不只有黄仁勋和杨立昆,还有许多精彩的演讲与对话,比方说: ………… 接下来的一段时间, CSDN AI 科技大本营 将会在「 GTC 2025 大师谈 」栏目持续更新这些精华内容的全文整理,尽情期待。 比尔·达利 自己就在采访杨立昆之后进行了一场 演讲 ,系统性地讲解了英伟达 2024 一整年的四大项目进展,内容干货很多; OpenAI o1 作者 诺姆·布朗 (Noam Brown)和英伟达的 AI 科学家来了一场 对话 ,他认为现在 AI 圈最需要来一场革命的,就是这些五花八 门的 基准测试 (Benchmark),而且改这个东西还不需要花太多算力资源; 2018 年诺贝尔化学奖得主 弗朗西斯·阿诺德 (Frances Arnold)围绕 AI for Sciense 还有蛋白质工程进行了一场相当硬核的 圆桌对话 ; UC 伯克利教授 彼得·阿比尔 (P ...
GenAI 的存储解决方案 第 7 部分:解决方案梳理
Counterpoint Research· 2025-03-18 17:14
Rick Cui / 客户服务总监 电话: +86 13801127537 邮箱:rick@counterpointresearch.com 媒体采访 Haylee Xu / 市场专员 电话: +86 15959754429 邮箱:haylee.xu@counterpointresearch.com 对于 GenAI 的解决方案而言,诸如带宽和容量之类的优势固然重要,但功耗、占用面积和价格等成 本因素也需要加以考量。由于存储器是一种依赖于中央处理器(CPU)的被动组件,其配置会根据 处理器而做出改变。在这方面, ARM 近期的战略调整以及基于 MoE 的大语言模型(LLM)可能出 现的变化,都可能会导致未来架构和解决方案发生改变。 数据来源:Source: Counterpoint Research 点击阅读原文下载完整版 PDF 报告 业务咨询 ...
GenAI 的存储解决方案 第 7 部分:解决方案梳理
Counterpoint Research· 2025-03-18 17:14
对于 GenAI 的解决方案而言,诸如带宽和容量之类的优势固然重要,但功耗、占用面积和价格等成 本因素也需要加以考量。由于存储器是一种依赖于中央处理器(CPU)的被动组件,其配置会根据 处理器而做出改变。在这方面, ARM 近期的战略调整以及基于 MoE 的大语言模型(LLM)可能出 现的变化,都可能会导致未来架构和解决方案发生改变。 Haylee Xu / 市场专员 电话: +86 15959754429 邮箱:haylee.xu@counterpointresearch.com 数据来源:Source: Counterpoint Research 点击阅读原文下载完整版 PDF 报告 Rick Cui / 客户服务总监 电话: +86 13801127537 邮箱:rick@counterpointresearch.com 媒体采访 业务咨询 ...
彭博数据洞察 | 透过AI看新闻,投资信号抓得准
彭博Bloomberg· 2025-03-14 11:08
AI驱动的新闻摘要功能 - 彭博旗舰产品"新闻标题与正文"覆盖全球上万个主题领域,遍及所有地区及主流企业,并配有丰富的标签体系,可标注话题、证券代码及人物信息 [3] - 利用大语言模型(LLM)和文本嵌入技术可计算不同新闻标题之间的相似度,有效识别重复信息,同一主题下的新闻报道数量可反映事件的市场影响力 [4] - 通过提示工程可提取关键特征如"WTI原油市场是否受影响"或"事件是否导致石油供应中断",这些特征值可生成市场信号与波动率预测 [6] 供应链数据与生物多样性风险 - 自然相关财务信息披露工作组(TNFD)发布建议帮助企业评估并披露自然资源依赖度、环境影响、风险与机遇,特别强调对上下游价值链的全面评估 [7] - 通过整合供应链数据与生物多样性数据库,可精确定位供应商在高水资源压力区域或生物多样性完整度区域的资产分布 [8] - 明治控股供应商位于高/极高水资源压力区域及生物多样性完整度区域的实体资产占比数据可供分析 [9] 欧洲汽车行业分析 - 欧洲汽车行业销售动能持续衰减,供应商业绩分析显示这一颓势早在市场普遍察觉之前便已现端倪 [12] - 分析覆盖欧洲汽车板块1500+供应商,遍布53个国家,结合标准化财务数据支持多维度关联分析 [12] - 欧洲汽车供应商的需求疲软迹象精准预示了行业拐点,印证财务数据与供应链信息整合对行业趋势预判的价值 [12]
DeepSeek对英伟达长期股价的潜在影响
致富证券· 2025-03-12 14:38
报告行业投资评级 未提及 报告的核心观点 - DeepSeek在训练和推理成本上有显著优势,引发科技股大幅波动,短期内冲击英伟达股价,但长远看随着AI技术普及和商业化加速,英伟达芯片需求可能进一步增长,AI产业将迈向新阶段 [2][3][16] 根据相关目录分别进行总结 DeepSeek引发市场波动 - 1月27日,DeepSeek在中国区和美国区苹果App Store免费榜登顶,美国科技股市场大幅下跌,费城半导体指数下跌9.2%,英伟达股价下跌近17%,市值蒸发近6000亿美元,WTI原油价格盘中一度下跌3% [2] DeepSeek成本优势 - 训练成本方面,DeepSeek使用约2000张H800 GPU训练,V3模型训练成本不超过600万美元,预训练阶段每万亿Token训练用2048个H800 GPU集群,180K个GPU小时(约3.7天)完成,总耗时约2788K GPU小时 [5][6] - 推理成本方面,OpenAI的o1模型每百万输入和输出Token分别收费15美元和60美元,DeepSeek的R1模型相同输入和输出价格仅为OpenAI的3%,DeepSeek推理成本API报价每百万Token输入成本仅1元 [3][7] DeepSeek低成本训练实现方式 - DeepSeek团队创新训练策略,在监督微调环节优化,最初尝试跳过SFT步骤仅用强化学习训练,引入少量冷启动数据提升稳定性和推理能力,R1系列模型摒弃RLHF中的人类反馈部分 [9] - 为解决纯强化学习训练文本中英混杂问题,用数千条链式思考数据微调V3 - Base模型,再启动强化学习流程生成样本数据微调得到R1模型,降低成本同时提升推理和语言生成质量 [10] DeepSeek对AI产业影响 - 对依赖自研大模型构建商业模式的公司影响更显著,如引发Meta内部AI团队担忧,Meta成立小组分析其技术原理并计划用于Llama模型优化 [12] - 美国大型科技企业以保持技术领先为首要目标,虽可能借鉴DeepSeek方法优化成本,但不会作为核心战略,现阶段大语言模型发展需大量算力,未来其他机器学习模型也可能有巨大算力需求 [13] - 英伟达认为DeepSeek成果会增加市场对其芯片需求,依据杰文斯悖论,技术进步降低资源使用成本会使市场对资源总体需求上升 [14] - DeepSeek降低大语言模型开发门槛,促使更多中小型企业和个人训练私有模型,若引发推理需求“第二波”增长,增量需求将远超AI巨头减少的GPU采购量,且商业化后推理环节算力消耗更大 [15]
2025中国AI“奇点”已至?摩根大通:应用井喷在即,DeepSeek点燃算力需求,阿里或成最大赢家
硬AI· 2025-03-10 18:32
点击 上方 硬AI 关注我们 摩根大通认为,中国GAI的发展目前正处于第二阶段的开端,阿里巴巴是IAAS价值链中的关键一员,有望在GAI发展的第 二阶段跑赢同行,也具备成为第三阶段应用受益者的潜力。此外,快手可能被低估了、百度既是"卖铲人",也是"淘金 者"。 硬·AI 作者 |张雅琦 编辑 | 硬 AI 还记得2010年吗?移动互联网的浪潮席卷而来,重塑了整个互联网格局。如今,摩根大通的分析师们认 为,中国的AI领域,正站在类似的"奇点"之上。 在摩根大通9日发表的研报中,Alex Yao团队指出,2025年将成为中国生成式AI(GAI)应用爆发的关键 一年。报告将中国GAI的发展划分为四个阶段,并为每个阶段提出了相应的投资策略。核心观点是,随着 DeepSeek等国产大模型的崛起,GAI的应用正在加速渗透,并将引爆对算力的巨大需求。 那么,谁将在这场AI盛宴中分得最大的蛋糕?摩根大通的答案是:阿里巴巴。 摩根大通认为,中国GAI的发展目前正处于第二阶段的开端,阿里巴巴是IAAS价值链中的关键一员,有望 在GAI发展的第二阶段跑赢同行,也具备成为第三阶段应用受益者的潜力。此外,快手可能被低估了、百 度既是" ...