Workflow
规模定律
icon
搜索文档
场效应管:100周年
半导体行业观察· 2025-12-26 09:57
场效应晶体管(FET)的百年发展历程 - 文章核心观点:场效应晶体管(FET)的概念于1925年由尤利乌斯·埃德加·利连菲尔德发明,但其从原理提出到最终实现并走向实用化,经历了长达约35年的曲折历程,期间半导体物理、材料纯度和关键结构(如PN结、肖特基结)的发现与技术进步起到了决定性作用 [1][4][11][32] FET的早期概念与发明 - 1925年,德国物理学家尤利乌斯·埃德加·利连菲尔德发明了金属半导体场效应晶体管(MES FET),其结构以铝箔为栅极,硫化铜(Cu₂S)为源极、漏极和沟道 [5][7] - 1928年,利连菲尔德进一步发明了金属氧化物半导体场效应晶体管(MOS FET),使用氧化铝薄膜(Al₂O₃)作为栅极绝缘膜 [8] 实现FET面临的核心挑战 - 早期半导体材料纯度极低,缺陷和杂质多,导致无法精确测量和控制材料特性 [11] - 半导体内部存在大量电荷,难以像真空管那样通过栅极电压有效控制电流,需要在半导体内部创建类似“真空”的极低电荷区域 [11] - 半导体表面存在的表面态电荷会屏蔽栅极电场,阻碍其对半导体内部电荷的控制,这一问题在1946年被约翰·巴丁指出 [22] 关键技术与结构的突破 - 1939/1940年,贝尔电话实验室的罗素·舒梅克·奥尔发现了PN结,其交界处形成的“耗尽层”是一个无电荷区域,为控制电流提供了关键结构 [18] - 1938年,德国西门子公司的沃尔特·肖特基提出了肖特基结理论,解释了金属-半导体接触面的整流原理,其接触面半导体侧也会形成极薄的无电荷区域(耗尽层) [19][20] - 1958年,贝尔电话实验室的马丁·阿塔拉开发了硅表面热氧化生成二氧化硅(SiO₂)薄膜的技术,该薄膜可作为MOS FET的栅极绝缘层,稳定硅表面 [27] 从双极晶体管到实用FET的演进 - 1947年12月,贝尔电话实验室的约翰·巴丁和沃尔特·H·布拉顿制造出世界上第一个实用的“点接触型”晶体管(结型晶体管) [13] - 1948年1月,威廉·肖克利提出了双极结型晶体管(BJT) [15] - 20世纪50年代,硅单晶生长、杂质掺杂、光刻等双极晶体管技术的发展,为后续MOS FET的实现奠定了基础 [21] - 1953年,威廉·肖克利与沃尔特·L·布朗制造出结型场效应晶体管(JFET)原型 [24] - 1959年,贝尔电话实验室的Dawon Kahng和Martin Atala发明了MOS场效应晶体管,并于1960年在学术会议上展示 [29][30] 发展阶段的划分 - 岩井博教授将FET的百年(1925-2025)划分为两个时期:前45年(1925-1970)为“循序渐进的时期”,是在未知道路上的探索;后55年(1970-2025)为“成功故事的时期”,以“规模定律”和“摩尔定律”为标志 [4]
张亚勤院士:基础大模型最终不超过10个,十年后机器人比人多 | MEET2026
量子位· 2025-12-11 17:00
文章核心观点 新一轮人工智能是信息智能、物理智能和生物智能的融合,在规模定律驱动下,智能从模式识别“涌现”为生成式与推理式AI,并正快速演化为智能体范式[2][3][12] 以ChatGPT和DeepSeek为里程碑,AI发展正从预训练时代迈向以推理为核心的“DeepSeek时刻”,并在高效率、低成本和开源生态中加速落地[4][11][12][14] 未来5-10年,产业将进入“智能体互联网”时代,智能体将取代大部分SaaS和App,成为人机交互的默认形态,这也是通往通用人工智能(AGI)的必经之路[6][12][38][40] AI发展范式演进 - **新一轮AI的本质是三大智能融合**:即信息智能、物理智能和生物智能的融合,本质上是原子、分子和比特的融合[2][8][12] - **智能涌现的关键驱动**:在规模定律(Scaling Law)持续作用下,当参数规模、数据体量与算力跨过阈值,智能从鉴别式AI“涌现”为生成式AI,再走向以智能体为代表的新范式[3][10][11] - **两大里程碑事件**:ChatGPT通过统一表征与token化,将文本、语音、图像乃至蛋白质、点云等数据纳入同一空间,实现了从鉴别式AI到生成式AI的跨越[4][10] DeepSeek则以高效率、高性能、低价格和开源路径,将大模型从“预训练时代”推向以推理为核心的“DeepSeek时刻”[4][11][14] AI发展的五大趋势 - **趋势一:生成式AI正快速演化为智能体**:智能体是近两年AI领域最重要的创新,其任务长度在过去七个月增长了两倍,准确度已大于50%,与人类对齐[15][17][18] - **趋势二:规模定律重心转移**:规模定律在预训练阶段已放缓,更多智能发展转移至后训练、推理和智能体阶段[19] 推理的单位成本在过去一年下降了10倍,而智能体本身的算力要求一年增长了10倍,两者成本效应相互平衡[19] - **趋势三:从信息智能走向物理与生物智能**:大语言模型正走向视觉语言动作模型(VLA)[20] 无人驾驶在2024年已到达“ChatGPT时刻”,预计到2030年(DeepSeek时刻),约10%的新车将拥有L4级无人驾驶能力[20] 机器人是未来最大赛道之一,预计未来10年左右,机器人的数量将超过人类数量[21] - **趋势四:AI风险同步放大**:随着智能体的出现,AI相关的风险至少翻倍[22] - **趋势五:开源成为主流生态**:开源将成为更大、更主要的平台和生态,预计约80%的模型为开源,20%为闭源[23] 未来产业格局:智能体互联网 - **基础大模型如操作系统般收敛**:基础大模型相当于AI时代的操作系统,全球范围内最终将收敛到不超过10个,主要由中美两国引领[6][12][23][35] - **智能体取代传统软件形态**:智能体会取代今天的大部分SaaS和手机App,成为企业和个人与世界交互的默认形态[6][30] 未来的企业架构将包含GPU、大模型、数据以及由人和智能体共同构成的人力资源[25] - **形成新的产业架构与经济形态**:产业将重构为“基础模型+垂直/边缘模型+智能体网络”的新格局[12][23] 智能体不仅在形成网络,也在形成新的经济形态[25] 整个产业规模将比PC时代、移动时代大一个、两个甚至三个数量级[37] - **是通往AGI的必经之路**:智能体互联网是未来5-10年最大的发展方向,也是实现通用人工智能(AGI)的必经之路,需要新的算法体系如记忆体系、世界模型等[12][38][40] 预计未来五年,现有的自回归架构、Transformer、Diffusion等技术可能被颠覆[41] 技术应用与展望 - **医疗智能体案例**:清华大学已开发出全球首个医疗智能体无人医院,利用多智能体网络模拟三甲医院,能在两天内完成相当于医院两到三年的病例处理,且准确度更高[31][33] 智能体主要作为医生的助理,未来每位医生都可能拥有自己的智能体[34] - **AGI实现时间表**:预计需要15-20年时间,依次完成从信息智能到物理智能,再到生物智能的跨越[12][42]
2025乌镇互联网峰会:蚂蚁集团已部署万卡规模国产算力群
环球网· 2025-11-08 19:03
算力部署与技术能力 - 公司已部署万卡规模的国产算力集群,适配自研与主流开源模型 [1] - 训练任务稳定性超过98%,训练与推理性能可媲美国际算力集群 [1] - 算力资源全面应用于安全风控领域的大模型训练与推理服务 [1] 行业趋势与挑战 - 通用人工智能在"规模定律"推动下快速发展,部分能力已超越人类基准 [1] - 主流旗舰级语言大模型的训练数据量已超过20T,参数规模迈入"万亿"时代 [1] - 算力资源紧张与成本上升成为制约行业继续突破的关键因素 [1] 技术创新路径与成果 - 公司通过优化模型参数效率、数据应用效率、计算效率"三大效率"来提升模型响应速度与知识规模 [2] - 公司构建了涵盖语言、推理、多模态的全尺寸、全模态、全面开源的大模型体系 [2] - 全球首个开源的万亿思考大模型Ring-1T展现了领先的逻辑推理和代码能力,数学能力达国际数学奥林匹克竞赛银牌水平 [2] 效率提升与成本优化 - 通过创新训练方法,Ring-1T模型将训练效率提升了近一倍 [2] - 采用演进式思维链技术,在保障思考正确率的同时显著降低token资源消耗 [2] - 实现了任务效果与计算成本之间的"帕累托最优" [2] 发展理念与未来展望 - 公司认为理想的未来是AI助力人类放大能力,实现人机高度融合与协作 [2] - 在提升智能化水平的同时,强调确保AI技术遵循伦理与安全可信 [2]
张亚勤院士:AI五大新趋势,物理智能快速演进,2035年机器人数量或比人多
机器人圈· 2025-10-20 17:16
AI产业规模与代际演进 - 人工智能时代产业规模预计将比前一代(移动互联时代)至少大100倍[5] - 移动互联时代产业规模比PC互联时代至少大10倍[5] AI技术发展的五大新趋势 - 趋势一:AI技术从鉴别式、生成式走向智能体AI,过去7个月智能体AI任务长度翻倍且准确度超过50%[7] - 趋势二:预训练阶段规模定律放缓,更多工作转移至训练后阶段如推理和智能体应用,前沿模型智力上限仍在提升但迭代速度放缓[7] - 趋势三:物理智能和生物智能快速发展,VLA模型推动智能驾驶规模化落地,预计2030年10%车辆将具备L4功能[7] - 趋势四:AI风险快速上升,智能体出现使AI风险至少增加一倍[8] - 趋势五:AI产业新格局形成,呈现基础大模型+垂直模型+边缘模型架构,后两者未来发展空间更大[8] 大模型发展格局预测 - 预计2026年全球基础大模型约8-10个,中国占3-4个,美国占3-4个[8] - 中国大模型发展具独特性,表现为更快算法、更高效率、更低价格[8] - 未来开源模型将成为主流,开源与闭源模型比例预计为4:1[8] 成本与算力动态 - 过去一年推理成本降低10倍,但智能体复杂性使算力需求上涨10倍,形成乘数效应[7] 长期产业机遇 - 新一代人工智能是原子、分子和比特融合,是信息智能、物理智能和生物智能融合[3] - 具身智能快速爆发,预计2035年机器人数量有望超过人类[8]
专家:2035年机器人数量或比人多
21世纪经济报道· 2025-10-04 13:41
AI产业规模与代际演进 - 新一代人工智能是原子、分子和比特的融合,是信息智能、物理智能和生物智能的融合 [1] - 移动互联时代产业规模比PC互联时代至少大10倍,人工智能时代产业规模将比前一代至少大100倍 [1] AI产业发展五大新趋势 - 第一大趋势是从鉴别式AI到生成式AI,并走向智能体AI,过去7个月智能体AI的任务长度翻倍、准确度超过50% [3] - 第二大趋势是预训练阶段的规模定律(Scaling Law)放缓,更多工作转移至训练后阶段如推理和智能体应用,推理成本降低10倍,但智能体复杂性使算力上涨10倍 [3] - 第三大趋势是物理智能和生物智能快速发展,如VLA模型规模化落地智能驾驶,预计2030年10%的车辆将具备L4功能 [3] - 第四大趋势是AI风险快速上升,智能体出现后让AI风险至少增加一倍 [4] - 第五大趋势是AI呈现新的产业格局,形成基础大模型+垂直模型+边缘模型局面,未来更大发展在于垂直模型和边缘模型 [4] AI模型产业格局与预测 - 预计2026年全球基础大模型约有8至10个,其中中国有3至4个,美国有3至4个 [4] - 中国在发展大模型方面呈现独特性,表现为更快的算法、更高效率、更低的价格 [4] - 未来开源模型将成为主流,开源与闭源模型之间的比例预计约为4:1 [4] 具身智能发展预测 - 具身智能将快速爆发,预计到2035年机器人数量有望超过人类数量 [4]
揭秘小鹏自动驾驶「基座模型」和 「VLA大模型」
自动驾驶之心· 2025-09-18 07:33
小鹏自动驾驶技术方法论 - 提出自动驾驶软件3.0时代概念 即"AI模型即软件" 整个软件栈由端到端AI模型构成 基于以数据为中心的方法迭代[6] - 公司处于将整个自动驾驶软件栈构建为端到端AI模型驾驶汽车的阶段[8] - 基于规模定律(scaling law) 利用每天从数十万辆真实世界车辆收集的大量数据训练大型视觉模型作为"工厂"[8] 基础模型与部署架构 - 通过大数据构建基础模型 无需依赖三维空间先验知识和空间问题 类似世界模型概念[8] - 通过深度裁剪 量化 蒸馏将基础模型压缩为更小版本 部署到车端硬件[8] - 在云端构建VLA(视觉语言动作)基础模型 通过蒸馏剪枝和微调训练部署到车端[32] 内外循环训练机制 - 内循环为每个模型创建训练流 扩展数据后进行再训练和监督微调(SFT) 持续提升模型性能[9] - 外循环通过数十万辆车作为现实世界数据采样器 持续采样数据 根据返回数据持续训练(协同训练)[11] - 重复内外循环过程直至性能达到L4级自动驾驶 公司目标2026年实现L4级智驾车型量产[11][13] VLA模型训练方法 - 采用阿里Qwen作为原始VLM模型 使用公司整理的驾驶数据进行预训练和对齐[15] - 预训练数据分类包括静态交通元素 动态交通参与者 点对点轨迹数据 占用网络 交通信号灯和交通流信息[18] - 基于Chain-of-Thought思维链进行四步推理:提供基本驾驶知识 CoT SFT 强化学习CoT 考虑延迟的CoT SFT[22][23] 模型优化与安全强化 - 监督微调(SFT)建模为"指令遵循"任务 使用筛选的好数据专门训练导航 舒适刹车等专用指令[27] - 后期训练(post-training)采用强化学习解决长尾案例 建立奖励模型确保行动一致性[29] - 强化学习设计三重奖励机制:安全(避免碰撞) 效率(避免卡壳) 合规(遵守交通规则)[30] 行业竞争核心要素 - 底层算法和架构相通 行业差距取决于高质量数据 大算力以及算法产品化和工程落地能力[32] - VLA概念需要基础成熟的LLM作为底座 针对性训练交通驾驶行为[32] - 基础模型蒸馏上车思路可加速开发并快速部署到不同算力平台 但前提需要大算力和高质量数据[32]
本轮AI算力行情的驱动因素
淡水泉投资· 2025-09-17 18:06
AI算力投资趋势 - AI行情经历从ChatGPT突破到Sora浪潮再到科技巨头加注的三阶段演进 算力需求从训练主导转向推理驱动 资本开支持续攀升推动市场成长预期 [1] - 推理端规模定律成为算力增长核心动力 AI应用需求落地推动编程/搜索/图像处理等使用量增长 用户调用与人机交互实时消耗算力 tokens消耗量激增 谷歌Gemini月消耗tokens一年增长50倍 [4][7] - 每年数千亿美元算力投资驱动产业链上游机遇 涵盖GPU及配套高速互联方案/电源/散热系统等环节 [7] 海外算力投资逻辑 - 产品升级与价格敏感上游环节受关注 芯片升级与互联升级构成产品迭代两大核心动力 [8] - 芯片升级推动配套系统持续迭代 英伟达从H系列过渡到B系列并计划推出R系列 芯片功耗提高推动电源规格从3kw升至5.5kw并可能达10kw以上 散热方案从风冷转向液冷 单系统价值量持续提升 [10] - 互联升级要求材料技术革新 高速线缆互联速率从112G向224G升级并可能向448G演进 对PCB和铜缆等材料提出更高要求 [10] - 价格敏感上游环节存在供给滞后效应 PCB产业链扩产存在传导滞后 上游扩产周期更长导致供给紧张价格弹性明显 [9] 国产算力发展机遇 - 中美算力储备增速出现差距 美国互联网公司算力储备几乎每年翻倍 国内受高端芯片禁运影响存在算力缺口 需国产算力芯片补足 [13] - 国产GPU单卡性能已可对标英伟达对华特供版 H20芯片性能低于部分国产GPU产品 [15] - AI算力从训练转向推理的趋势利好国产算力 推理对超大集群互联要求较低 有利于国产算力在特定场景满足需求 [15] - 国产算力需关注高壁垒与远期空间两大维度 晶圆制造/GPU芯片/半导体设备等上游环节壁垒高竞争格局优 GPU/AIDC/服务器ODM等环节远期市场空间大 [15] 产业趋势特征 - AI发展伴随高度不确定性 DeepSeek大模型曾引发算力通缩担忧 推理端需求增长使叙事重回乐观 需紧密跟踪产业趋势变化 [16]
张宏江外滩大会分享:基础设施加速扩张,AI步入“产业规模化”
贝壳财经· 2025-09-11 15:09
大模型规模定律 - 大模型参数越高性能越好 规模定律仍是大模型性能提升的第一性原则 [3] - 推理模型塑造大规模发展新曲线 推理规模定律成为新增长动力 [3] - 上下文和记忆等层面持续推升计算需求 推动模型持续扩展 [3] 大语言模型通缩效应 - 大模型单位token价格三年内快速下降 使用成本随性能提升持续降低 [3] - 模型通缩现象进一步强化规模定律 成本下降推动应用普及 [3] AI基础设施扩张 - OpenAI的Stargate和Musk的Colossus等项目驱动基础设施扩张 100万个GPU耗电量相当于北京市用电量八分之一 [3] - 2025年美国主要科技公司AI相关资本开支预计超3000亿美元 产业链经历大规模建设热潮 [3] - IDC产业大规模建设带动电力生态和经济发展 体现AI产业规模化核心特征 [3] 智能体经济变革 - 人类进入智能体群时代 数量庞大的智能体交互执行任务交换数据信息 [4] - 模型和GPU算力成为未来组织核心资产 企业需扩大算力强化模型丰富数据 [4] - 智能体重塑企业流程 超级个体与智能体结合带来巨大结构性变革 [4] 行业平台建设 - 外滩大会连续举办四届 打造全球金融科技产业高规格开放对话平台 [5] - 大会获得上海市地方金融管理局和黄浦区人民政府支持 成为重要行业交流载体 [5]
源码资本张宏江:AI 步入“产业规模化”
华尔街见闻· 2025-09-11 14:07
大语言模型发展趋势 - Scaling Law仍然有效 推理模型的出现塑造了大规模发展的新曲线即"推理规模定律" 上下文和记忆等层面对计算需求持续推升scaling up [1] - 大语言模型通缩现象进一步强化规模定律 单位token价格过去三年快速下降 模型性能持续提升导致使用成本不断降低 [1] AI基础设施扩张 - AI驱动基础设施大规模扩张 OpenAI的Stargate和Musk的Colossus等项目需100万个GPU 耗电量相当于北京市用电量的八分之一 [2] - 2025年美国主要科技公司AI相关资本开支预计超3000亿美元 AI数据中心产业链经历大规模建设热潮 [2] - IDC产业大规模建设带动电力生态和经济发展 体现AI产业规模化核心 [2] 智能体经济发展 - 人类正进入"智能体群"时代 数量庞大的智能体彼此交互执行任务交换数据和信息 [2] - 人类与智能体群的交互构成"智能体经济" 模型和GPU算力成为未来组织核心资产 [2] - 企业需要扩大算力使模型更强大数据更丰富 Agent将重塑企业流程带来巨大结构性变革 [2]
张宏江:基础设施加速扩张 AI正步入“产业规模化”
央广网· 2025-09-11 13:07
大模型规模定律 - 规模定律仍然有效 大模型参数越高性能越好 是性能提升的第一性原则 [1][2] - 推理规模定律成为新发展曲线 上下文和记忆等层面持续推升计算需求 [2] - 大语言模型通缩现象强化规模定律 单位token价格过去三年快速下降 使用成本持续降低 [2] AI产业化发展 - AI驱动基础设施大规模扩张 AI数据中心产业链经历大规模建设热潮 [2] - IDC产业大规模建设带动电力生态和经济发展 体现AI产业规模化核心 [2] 智能体经济变革 - 人类进入智能体群时代 数量庞大的智能体彼此交互执行任务交换数据信息 [3] - 模型和GPU算力成为未来组织核心资产 企业需要扩大算力增强模型和数据 [3] - Agent重塑企业流程 超级个体与agent结合带来巨大结构性变革 [3]