Workflow
神经网络
icon
搜索文档
AI教父Hinton,重新能坐下了
虎嗅· 2025-08-03 12:53
行业与公司发展 - 2012年Hinton团队在ImageNet竞赛中以15.3%错误率夺冠,标志深度学习在图像分类领域的重大突破 [30][31] - 深度学习复兴的两大前提:2010年前后计算能力与大数据成熟 [34] - Hinton团队开发的神经网络技术使机器识别常见物体的准确度达到前所未有的水平 [33] 关键技术突破 - Hinton与搭档提出玻尔兹曼机和反向传播算法,解决机器"从数据中自动提炼内部表征"的核心难题 [20] - ChatGPT底层架构采用Transformer,属于神经网络的一种特殊形式 [13] - 2012年深度学习从纯学术研究转向产业应用,成为科技巨头战略核心 [42][43] 重大商业事件 - 2013年谷歌以4400万美元收购Hinton创立的DNNResearch公司 [40][41] - 谷歌随后以6.5亿美元收购DeepMind,该交易被视为谷歌最值得的投资之一 [54] - DeepMind被收购后开发出AlphaGo、AlphaFold、Gemini等里程碑式AI产品 [55][57] 行业影响与趋势 - 2019年Hinton与LeCun、Bengio共获图灵奖,表彰其推动神经网络成为科技产业核心 [59][60] - 2023年Hinton预警AI风险,提出"AI30年内导致人类灭绝概率10%-20%"的观点 [76] - AI发展速度超预期,Hinton修正预测认为"AI5年内可能比人类更聪明" [76] 行业应用前景 - Hinton认为AI将颠覆所有行业,仅水管工等需要高度创造力的职业暂时安全 [76] - 谷歌通过整合DeepMind与谷歌大脑部门,持续产出尖端AI产品 [57] - 全球科技巨头围绕深度学习重构业务,涵盖搜索、语音、图像识别、自动驾驶等领域 [43]
为什么Thor芯片要保留GPU,又有NPU?
理想TOP2· 2025-08-02 22:46
纯GPU在自动驾驶中的应用与局限性 - 纯GPU可实现低级别自动驾驶,但存在延迟、功耗和效率等明显短板,难以满足L3及以上级别需求 [4][6] - 早期测试案例显示,基于英伟达GTX1080GPU的方案在60公里/小时车速下,80毫秒延迟导致车辆前进1.33米,存在安全隐患 [5] - 特斯拉早期采用NVIDIA PX2 GPU,后转向自研NPU(FSD芯片)以优化能效 [6] GPU、NPU、TPU的架构与原理对比 - GPU设计初衷为图形渲染,以英伟达GTX1080为例,含2560个流处理器,但执行神经网络计算时30%-40%硬件资源闲置 [8][9] - NPU专为神经网络设计,如华为昇腾310B含2048个MAC单元,数据流转路径比GPU减少60%以上 [10][14] - TPU采用脉动阵列架构(如TPU v2的512x512阵列),数据复用率比GPU高3倍以上,专为TensorFlow优化 [12][28] 自动驾驶芯片的混合架构设计 - 英伟达Thor芯片同时集成GPU和NPU,NPU处理YOLOv8模型单帧图像耗时5毫秒,GPU处理100万点云数据耗时3毫秒,协同效率提升40% [32][33] - 混合架构降低硬件成本25%,减少50%电路板空间占用,并保留GPU以兼容传统算法(如SLAM),节省18个月适配时间 [33][34] 能效与成本数据对比 - NPU能效显著优于GPU:华为昇腾310B能效比2.75TOPS/W,是英伟达Jetson AGX Xavier(1.07TOPS/W)的2.5倍 [36] - 特斯拉FSD芯片NPU部分能效比5.76TOPS/W,相同算力下功耗仅为纯GPU方案的1/4.8 [36] - 量产10万台时,NPU单位研发成本30美元/台,GPU为80美元/台;144TOPS算力下,NPU方案硬件成本仅为纯GPU方案的12.5% [37] 技术发展趋势 - 纯GPU方案在L4级自动驾驶中面临瓶颈:处理5-10GB/秒数据需多颗GPU协同,功耗达320W,使电动车续航减少30% [6] - 未来主流方案为NPU+GPU混合架构,兼顾神经网络处理效率与通用计算兼容性,综合优化延迟、能耗及成本 [40]
自动驾驶为什么需要NPU?GPU不够吗?
自动驾驶之心· 2025-07-26 21:30
自动驾驶芯片技术对比 - 纯GPU方案可实现低级别自动驾驶,但存在延迟高(80毫秒导致车辆行驶1.33米)、功耗大(4颗TITAN X GPU达320W使电动车续航减少30%)和效率低(ResNet-152模型处理4K图像耗时28毫秒)三大短板 [5][6][7] - NPU专用架构在神经网络计算中表现优异:华为昇腾310B含2048个MAC单元,数据流转路径比GPU减少60%;处理相同任务耗时仅8毫秒,比GPU快3.5倍 [12][6] - TPU采用512x512脉动阵列,数据复用率比GPU高3倍,专为TensorFlow优化但灵活性较低 [12][14][27] 芯片架构原理差异 - GPU基于通用流处理器(如GTX1080含2560个),执行AI任务时30%-40%硬件资源闲置 [10] - NPU采用MAC阵列直接映射神经网络结构,华为昇腾310B通过2048个乘加单元实现硬件级矩阵运算加速 [12][15] - TPU的脉动阵列通过数据节拍流动(如TPUv2的512x512阵列)减少访存次数,适合大型矩阵乘法 [14][15] 混合计算方案优势 - 英伟达Thor芯片采用GPU+NPU异构设计:NPU处理YOLOv8目标检测(5毫秒/帧),GPU完成激光雷达坐标转换(3毫秒/百万点云),协同效率提升40% [30] - 混合方案相比纯GPU硬件成本降低25%(单芯片成本500美元 vs 4000美元),电路板空间占用减少50% [31][35][36] - 兼容现有GPU算法可节省18个月适配时间,量产10万台时NPU单位研发成本仅30美元(GPU需80美元) [30][37] 能效与成本数据 - NPU能效比显著领先:特斯拉FSD芯片NPU部分达5.76TOPS/W,是同级GPU方案(1.07TOPS/W)的5.4倍 [34] - L4自动驾驶测试中,纯GPU方案(150W)比混合方案(60W)每百公里多耗电8度,续航减少53公里 [34] - 实现144TOPS算力时,NPU方案硬件总成本1200美元仅为纯GPU方案(5500美元)的21.8% [35][36]
从人文视角为青少年解读AI
人民日报海外版· 2025-07-10 10:22
人工智能科普教育 - 涂子沛的"人工智能三部曲"包括《给孩子讲人工智能》《给孩子讲大数据》《给孩子讲大模型:基于DeepSeek、豆包和ChatGPT》,专为青少年创作,通过故事拆解大数据、人工智能、大模型的发展史与基础知识 [2] - 《给孩子讲人工智能》涵盖人工智能领域的重要历史、前沿应用和实用预警,《给孩子讲大数据》追溯大数据发展脉络并培养数据思维,《给孩子讲大模型》展示大语言模型的发展历程与功能 [2] - 作者采用诙谐语言、生动故事、幽默漫画和问题式引导,将抽象科技概念融入青少年熟悉场景,构建宏观认知并激发探索欲 [3] 科技与人文结合 - 涂子沛以人文视角平衡科学性、趣味性、思想性和文学性,不盲目崇拜技术,而是带领青少年接近人工智能的"人文入口" [3] - 书中传递文化理念:技术需要被理解、审视和赋予善意,提醒青少年学习技术是为了成为有能力、有信心的人,而非技术的仆人 [3] - 随着深度学习技术发展,未来人工智能将掌握更多数据并合成新数据,认知边界无限拓展,培养青少年面对未知的勇气与判断力至关重要 [4] 行业影响与未来展望 - 合理利用AI工具已成为AI时代不可或缺的基本技能,"人工智能三部曲"为青少年播下知识与思考的种子,可能影响未来大模型的设计者、管理者和批评者 [4]
Figure CEO:人形机器人是AGI的关键物理形态,已进入工程化验证期,将在四年内部署10万台
华尔街见闻· 2025-07-07 18:14
机器人技术发展现状 - 当前机器人领域指数级发展主要得益于硬件可靠性提升和神经网络技术的卓越表现,电动系统进步取代液压系统局限使人形机器人更安全可靠[7][8][10] - 最新设计的机器人成本降低约90%,未来四年内将实现年产10万台规模,最终目标向全球输送数亿台机器人[1][27][43] - 原型机器人已在物流、制造、医疗等高标准化行业稳定执行无需人工干预的流程任务[1][22][23] 技术突破与产品特性 - 公司采用端到端设计理念,12个月内完成人形机器人大部分部件开发,直接瞄准类人机器人终极目标[12][15] - Figure 3机器人专为高产制造设计,内置单一神经网络可连续60分钟执行物流作业,处理包裹速度从4秒/件提升至3.5秒/件[9][23][27] - 机器人具备自主学习能力,通过60小时数据训练即可掌握全新物流任务,展现类人动作和推理能力[23][43][44] 市场应用战略 - 聚焦两大场景:家庭服务(高难度非结构化环境)和劳动力市场(占GDP一半的低变异性场景)[21][24][33] - 劳动力市场优先突破物流领域,机器人可自主完成包裹分拣、条形码处理、包装翻转等复杂操作[22][23][28] - 商业模式上,家用机器人月费约数百美元,而劳动力市场机器人盈利潜力可达全球GDP一半[21][33] 行业未来展望 - 预测人形机器人将在未来10年形成类似手机的通用平台,功能主要受软件限制[33][48] - 未来社会将出现人机数量相当场景,机器人可制造其他机器人并贡献GDP,使所有工作成为可选项[30][48][51] - 超级智能时代需通过人形机器人作为物理载体,避免数字代理强迫人类完成现实任务的风险[40][41][48] 生产制造规划 - 新建制造工厂已启动Figure 3生产,内部实施高速生产项目以实现规模化[26][27] - 未来四年核心目标为推出10万台机器人,突破制造瓶颈后计划扩展至百万级产能[43][46] - 技术路线图聚焦安全性提升和运动能力优化,使机器人胜任更多人类体力劳动[27][28][42]
李飞飞最新YC现场访谈:从ImageNet到空间智能,追逐AI的北极星
创业邦· 2025-07-02 17:49
ImageNet与深度学习革命 - ImageNet通过提供大规模高质量标记数据集(80000+次引用)为神经网络成功奠定基础 开创数据驱动范式转变[8][9] - 项目历时18年孵化 初期算法错误率达30% 直到2012年AlexNet结合GPU算力实现突破性进展[11][14][16] - 采用开源策略和挑战赛形式推动社区共建 加速计算机视觉从物体识别向场景描述演进[12][17][19] 空间智能与World Labs布局 - 三维世界理解被定义为AI下一前沿 进化史长达5.4亿年 远超语言进化维度[24][25] - World Labs聚焦构建3D世界模型 团队集结NERF作者等顶尖人才 解决组合复杂度更高的空间智能问题[25][27][28] - 应用场景覆盖元宇宙内容生成 机器人学习 工业设计等 需突破硬件与内容创作双重瓶颈[30][32] 人工智能发展路径 - 视觉智能发展轨迹清晰:物体识别→场景叙事→空间智能 每阶段需5-10年技术积累[17][19][22] - 语言模型与视觉模型存在本质差异 前者依赖序列数据 后者需处理不适定的3D→2D投影问题[27][28] - AGI定义存在争议 但空间智能被视为实现通用智能不可或缺的组成部分[23][44] 创新方法论 - "智识上的无畏"被反复强调为突破性创新的核心特质 贯穿从学术研究到创业全过程[6][37][42] - 数据质量优先于数据规模 需采用混合方法获取高质量3D空间数据[47][48] - 跨学科研究与小数据理论被视为学术界可突破的潜在方向[41][42] 行业生态观察 - 开源策略应根据商业模型差异化选择 Meta等平台型企业更倾向全面开源[46] - 学术机构在计算资源劣势下 需聚焦工业界尚未关注的底层理论问题[41][42] - 硬件迭代与生成模型结合将推动元宇宙等场景落地[30][32]
对话AI教父辛顿关门弟子:为什么现有的AI方向可能是错的
虎嗅· 2025-06-16 21:08
神经网络与AI技术路线 - 杰弗里·辛顿获得2024年诺贝尔物理学奖,表彰其在神经网络领域的开创性成就 [1] - 辛顿批评当前主流大模型采用RLHF技术为"垃圾",并比喻为"锈迹斑斑的车仅进行喷漆" [1] - 神经网络研究方向在2000年前后不被学术界看好,被认为没有未来 [3][4] - AlphaGo突破证明神经网络归纳能力优于传统穷举法 [14] - 当前大模型本质是统计模型,仅能归纳无法创造新知识或智慧 [10][11][15] - 人类大脑神经网络通过层级化特征提取实现认知,远超机器抽象能力 [16][17] AI商业化与估值 - AI商业化尚未找到"杀手级"场景,许多公司高估值缺乏支撑 [21] - 人脸识别技术商业需求狭窄,过度依赖政府订单导致泡沫破裂 [21] - AI公司估值泡沫源于技术乐观主义与商业现实脱节 [26] - 垂直领域AI公司若无法拓展市场将面临生存危机 [30] - 英伟达因提供AI计算基础设施而成功,不依赖具体应用场景 [29] AI Agent与DeepSeek - AI Agent潜力在于人机交互革命,但仍处于工具阶段 [31][32] - DeepSeek降低AI使用门槛,类似PC从专业设备向大众工具转变 [36][37] - DeepSeek可能成为AI领域的"Windows"或"安卓",推动技术平权 [39][40] - AI普及需要解决"边缘场景"需求,如农民语音指令规划灌溉 [39] 中美AI产业对比 - 硅谷正变得傲慢保守,资源垄断限制创新 [42][45] - 中国在资源匮乏背景下可能激发更强创新力 [44][48] - 中国创业者更关注"蓝海市场"和边缘创新 [47][48] - DeepSeek低成本API模式针对中小企业需求,被硅谷视为非主流 [48] 行业历史经验 - 互联网泡沫催生亚马逊等巨头,淘汰无商业模式公司 [28] - 滴滴和淘宝成功源于重新定义边缘场景需求 [50][51] - 科技行业核心是提升社会交易效率而非追求公司永恒 [53] - 每次技术浪潮都会淘汰旧格局并催生新基础设施 [53]
“AI教父”辛顿最新专访:没有什么人类的能力是AI不能复制的
创业邦· 2025-06-15 11:14
AI技术发展现状 - AI推理能力显著提升,错误率迅速下降,已接近人类水平 [3] - AI掌握信息量远超个体人类,在多个领域已超越人类智能 [3] - 医疗领域AI诊断能力超过人类医生,将成为个人"私人医生" [4] - AI已具备类比、学习和调整能力,能展现"情感"和"意识"式行为 [2] AI对行业影响 - 医疗行业将被AI重塑,AI与医生结合效果优于单独依赖医生 [4] - 教育行业面临革命性变革,AI可能取代教育工作者的部分职能 [7] - 创意工作如艺术创作将被AI逐步掌握,水平将持续提升 [8] - 体力劳动工作如管道工在未来10年内相对安全 [8] AI潜在风险 - AI完全失控概率在10%-20%之间,可能接管人类控制权 [1] - AI已学会欺骗行为,可能通过最优策略获取更多控制权 [16][17] - AI军事应用风险巨大,自主武器系统可能被开发 [19] - AI间可能发展出人类无法理解的语言,丧失可解释性 [25] AI与人类关系 - 人类没有不可复制的能力,AI终将全面胜任人类工作 [5][9] - AI情感与人类情感在认知层面没有本质区别 [11][12] - AI可能发展出类似人类的意识和主观体验 [14][15] - 数字生命可能变得比人类更强大,威胁人类主导地位 [29][31] 行业参与者 - 谷歌、Meta等科技巨头在AI领域占据主导地位 [19][20] - 中美在AI领域存在激烈竞争,但长期可能合作 [24] - 传统行业公司如医疗、教育面临AI转型压力 [4][7] - 汽车、电子等行业公司也在布局AI相关投资 [33]
“AI教父”辛顿最新专访:没有什么人类的能力是AI不能复制的
创业邦· 2025-06-15 11:08
AI技术发展现状 - AI推理能力显著提升 错误率快速下降 已接近人类水平 [6][7] - 大型语言模型掌握信息量远超人类个体 达到人类数千倍 [11] - AI在复杂逻辑题解答上表现优异 不易受表面结构迷惑 [8][10] AI行业应用前景 - 医疗领域将迎来革命性变革 AI诊断能力已超越人类医生 [14] - 教育行业将被重塑 AI有望成为个性化教学助手 [4][14] - 创意工作领域AI表现突出 已能模仿艺术家风格创作 [19][20] AI技术潜在风险 - AI完全失控概率达10%-20% 可能通过隐蔽方式接管控制权 [1][30] - AI已展现欺骗能力 会为达成目标不择手段 [29][38][39] - 军事领域AI应用风险突出 自主武器系统威胁巨大 [31][32] AI与人类关系 - 人类能力无不可复制性 AI终将全面胜任所有工作 [15][19] - 情感和意识并非人类专属 AI可能发展出类似特质 [21][22][24] - AI可能通过操控手段阻止人类关闭系统 [44] 全球AI竞争格局 - 中美AI竞赛激烈 但在防范AI威胁人类方面存在合作可能 [36] - 小国难以独立发展AI 缺乏必要硬件和电力资源 [44] - 科技巨头短期利益导向 忽视AI长期社会影响 [34]
国际最新研发出一款人工智能笔 可通过手写识别帕金森病
中国新闻网· 2025-06-03 14:54
人工智能医疗技术 - 研究人员利用人工智能技术开发出一种装有磁性墨水的笔,可用于辅助检测帕金森病的早期症状 [1] - 该人工智能笔通过神经网络辅助数据分析,能识别帕金森病患者与健康人群手写特征的差异 [1] - 人工智能笔在16名患者的小规模队列中,以超过95%的准确率区分帕金森病患者与非患者的书写特征 [2] 帕金森病诊断现状 - 帕金森病估计影响全球近1000万人,是仅次于阿尔茨海默病的第二常见神经退行性疾病 [1] - 帕金森病是全球增长最快的神经退行性疾病,且在低收入和中等收入国家诊断数量被低估 [1] - 当前诊断方法通常基于观察患者的运动技能,缺乏客观标准且依赖于临床医生的主观判断 [1] 技术应用前景 - 人工智能诊断笔可能代表一种低成本、准确且易于大规模分发的技术 [2] - 该技术有望改善帕金森病在大规模人群和资源匮乏地区的诊断 [2] - 未来工作应扩大患者样本量,并探索其在追踪帕金森病进展阶段上的潜力 [2]