Workflow
深度学习
icon
搜索文档
工业界大佬带队!三个月搞定3DGS理论与实战
自动驾驶之心· 2025-12-10 03:00
3DGS技术发展与应用 - 新视角合成的核心目标是通过图像或视频构建可被计算机处理的3D模型,催生了3D建模、虚拟现实、自动驾驶闭环仿真等大量应用 [2] - 早期算法如SfM、MVS受限颇多,2020年NeRF打破僵局但仍面临计算效率和可编辑性差的问题,2023年3DGS一经问世便迅速火爆 [2] - 3DGS技术迭代速度远超想象,已发展出静态重建3DGS、动态重建4DGS、表面重建2DGS,并进一步催生了feed-forward 3DGS以解决per-scene optimization方法不便使用的问题 [4] - 目前3DGS在学术界和工业界都很受欢迎,但入门需要吃透点云处理、深度学习等理论,并掌握实时渲染、代码实战 [4] 课程核心内容与结构 - 课程包含2DGS/3DGS/4DGS的细致讲解,并扩展当下3DGS重要的几个研究课题,最后讲解feed-forward 3DGS,旨在全面吃透3DGS技术栈 [6] - 课程大纲共六章,从背景知识、原理算法到自动驾驶应用、研究方向及前沿feed-forward方法,最后安排答疑讨论 [8][10][11][12][13][14][15] - 课程进度安排为离线视频教学,自12月1日开课,预计两个半月结课,分章节逐步解锁并配合VIP群内答疑及三次线上答疑 [17] 课程具体章节要点 - **第一章:3DGS背景知识**:从计算机图形学基础讲起,涵盖三维空间的隐式/显式表达、渲染管线、光线追踪、辐射场渲染等技术概念及其与3DGS的联系,并介绍COLMAP、Gsplat等开发工具,设计基于3D Real Car训练模型的小作业 [10] - **第二章:3DGS原理和算法**:详细梳理3DGS原理及核心伪代码,讲解动态重建、表面重建、鱼眼重建和光线追踪的经典与最新算法,实战选用英伟达开源的3DGRUT框架 [11] - **第三章:自动驾驶3DGS**:聚焦自动驾驶仿真重建,讲解浙大Street Gaussian、上交OmniRe和浙大Hierarchy UGP三篇工作,实战选用学术界和工业界使用最多的DriveStudio [12] - **第四章:3DGS重要研究方向**:聚焦COLMAP扩展、深度估计及Relighting等研究方向,并分享这些方向如何服务工业界及学术探索的未来走势 [13] - **第五章:Feed-Forward 3DGS**:梳理feed-forward 3DGS的发展历程和算法原理,讲解最新的AnySplat和WorldSplat算法工作 [14] - **第六章:答疑讨论**:通过线上交流形式,组织讨论3DGS岗位需求、行业痛点及开放性问题 [15] 课程面向人群与收获 - 面向人群需自备GPU(推荐算力在4090及以上),并具备一定的计算机图形学基础、视觉重建/NeRF/3DGS技术了解、概率论与线性代数基础、Python和PyTorch语言基础 [19] - 学后收获包括掌握3DGS完善的理论知识及相关技术栈、掌握3DGS算法开发框架并能训练开源模型、与学术界及工业界同行持续交流,对实习、校招、社招均能受益 [19]
黄仁勋最新采访:依然害怕倒闭,非常焦虑
半导体芯闻· 2025-12-08 18:44
人工智能竞赛与国家安全 - 全球一直处于技术竞赛中,从工业革命、二战、曼哈顿计划到冷战,而当前的人工智能竞赛可能是最重要的一场,因为科技领导力能带来信息、能源和军事上的超能力 [12] - 确保关键技术在美国本土研发和制造关系到国家安全,重振美国制造业和工业能力对于投资、就业和解决国内问题至关重要 [7][8] - 前总统特朗普的促进增长的能源政策(如“钻井,宝贝,钻井”)被认为是拯救人工智能产业的关键,没有能源增长就无法建造人工智能工厂、芯片工厂和超级计算机工厂 [8] 人工智能发展现状与未来 - 人工智能能力在过去两年里可能增长了100倍,相当于两年前的汽车速度慢了100倍,计算能力的巨大提升被用于使技术更安全、更可靠 [14] - 人工智能性能未来一千倍的提升,其中很大一部分将用于更多的反思、研究和更深层次的思考,以确保答案的准确性和基于事实,类似于汽车技术将更多动力用于ABS和牵引力控制等安全功能 [14][16] - 预计未来两三年内,世界上90%的知识可能都将由人工智能产生,这与从人类编写的材料中学习区别不大,但仍需核实事实和基于基本原理 [41] 人工智能的风险、安全与控制 - 人工智能的风险被类比为左轮手枪里有10发子弹取出8发,仍存在不确定性,但人工智能的发展将是渐进的,而非一蹴而就 [13] - 人工智能的军事应用是必要的,需要让科技公司投身国防技术研发更容易被社会接受,拥有过剩的军事力量是避免战争的最好办法之一 [19][20] - 人工智能不会突然获得意识并统治人类,因为人类也在同步使用和进步,人工智能的威胁更类似于网络安全问题,可以通过协作防御来应对 [28][30] 人工智能对就业与经济的影响 - 以放射科医生为例,人工智能并未导致该职业消失,反而因为能更高效处理影像(如3D/4D形式),使医院能服务更多患者,从而增加了放射科医生的雇佣数量,工作的核心意义(如诊断疾病)并未改变 [46][47] - 自动化会取代部分任务型工作,但会催生全新的行业和岗位,例如机器人技术将带来机器人制造、维修、服装等以前不存在的完整产业链 [50] - 关于全民基本收入与普遍富裕的讨论存在悖论,未来可能处于两者之间,富有的定义可能从拥有金钱转变为拥有丰富的资源(如信息),而目前稀缺的资源未来可能因自动化而贬值 [51][52] 技术普及与能源挑战 - 人工智能有望大幅缩小技术鸿沟,因为它是世界上最易用的应用(如ChatGPT),用户可通过自然语言交互,无需学习编程语言,且未来手机将能完全自主运行强大的人工智能 [55][56] - 能源是当前人工智能发展的主要瓶颈,未来五到十年,许多公司可能会建造自有的大约几百兆瓦的小型核反应堆来为人工智能工厂供电,这也能减轻电网负担 [57][59][60] - 加速计算是驱动人工智能革命的关键,英伟达发明的这种全新计算方式在过去十年里将计算性能提高了10万倍,遵循“英伟达定律”,使得计算所需的能耗大幅降低,未来人工智能将因能耗极低而无处不在 [58][62] 英伟达的发展历程与技术创新 - 公司成立于1993年,最初旨在创造一种全新的计算架构,早期通过与世嘉等游戏公司合作,将用于飞行模拟器的3D图形技术应用于街机,从而进入了3D图形游戏领域 [79][80][81] - 2012年,多伦多大学Geoffrey Hinton实验室的研究人员利用两张NVIDIA GPU(GTX 580 SLI)训练出AlexNet模型,在计算机视觉上取得突破性飞跃,这被视为现代人工智能的“大爆炸”起点 [63][64][71][72] - 公司发明的CUDA平台和加速计算方式,利用并行处理能力,使得GPU成为可放在个人电脑中的超级计算机,这最初为计算机图形学和游戏开发,后来成为深度学习革命的基石 [64][66] - 2016年,公司将第一台价值30万美元、运算能力为1 petaflops的DGX-1超级计算机赠予Elon Musk,用于其非营利人工智能研究(即OpenAI),九年后,同等算力的DGX Spark体积大幅缩小,价格降至4000美元 [74][75][76]
算力十年狂飙100000倍,他却每天担心破产!黄仁勋亲述:如何用“30天危机感”逆袭万亿AI市场
AI前线· 2025-12-08 15:18
英伟达最新技术发布:CUDA Toolkit 13.1 - 公司正式推出CUDA Toolkit 13.1,官方称这是自2006年推出CUDA平台以来“20年来最大、最全面的一次更新” [2] - 新版本的核心亮点是引入了全新的CUDA Tile编程模型,该模型允许开发者以数据块(tile)为单位编写算法,在比传统SIMT更高抽象层上构建GPU程序,底层细节由编译器与运行时管理 [4][7] - 新版本带来了多项重大变革,包括:1) 暴露绿色上下文(Green Context)的Runtime API,实现更灵活的GPU资源管理;2) 在数学库cuBLAS中增强了对双精度与单精度的仿真支持;3) 全面重写了编程指南并更新了工具链与库,显著提升平台稳定性与易用性 [7] 公司创始人的危机感与驱动力 - 创始人黄仁勋坦承,支撑其一路走下来的驱动力并非野心,而是长期笼罩的危机感,他每天醒来都感觉公司可能“距离破产,还剩30天”,这种紧迫感持续了三十多年 [6][8][82] - 这种持续的“不想失败”的紧绷感与危机感,被认为是公司得以不断突破的重要原因 [9][84] - 创始人回顾了公司最惊险的创业阶段,包括早期战略错误、濒临破产的现金流,以及押上公司未来的技术重构与一次性量产的豪赌 [1][8] 公司早期发展史与关键转折点 - 公司创立于1993年,最初目标是创造一种能解决传统计算机无法解决问题的新型计算架构,但当时相应的“杀手应用”并不存在,使命本身极具挑战 [66] - 早期通过说服日本世嘉公司,将街机3D游戏移植到PC以开启PC 3D游戏时代,并为其开发游戏主机芯片,以此获得启动资金 [67][68][69] - 公司第一代图形技术(NV1)在三个关键技术方向(曲面 vs 三角形、正向贴图 vs 逆向贴图、无Z-buffer)上全部选错,导致公司在竞争中处于劣势 [69][70] - 在资金即将耗尽、技术路线错误且与世嘉的合同可能无法交付的存亡之际,创始人前往日本,以极大的坦诚说服世嘉CEO将合同尾款500万美元改为对公司的投资,这笔投资拯救了公司 [72] - 公司上市后全面收缩战线,关闭错误方向,三位架构师基于从Silicon Graphics教科书学来的理念,重新发明3D图形技术,将百万美元工作站性能压缩进PC显卡,为电子游戏时代奠定技术基座 [8][73][74] - 在研发RIVA 128时,公司现金流极度紧张,为了一次成功,用仅剩的约50万美元现金购买了已倒闭公司的模拟器,以便在芯片流片前完成所有软件调试 [78] - 随后,公司说服当时规模仍小的台积电,在没有试产的情况下直接风险量产新品,一次失败就会让公司消失,最终成功并使其成为当时增长最快的科技公司之一 [8][79] 对人工智能(AI)发展的观点 - 认为过去两年里,AI技术的能力提升了100倍 [16] - 指出AI的发展将是渐进的,而非瞬间到达某个“事件视界” [13][15] - 认为最佳情景是AI融入我们所做的一切,让一切更高效,但同时网络安全等挑战将持续存在 [20] - 预测未来两三年后,世界上90%的知识很可能由AI生成 [35] - 相信未来5-10年有三大趋势:1) AI会大幅缩小技术鸿沟,因其是“最容易使用的技术”,例如ChatGPT几乎一夜之间就有十亿用户;2) 每个国家都将拥有优秀的AI,即便是“过去版本的AI”也依然惊人;3) AI的能耗会大幅下降,让更多国家享受红利 [50][51] - 强调加速计算使AI性能与能效大幅提升,过去十年将计算性能提升了100,000倍,使同样任务所需的能源减少了100,000倍,未来能耗将继续下降 [52] AI对就业与社会的影响 - 以放射科为例,指出AI并未取代放射科医生,反而因其能更高效处理影像而让医院雇佣了更多放射科医生,关键在于区分工作的“目的”(诊断疾病)与“任务”(阅读影像) [41][42] - 认为AI不会直接导致普遍失业,人的工作目的通常不变,变的是完成任务的方式,AI将取代部分以执行为核心的任务,但同时会创造大量前所未有的新工作 [44][45][46] - 提出工作的价值在于必须有“超越任务”的意义,人们需要寻找工作中更有意义的部分 [47] - 对“全民基本收入(UBI)”的看法是,“资源极大丰富”与“人人需要补贴”这两种极端情况不会同时发生,未来富裕更可能意味着“资源极大丰富” [48][49] 对AI安全与意识的看法 - 认为当前AI的力量大部分被导向了安全性,例如减少幻觉、提高答案的真实性,类似于汽车中ABS等技术让驾驶更安全 [16][17] - 在网络安全方面,指出存在一个由专家构成的共同体,进行协作、分享最佳实践,共同应对威胁,这种合作已持续约15年 [20][22] - 不相信AI会获得“意识”或“感知力”,认为意识是对自我存在的认知和情感体验的集合,而AI是由知识和智能定义的 [27][28] - 认为即便AI能完美模仿人类,也只是“模仿的版本”,而非真正的意识 [33] - 对于AI可能带来的威胁,认为防御性AI会保护人类,其逻辑类似于网络安全,即用AI来应对AI [26] GPU、深度学习与公司市场地位的奠定 - 公司从成立之初就研究并行计算,GPU本质上是图像生成超级计算机,为全球消费者提供了最大规模的超级计算平台 [58] - 2012年,Geoff Hinton实验室的AlexNet在图像识别上取得突破,其使用的硬件是两块英伟达GPU,这被视为现代AI的“大爆炸时刻” [57][59] - 公司意识到深度学习是一个“通用函数逼近器”,只要存在输入和输出,AI就能学会,其强大的前提是模型能扩大规模并能进行无监督学习 [60] - 2016年,公司研发了第一台DGX-1超级计算机,使用8个GPU,售价30万美元,研发成本达几十亿美元,最初无人问津,直到埃隆·马斯克为其初创的非营利机构OpenAI购买 [61][62][63] - 技术快速迭代,9年后,提供相同1 PetaFLOPS算力的DGX Spark体积大幅缩小,价格从30万美元降至约4000美元 [65][66]
黄仁勋最新采访:依然害怕倒闭,非常焦虑
半导体行业观察· 2025-12-06 11:06
人工智能技术发展与竞赛 - 人工智能技术在过去两年内能力提升了约100倍 [13] - 人工智能性能未来有提升一千倍的潜力 [15] - 技术竞赛自工业革命以来一直存在 当前的人工智能竞赛是最重要的一场 [10][11] - 科技领导力至关重要 赋予信息、能源和军事超能力 [11] 人工智能应用与安全 - 大量计算能力被用于提升人工智能的安全性、可靠性和真实性 例如通过反思和研究来减少幻觉 [13][14] - 人工智能能力提升很大一部分将用于更深入的思考、周密的计划和更多的选择 [15] - 网络安全防御依赖于整个行业社群的协同合作 共享漏洞信息和补丁程序已持续约15年 [20] - 人工智能技术正被应用于国防领域 认为拥有过剩的军事力量是避免战争的最好办法之一 [16][17] 人工智能对经济与就业的影响 - 以放射科医生为例 人工智能并未导致该职业消失 反而因为提升了诊断效率和医院经济状况而增加了岗位数量 [41][42] - 工作的核心意义可能不会因自动化而改变 例如律师的职责是帮助他人 而研究文件只是部分工作 [42][43] - 人工智能可能催生全新的行业和就业岗位 例如机器人制造、维修、服装设计等 [44] - 自动驾驶技术可能不会导致所有司机失业 部分司机会转型 技术的应用会创造新的工作类型 [42][44] 人工智能普及与能源瓶颈 - 人工智能是世界上最容易使用的应用 例如ChatGPT用户数量在短时间内增长到近十亿 这有助于缩小技术鸿沟 [47] - 未来几年内 手机将能够完全自主运行人工智能 使每个国家和社会都能受益 [48] - 能源是目前人工智能发展的主要瓶颈 [48][50] - 加速计算技术在过去十年将计算性能提高了10万倍 遵循“英伟达定律” [49][51] - 随着性能提升和能耗降低 未来人工智能所需的能源将微乎其微 从而无处不在 [50] 英伟达公司发展历程与技术 - 公司成立于1993年 旨在创造一种全新的计算架构 [64] - 早期与日本世嘉合作 涉足3D图形游戏领域 游戏产业成为关键驱动力 [64][65] - 公司的GPU最初为处理电脑游戏图形而设计 采用并行处理方式 成为面向消费者的超级计算机 [52][53] - 2012年 AlexNet在计算机视觉领域取得突破 该模型使用了两张NVIDIA显卡进行训练 [51][52] - 深度学习是一种通用函数逼近器 只要有输入和输出示例 就能推导出内部函数结构 可应用于几乎任何领域 [54][55] - 2016年 公司将第一台DGX-1超级计算机(售价30万美元)赠予埃隆·马斯克 用于其非营利人工智能研究(即OpenAI) [60][61] - 从DGX-1到DGX Spark 在保持1 petaflops计算能力的同时 价格从30万美元降至4000美元 体积也大幅缩小 [62]
对话任少卿:2025 NeurIPS 时间检验奖背后,我的学术与产业观
雷峰网· 2025-12-05 18:24
文章核心观点 文章通过报道任少卿及其团队获得NeurIPS时间检验奖,回顾了其奠基性工作Faster R-CNN的深远影响,并深入探讨了任少卿加入蔚来后,在自动驾驶全栈自研、芯片定义、数据闭环体系构建以及技术路线(如世界模型)探索等方面的实践与思考,展现了蔚来在智能驾驶领域从零开始构建核心能力的过程与战略布局 [1][2][11][13][27] 根据相关目录分别进行总结 Faster R-CNN的成就与影响 - 任少卿、何恺明、孙剑与Ross Girshick共同发表的Faster R-CNN荣获2025年NeurIPS时间检验奖,该奖项表彰经过十年检验、对学科发展产生深远影响的奠基性工作 [1] - Faster R-CNN发表于2015年,将物体检测效率提升10倍以上,开创了端到端实时精准目标检测模式,其论文已被引用超9.8万次,是AI检测领域全球最高被引论文 [2] - 该模型的核心思想已深度融入人工智能基础技术,成为驱动自动驾驶、医疗影像、安防监控、工业检测、卫星遥感等关键领域的核心技术 [2] 研究理念与团队合作 - 孙剑坚持“simple but work”的研究理念,认为做核心工作需要远见、品位和坚持 [4][6] - 任少卿与何恺明的合作紧密且高效,日常节奏包括多次集中讨论与实验推进,何恺明几乎投入100%的精力,专注于研究问题、寻找方向与突破 [6][7][8] - 团队选择深度学习方向基于几个关键判断:方法有创新性、已有初步结果和进展、结果具备泛化能力而非技巧性(trick),验证了方向的可扩展性 [10] 加入蔚来与全栈自研启动 - 任少卿于2020年8月加入蔚来,首要任务是搭建团队并启动全栈自研L2产品,支持L3和L4,同时进行芯片选型 [13] - 蔚来第二代车是全球首个量产英伟达Orin芯片(使用4颗芯片)及高线束激光雷达的车型,于2022年3月在中国量产,半年后在欧洲量产 [14] - 团队在极短时间内(从拿到芯片到量产仅6-7个月)克服了Orin芯片作为新硬件在算力(比上一代增大8倍多)、架构、散热、功耗及工具链等方面的挑战,完成了复杂的自动驾驶域控制器(ADC)架构量产 [14][15] 自研芯片的定义与考量 - 作为需求方,团队参与了自研芯片的定义,基于对技术发展的判断,早在2021年就预见到Transformer将更广泛应用,这对芯片内存带宽提出了更高要求 [16] - 蔚来自研芯片具备行业最高的带宽,以支持Transformer等模型,并为支持更高级别自动驾驶(L3/L4)预埋了热备能力,可在百毫秒内实现芯片切换且用户无感 [17] 数据闭环与高效迭代体系 - 蔚来自2020年起重点建设数据能力,认为数据的价值在于针对特定模型筛选出的“corner case”,而非简单的数据拷贝,数据筛选过程消耗大量算力 [19][20] - 公司构建了灵活调度云端和车端算力的系统,并在此基础上建立了类似互联网行业的“AB test”系统,允许在量产车上并行测试下一代算法 [21] - 通过“AB test”系统,蔚来将主动安全功能的迭代效率大幅提升,即使面对高达200万公里一次误报(FP)的严格标准,也能实现三天迭代一次的速度 [22] - 针对超80万辆量产车的智驾接管数据,建立了自动化分析系统,能过滤掉99%以上的无效信息,仅返回0.1%-0.5%的有效数据供进一步分析,极大提升研发效率 [22] 对端到端与世界模型的技术思考 - Faster R-CNN本质是解决了物体检测任务的端到端问题,将检测速度提升至实时(10Hz、20Hz、30Hz),为视频处理和应用落地带来突破 [11] - 任少卿认为,端到端是自动驾驶技术演进的一个阶段,但并未解决所有问题,例如语言模型无法解决真实世界所需的时空认知问题 [24][25][26] - 世界模型旨在建立时空认知能力,学习物理规律和时空理解,以解决长时序决策问题,这是语言模型无法做到的 [26][27] - 蔚来于2023年决定All in世界模型,并于2024年7月首次公开发布,成为行业内率先拥抱此路线的公司之一,世界模型能支持长达10秒、1分钟甚至更长的时序推演,替代传统的规则代码(if else)处理长时序场景 [27][28][29][30]
全球引才:Faster R-CNN、ResNet作者,中国科大任少卿,招募教授、学者和学生
机器之心· 2025-12-05 18:17
中国科学技术大学通用人工智能研究所(筹)及负责人介绍 - 中国科学技术大学通用人工智能研究所(筹)聚焦人工智能、世界模型、具身智能、AI for Science、自动驾驶等前沿方向,致力于开展引领性、原创性、颠覆性、前瞻性科学研究工作,并构建学科建设、科研突破、人才培养、产业应用、国际合作的一体化创新体系 [7] - 研究所负责人任少卿教授是中国科学技术大学讲席教授、博士生导师,于2025年9月加入该校担任二级教授,其在深度学习、计算机视觉及智能驾驶等领域做出了基础性、开创性贡献,研究成果已成为驱动自动驾驶、工业检测、医疗影像、安防监控、卫星遥感等关键领域的核心引擎 [4][5] 负责人学术成就与行业影响 - 截至2025年11月,任少卿教授的学术论文被引用超过46万次,位列全学科领域国内学者第一,并在AI 2000全球人工智能学者总榜排名第三 [5] - 其研究成果获得了多项国际顶尖荣誉,包括2023未来科学大奖—数学与计算机科学奖、2025 NeurIPS时间检验奖、2025 Helmholtz Prize(ICCV十年影响力奖)、2016 CVPR最佳论文奖,以及ImageNet竞赛与MSCOCO竞赛全球冠军 [5] - 其荣获NeurIPS 2025时间检验奖的论文《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》是计算机视觉领域的里程碑之作,自2015年发表以来已被引用超过98,000次,该研究首次用完全可学习的两阶段pipeline取代了传统方法,实现了高精度与接近实时(5 FPS)检测的统一,奠定了现代目标检测框架的核心范式,并深刻影响了后续十年视觉模型的发展方向 [6] 人才招募计划 - 研究所面向全球进行人才招募,名额充足且长期有效 [8] - 招募岗位涵盖教授、研究员、副教授、博后、工程师、博士生、硕士生、本科实习生等多个层次 [9] - 研究所提供顶配资源与顶格待遇,诚邀海内外优秀本科、硕士、博士研究生及博士后青年人才积极申请,并全力支持优秀青年学者申请海外优青、杰青等国家高层次人才项目 [10] - 工作地点可选上海或合肥 [11]
黄仁勋万字访谈:33年来每天都觉得公司要倒闭,AI竞赛无“终点线”,技术迭代才是关键
华尔街见闻· 2025-12-05 17:39
公司文化与战略 - 公司创始人及CEO黄仁勋保持着强烈的危机感,其经营哲学是公司“距离倒闭还有30天”,并将此心态持续了33年,认为对失败的恐惧是比贪婪更强的驱动力 [1][5] - 公司历史上多次濒临破产,包括1995年的技术路线错误,依靠世嘉500万美元投资和台积电的信任才得以生存,这些经历塑造了其对风险和战略的独特理解 [3] - 公司坚持长期主义与持续迭代,例如2005年推出CUDA时股价暴跌80%,但坚持投入最终成为AI革命的基础设施,认为真正的竞争力在于持续迭代能力,而非一次性突破 [2] - 公司在技术决策上敢于豪赌,例如在芯片流片环节采用直接投产的策略,尽管此前无人成功 [5] AI行业发展与竞争格局 - AI技术竞赛是持续且渐进的,不存在明确的“终点线”或一方突然获得压倒性优势的局面,所有参与者都将站在AI的肩膀上共同进化 [2] - 技术进步的大部分算力被用于提升AI的安全性与可靠性,例如让AI更谨慎地思考、检验答案,而非用于危险用途,过去10年AI算力提升了10万倍 [2] - 能源增长是AI及芯片制造业发展的关键瓶颈,公司认为如果没有促进经济增长的能源政策,就无法建设AI工厂、芯片工厂和超级计算机工厂 [5][20] - 摩尔定律及其迭代意味着计算任务所需能量持续减少,这是技术普及的基础,而公司发明的加速计算在过去10年将计算性能提高了10万倍 [110][111] AI技术对社会与就业的影响 - 判断AI是否会取代某项工作的关键在于区分“任务”和“目的”,AI会消灭那些把手段当成目的的工作,而作为实现更高目的手段的工作则会升级 [3] - 以放射科医生为例,AI虽然横扫了放射学领域,但放射科医生的数量反而增加,因为其核心目的是诊断疾病,而看影像只是辅助任务 [3][4][92][93] - AI有望缩小技术鸿沟,因为它是世界上最容易使用的应用程序,例如ChatGPT用户数量几乎一夜之间增长到近十亿,且能用任何语言交互 [105][106] - 未来世界上越来越多的知识将由AI产生,可能两三年后,世界上90%的知识都由AI合成,但这与学习人类编写的知识在本质上区别不大 [81][83] 英伟达的技术与业务里程碑 - 公司发明的CUDA并行计算架构和加速计算方式是AI革命的基础,其GPU最初用于计算机图形学和游戏,后来成为深度学习的关键硬件 [122][111] - 2012年,多伦多大学实验室利用英伟达的两块GTX 580显卡(SLI配置)训练AlexNet模型,取得了计算机视觉领域的突破性进展,这被视为现代AI的“大爆炸”时刻 [120][121][129][131] - 2016年,公司制造了第一台DGX1超级计算机,成本达数十亿美元,售价30万美元,最初仅OpenAI(当时为非营利机构)的埃隆·马斯克成为其第一个客户 [135][136][137] - 公司的技术演进迅速,2016年的DGX1运算能力为1 petaflop,而九年后同等运算能力的DGX Spark设备尺寸已大幅缩小 [138][139] AI安全与伦理观点 - AI的发展是渐进的,威胁并非凭空出现,其安全性可类比网络安全,防御技术与攻击技术协同进化,且整个社区在协同合作共享信息 [46][50][56] - AI获得意识的可能性极低,关键在于意识的定义涉及自我存在认知和“体验”,而当前AI的定义是拥有知识、智能及执行任务的能力,而非人工意识 [68][70][79] - 军事领域应用AI进行国防是必要且值得肯定的,避免冲突的最佳方法是拥有过剩的军事力量,这能促使各方坐下来谈判 [37][43][44] - 量子计算机可能使现有加密过时,但行业正在致力于后量子加密技术,历史表明防御手段总会随之发展 [53][55]
黄仁勋万字深度访谈:AI竞赛无“终点线”,技术迭代才是关键,33年来每天都觉得公司要倒闭
美股IPO· 2025-12-05 07:43
AI竞赛与技术进步的本质 - AI竞赛没有明确的终点线,技术进步是渐进式的,所有参与者将共同进化[2] - 真正的竞争力在于持续迭代能力,而非一次性突破[2] - 过去10年AI算力提升了10万倍,这些算力主要用于让AI更谨慎地思考、检验答案,而非用于危险的事情[1][2] - 迭代是基于第一性原理的持续修正,而非简单重复[2] 英伟达的创业历程与战略转折 - 1995年因技术路线选择错误而濒临破产,依靠世嘉500万美元的投资才得以生存[1][4] - 在开发Riva 128芯片时,公司资金即将耗尽,通过购买已倒闭公司的仿真器来测试设计,并说服台积电创始人张忠谋在不预先测试的情况下直接投产,最终获得成功[90][91][92] - 早期战略错误导致公司处于竞争劣势,通过解雇大部分员工、缩小规模,并让工程师从Silicon Graphics的教科书学习,以第一性原理重新发明了现代3D图形技术[79][82][83] - 公司将业务焦点从通用3D图形芯片缩小到专为视频游戏优化的芯片,并将技术业务转变为平台业务,从而创造了现代3D游戏市场[84][85][86] - 2005年推出CUDA时股价暴跌80%,但长期坚持投入最终奠定了今天AI革命的基础设施[2] AI对工作的影响与转型 - 判断AI是否会取代某项工作的关键,在于区分“任务”和“目的”[4] - 以放射科医生为例,AI横扫放射学领域后,医生数量反而增加,因为看影像只是“任务”,诊断疾病才是“目的”[4][5][50] - 如果工作内容本身就是任务(如切菜、数据录入),则可能被取代;如果任务只是实现更高目的的手段,工作将会升级[4][52] - AI将消灭那些把手段当成目的的工作,迫使每个人思考自己工作的真正目的[4] - AI的普及可能催生全新的行业,例如机器人制造、维护和个性化服装产业[52][54] AI的安全性、意识与未来发展 - AI不会凭空产生意识,其本质是模仿和学习人类生成的知识与模式,而非拥有经验或情感[4][33][39][42] - 过去两年AI能力提升了约100倍,而额外的计算能力被引导用于让AI进行更多反思、研究和事实核查,从而减少“幻觉”(编造事实),产生更安全、更真实的答案[17][18] - 网络安全领域为AI安全提供了模型,防御社区通过共享信息、最佳实践和补丁进行合作,AI防御技术也将以类似方式演进[21][24] - 对AI军事应用持支持态度,认为强大的防御力量是避免战争的必要条件之一[20] - 未来世界上90%的知识可能将由AI生成,但人类仍需核实事实并基于第一原理进行判断[43][44] 技术普及、能源与计算演进 - AI是世界上最容易使用的应用,有望缩小技术鸿沟,用户只需使用人类语言即可交互[57] - 摩尔定律的每一次迭代都意味着完成计算任务所需的能量减少,这是技术普及的基础[6][58] - 过去十年,通过加速计算将计算性能提高了10万倍,预计十年后对大多数人而言,运行AI所需的能源将微乎其微[6][59] - 能源增长是AI、芯片和超级计算机工厂建设的先决条件,未来可能看到许多公司自建数百兆瓦级别的小型核反应堆[6][11][61][62] 领导力与公司经营哲学 - 公司CEO保持了持续33年的危机感,每天醒来都觉得“距离倒闭还有30天”,这种对失败的恐惧是比追求成功更大的驱动力[1][6][97] - 成功源于艰难的工作、漫长的痛苦、孤独、不确定和恐惧,这部分常被外界忽略[6] - 领导者展现脆弱性与公司成功并不矛盾,这有助于团队及时纠正错误并调整战略[105] - 在快速变化的行业中,领导者需要像“冲浪”一样应对无法完全预测的技术浪潮,而非试图预测所有变量[106][107] - 公司文化的核心是吸引世界上最优秀的计算机科学家,让他们能够专注于创造下一代技术[113] 行业生态与关键合作 - 2012年,AlexNet的突破性成果是使用两张英伟达显卡训练实现的,这成为了现代AI的“大爆炸”时刻[64][68] - 2016年,公司发布了售价30万美元的DGX-1超级计算机,埃隆·马斯克是第一个客户,并将第一台设备交付给他当时支持的非营利AI公司,即后来的OpenAI[70][71][72] - 从DGX-1(1 petaflops,30万美元)到DGX-Spark(1 petaflops,4000美元),体现了九年内技术性能不变而成本与体积急剧下降的进步[74] - 公司与美国前总统特朗普的交流中,强调了本土制造、能源增长和再工业化对美国关键技术领域的重要性[9][11][12]
区块链溯源检测审核:IACheck确保链上数据与实验室检测报告逻辑匹配度校验
搜狐财经· 2025-12-04 12:05
区块链溯源技术的核心优势与挑战 - 区块链溯源技术通过将产品从原材料到最终消费者的每一环节数据记录在链上,为供应链提供透明、可追溯的数据流动,其核心优势在于透明性、可追溯性和防篡改性 [2][6] - 该技术面临的挑战在于如何确保链上数据与实际的实验室检测结果在准确性和逻辑上保持一致,区块链本身只能保证数据不可篡改,但无法保证数据源头和内容的准确性 [1][2] IACheck智能审核技术的功能与流程 - IACheck利用深度学习、自然语言处理等技术,提供区块链溯源数据与实验室检测报告之间的一致性核验功能 [1][3] - 其核验流程包括:链上数据与实验室检测报告的逻辑匹配度审核,例如检查区块链记录的质量检测结果是否在实验室报告中有对应体现 [3] - 进行数据一致性与完整性核查,通过比对产品批次、检测日期等参数,确保信息匹配,防止因数据不一致导致合规或质量问题 [4] - 执行标准合规性对照与审查,自动检查数据是否符合GB/T、ISO等行业标准和法规要求 [5] - 支持多平台数据接入与自动化报告生成,并对实时更新的数据进行同步比对与审核反馈 [7] IACheck智能审核技术的应用价值 - 增强数据的透明性和可信度,通过确保溯源信息与检测结果匹配来提升消费者对产品的信任 [8] - 提升合规性与监管效率,帮助企业避免因数据不一致导致的合规问题,并确保产品符合法规要求 [9] - 降低人工审核风险,通过自动化审核提高效率并减少人工审核中的遗漏和错误 [10] - 提供全面的溯源报告和优化建议,帮助企业发现问题并优化供应链及检测流程 [11] 行业应用与未来展望 - 区块链溯源技术被广泛应用于食品、药品、农产品等行业的供应链管理,以进行产品溯源、数据验证和透明度提升 [1] - IACheck作为智能审核工具,致力于推动区块链溯源与检测报告审核的深度融合,以进一步提升供应链管理的效率和透明度 [12]
驭势科技 | 环境感知算法工程师招聘(可直推)
自动驾驶之心· 2025-12-04 11:03
公司招聘信息 - 公司正在招聘环境感知算法工程师,工作地点位于上海长宁,薪资面议 [3] - 该岗位的核心职责是负责无人驾驶的环境感知,包括利用机器视觉和激光雷达等数据进行处理与融合,实现目标跟踪、语义理解和道路拓扑构建等功能,以保障无人驾驶安全 [5] - 岗位要求候选人具备扎实的数学和机器学习基础,拥有基于视觉或激光雷达的检测、分割、识别、跟踪及BEV感知等算法的实战经验 [5] - 岗位要求候选人具备强大的工程能力,精通C/C++和Python,熟悉三维成像原理,并能开发高性能实时软件 [5] 行业技术焦点 - 环境感知能力被视为保证无人驾驶安全最关键和基础的能力,其目标是准确发现和定位道路、行人、车辆、自行车等周围物体 [5] - 行业技术前沿涉及多传感器数据融合、多目标跟踪、环境细粒度语义理解以及道路拓扑构建等复杂感知功能 [5] - 行业对算法工程师的技术要求广泛,包括跟踪前沿技术,并需在计算机结构和高性能实时软件开发方面有深刻认识 [5]