深度学习
搜索文档
全球引才:Faster R-CNN、ResNet作者,中国科大任少卿,招募教授、学者和学生
机器之心· 2025-12-05 18:17
中国科学技术大学通用人工智能研究所(筹)及负责人介绍 - 中国科学技术大学通用人工智能研究所(筹)聚焦人工智能、世界模型、具身智能、AI for Science、自动驾驶等前沿方向,致力于开展引领性、原创性、颠覆性、前瞻性科学研究工作,并构建学科建设、科研突破、人才培养、产业应用、国际合作的一体化创新体系 [7] - 研究所负责人任少卿教授是中国科学技术大学讲席教授、博士生导师,于2025年9月加入该校担任二级教授,其在深度学习、计算机视觉及智能驾驶等领域做出了基础性、开创性贡献,研究成果已成为驱动自动驾驶、工业检测、医疗影像、安防监控、卫星遥感等关键领域的核心引擎 [4][5] 负责人学术成就与行业影响 - 截至2025年11月,任少卿教授的学术论文被引用超过46万次,位列全学科领域国内学者第一,并在AI 2000全球人工智能学者总榜排名第三 [5] - 其研究成果获得了多项国际顶尖荣誉,包括2023未来科学大奖—数学与计算机科学奖、2025 NeurIPS时间检验奖、2025 Helmholtz Prize(ICCV十年影响力奖)、2016 CVPR最佳论文奖,以及ImageNet竞赛与MSCOCO竞赛全球冠军 [5] - 其荣获NeurIPS 2025时间检验奖的论文《Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks》是计算机视觉领域的里程碑之作,自2015年发表以来已被引用超过98,000次,该研究首次用完全可学习的两阶段pipeline取代了传统方法,实现了高精度与接近实时(5 FPS)检测的统一,奠定了现代目标检测框架的核心范式,并深刻影响了后续十年视觉模型的发展方向 [6] 人才招募计划 - 研究所面向全球进行人才招募,名额充足且长期有效 [8] - 招募岗位涵盖教授、研究员、副教授、博后、工程师、博士生、硕士生、本科实习生等多个层次 [9] - 研究所提供顶配资源与顶格待遇,诚邀海内外优秀本科、硕士、博士研究生及博士后青年人才积极申请,并全力支持优秀青年学者申请海外优青、杰青等国家高层次人才项目 [10] - 工作地点可选上海或合肥 [11]
黄仁勋万字访谈:33年来每天都觉得公司要倒闭,AI竞赛无“终点线”,技术迭代才是关键
华尔街见闻· 2025-12-05 17:39
公司文化与战略 - 公司创始人及CEO黄仁勋保持着强烈的危机感,其经营哲学是公司“距离倒闭还有30天”,并将此心态持续了33年,认为对失败的恐惧是比贪婪更强的驱动力 [1][5] - 公司历史上多次濒临破产,包括1995年的技术路线错误,依靠世嘉500万美元投资和台积电的信任才得以生存,这些经历塑造了其对风险和战略的独特理解 [3] - 公司坚持长期主义与持续迭代,例如2005年推出CUDA时股价暴跌80%,但坚持投入最终成为AI革命的基础设施,认为真正的竞争力在于持续迭代能力,而非一次性突破 [2] - 公司在技术决策上敢于豪赌,例如在芯片流片环节采用直接投产的策略,尽管此前无人成功 [5] AI行业发展与竞争格局 - AI技术竞赛是持续且渐进的,不存在明确的“终点线”或一方突然获得压倒性优势的局面,所有参与者都将站在AI的肩膀上共同进化 [2] - 技术进步的大部分算力被用于提升AI的安全性与可靠性,例如让AI更谨慎地思考、检验答案,而非用于危险用途,过去10年AI算力提升了10万倍 [2] - 能源增长是AI及芯片制造业发展的关键瓶颈,公司认为如果没有促进经济增长的能源政策,就无法建设AI工厂、芯片工厂和超级计算机工厂 [5][20] - 摩尔定律及其迭代意味着计算任务所需能量持续减少,这是技术普及的基础,而公司发明的加速计算在过去10年将计算性能提高了10万倍 [110][111] AI技术对社会与就业的影响 - 判断AI是否会取代某项工作的关键在于区分“任务”和“目的”,AI会消灭那些把手段当成目的的工作,而作为实现更高目的手段的工作则会升级 [3] - 以放射科医生为例,AI虽然横扫了放射学领域,但放射科医生的数量反而增加,因为其核心目的是诊断疾病,而看影像只是辅助任务 [3][4][92][93] - AI有望缩小技术鸿沟,因为它是世界上最容易使用的应用程序,例如ChatGPT用户数量几乎一夜之间增长到近十亿,且能用任何语言交互 [105][106] - 未来世界上越来越多的知识将由AI产生,可能两三年后,世界上90%的知识都由AI合成,但这与学习人类编写的知识在本质上区别不大 [81][83] 英伟达的技术与业务里程碑 - 公司发明的CUDA并行计算架构和加速计算方式是AI革命的基础,其GPU最初用于计算机图形学和游戏,后来成为深度学习的关键硬件 [122][111] - 2012年,多伦多大学实验室利用英伟达的两块GTX 580显卡(SLI配置)训练AlexNet模型,取得了计算机视觉领域的突破性进展,这被视为现代AI的“大爆炸”时刻 [120][121][129][131] - 2016年,公司制造了第一台DGX1超级计算机,成本达数十亿美元,售价30万美元,最初仅OpenAI(当时为非营利机构)的埃隆·马斯克成为其第一个客户 [135][136][137] - 公司的技术演进迅速,2016年的DGX1运算能力为1 petaflop,而九年后同等运算能力的DGX Spark设备尺寸已大幅缩小 [138][139] AI安全与伦理观点 - AI的发展是渐进的,威胁并非凭空出现,其安全性可类比网络安全,防御技术与攻击技术协同进化,且整个社区在协同合作共享信息 [46][50][56] - AI获得意识的可能性极低,关键在于意识的定义涉及自我存在认知和“体验”,而当前AI的定义是拥有知识、智能及执行任务的能力,而非人工意识 [68][70][79] - 军事领域应用AI进行国防是必要且值得肯定的,避免冲突的最佳方法是拥有过剩的军事力量,这能促使各方坐下来谈判 [37][43][44] - 量子计算机可能使现有加密过时,但行业正在致力于后量子加密技术,历史表明防御手段总会随之发展 [53][55]
黄仁勋万字深度访谈:AI竞赛无“终点线”,技术迭代才是关键,33年来每天都觉得公司要倒闭
美股IPO· 2025-12-05 07:43
AI竞赛与技术进步的本质 - AI竞赛没有明确的终点线,技术进步是渐进式的,所有参与者将共同进化[2] - 真正的竞争力在于持续迭代能力,而非一次性突破[2] - 过去10年AI算力提升了10万倍,这些算力主要用于让AI更谨慎地思考、检验答案,而非用于危险的事情[1][2] - 迭代是基于第一性原理的持续修正,而非简单重复[2] 英伟达的创业历程与战略转折 - 1995年因技术路线选择错误而濒临破产,依靠世嘉500万美元的投资才得以生存[1][4] - 在开发Riva 128芯片时,公司资金即将耗尽,通过购买已倒闭公司的仿真器来测试设计,并说服台积电创始人张忠谋在不预先测试的情况下直接投产,最终获得成功[90][91][92] - 早期战略错误导致公司处于竞争劣势,通过解雇大部分员工、缩小规模,并让工程师从Silicon Graphics的教科书学习,以第一性原理重新发明了现代3D图形技术[79][82][83] - 公司将业务焦点从通用3D图形芯片缩小到专为视频游戏优化的芯片,并将技术业务转变为平台业务,从而创造了现代3D游戏市场[84][85][86] - 2005年推出CUDA时股价暴跌80%,但长期坚持投入最终奠定了今天AI革命的基础设施[2] AI对工作的影响与转型 - 判断AI是否会取代某项工作的关键,在于区分“任务”和“目的”[4] - 以放射科医生为例,AI横扫放射学领域后,医生数量反而增加,因为看影像只是“任务”,诊断疾病才是“目的”[4][5][50] - 如果工作内容本身就是任务(如切菜、数据录入),则可能被取代;如果任务只是实现更高目的的手段,工作将会升级[4][52] - AI将消灭那些把手段当成目的的工作,迫使每个人思考自己工作的真正目的[4] - AI的普及可能催生全新的行业,例如机器人制造、维护和个性化服装产业[52][54] AI的安全性、意识与未来发展 - AI不会凭空产生意识,其本质是模仿和学习人类生成的知识与模式,而非拥有经验或情感[4][33][39][42] - 过去两年AI能力提升了约100倍,而额外的计算能力被引导用于让AI进行更多反思、研究和事实核查,从而减少“幻觉”(编造事实),产生更安全、更真实的答案[17][18] - 网络安全领域为AI安全提供了模型,防御社区通过共享信息、最佳实践和补丁进行合作,AI防御技术也将以类似方式演进[21][24] - 对AI军事应用持支持态度,认为强大的防御力量是避免战争的必要条件之一[20] - 未来世界上90%的知识可能将由AI生成,但人类仍需核实事实并基于第一原理进行判断[43][44] 技术普及、能源与计算演进 - AI是世界上最容易使用的应用,有望缩小技术鸿沟,用户只需使用人类语言即可交互[57] - 摩尔定律的每一次迭代都意味着完成计算任务所需的能量减少,这是技术普及的基础[6][58] - 过去十年,通过加速计算将计算性能提高了10万倍,预计十年后对大多数人而言,运行AI所需的能源将微乎其微[6][59] - 能源增长是AI、芯片和超级计算机工厂建设的先决条件,未来可能看到许多公司自建数百兆瓦级别的小型核反应堆[6][11][61][62] 领导力与公司经营哲学 - 公司CEO保持了持续33年的危机感,每天醒来都觉得“距离倒闭还有30天”,这种对失败的恐惧是比追求成功更大的驱动力[1][6][97] - 成功源于艰难的工作、漫长的痛苦、孤独、不确定和恐惧,这部分常被外界忽略[6] - 领导者展现脆弱性与公司成功并不矛盾,这有助于团队及时纠正错误并调整战略[105] - 在快速变化的行业中,领导者需要像“冲浪”一样应对无法完全预测的技术浪潮,而非试图预测所有变量[106][107] - 公司文化的核心是吸引世界上最优秀的计算机科学家,让他们能够专注于创造下一代技术[113] 行业生态与关键合作 - 2012年,AlexNet的突破性成果是使用两张英伟达显卡训练实现的,这成为了现代AI的“大爆炸”时刻[64][68] - 2016年,公司发布了售价30万美元的DGX-1超级计算机,埃隆·马斯克是第一个客户,并将第一台设备交付给他当时支持的非营利AI公司,即后来的OpenAI[70][71][72] - 从DGX-1(1 petaflops,30万美元)到DGX-Spark(1 petaflops,4000美元),体现了九年内技术性能不变而成本与体积急剧下降的进步[74] - 公司与美国前总统特朗普的交流中,强调了本土制造、能源增长和再工业化对美国关键技术领域的重要性[9][11][12]
区块链溯源检测审核:IACheck确保链上数据与实验室检测报告逻辑匹配度校验
搜狐财经· 2025-12-04 12:05
区块链溯源技术的核心优势与挑战 - 区块链溯源技术通过将产品从原材料到最终消费者的每一环节数据记录在链上,为供应链提供透明、可追溯的数据流动,其核心优势在于透明性、可追溯性和防篡改性 [2][6] - 该技术面临的挑战在于如何确保链上数据与实际的实验室检测结果在准确性和逻辑上保持一致,区块链本身只能保证数据不可篡改,但无法保证数据源头和内容的准确性 [1][2] IACheck智能审核技术的功能与流程 - IACheck利用深度学习、自然语言处理等技术,提供区块链溯源数据与实验室检测报告之间的一致性核验功能 [1][3] - 其核验流程包括:链上数据与实验室检测报告的逻辑匹配度审核,例如检查区块链记录的质量检测结果是否在实验室报告中有对应体现 [3] - 进行数据一致性与完整性核查,通过比对产品批次、检测日期等参数,确保信息匹配,防止因数据不一致导致合规或质量问题 [4] - 执行标准合规性对照与审查,自动检查数据是否符合GB/T、ISO等行业标准和法规要求 [5] - 支持多平台数据接入与自动化报告生成,并对实时更新的数据进行同步比对与审核反馈 [7] IACheck智能审核技术的应用价值 - 增强数据的透明性和可信度,通过确保溯源信息与检测结果匹配来提升消费者对产品的信任 [8] - 提升合规性与监管效率,帮助企业避免因数据不一致导致的合规问题,并确保产品符合法规要求 [9] - 降低人工审核风险,通过自动化审核提高效率并减少人工审核中的遗漏和错误 [10] - 提供全面的溯源报告和优化建议,帮助企业发现问题并优化供应链及检测流程 [11] 行业应用与未来展望 - 区块链溯源技术被广泛应用于食品、药品、农产品等行业的供应链管理,以进行产品溯源、数据验证和透明度提升 [1] - IACheck作为智能审核工具,致力于推动区块链溯源与检测报告审核的深度融合,以进一步提升供应链管理的效率和透明度 [12]
驭势科技 | 环境感知算法工程师招聘(可直推)
自动驾驶之心· 2025-12-04 11:03
公司招聘信息 - 公司正在招聘环境感知算法工程师,工作地点位于上海长宁,薪资面议 [3] - 该岗位的核心职责是负责无人驾驶的环境感知,包括利用机器视觉和激光雷达等数据进行处理与融合,实现目标跟踪、语义理解和道路拓扑构建等功能,以保障无人驾驶安全 [5] - 岗位要求候选人具备扎实的数学和机器学习基础,拥有基于视觉或激光雷达的检测、分割、识别、跟踪及BEV感知等算法的实战经验 [5] - 岗位要求候选人具备强大的工程能力,精通C/C++和Python,熟悉三维成像原理,并能开发高性能实时软件 [5] 行业技术焦点 - 环境感知能力被视为保证无人驾驶安全最关键和基础的能力,其目标是准确发现和定位道路、行人、车辆、自行车等周围物体 [5] - 行业技术前沿涉及多传感器数据融合、多目标跟踪、环境细粒度语义理解以及道路拓扑构建等复杂感知功能 [5] - 行业对算法工程师的技术要求广泛,包括跟踪前沿技术,并需在计算机结构和高性能实时软件开发方面有深刻认识 [5]
广发证券发展研究中心金融工程实习生招聘
广发金融工程研究· 2025-12-04 10:15
招聘岗位与职责 - 公司招聘金融工程组实习生,工作地点为深圳、上海、北京,要求线下实习 [1] - 实习时间要求每周至少3天,总时长不少于3个月,实习考核优秀者有留用机会 [1] - 岗位职责包括数据处理、分析、统计,协助完成量化投资课题研究 [2] - 岗位职责包括协助进行金融工程策略模型的开发与跟踪 [2] 候选人基本要求 - 专业要求为数学、统计、物理、计算机、信息工程等理工科或金融工程相关专业 [3] - 学历要求为硕士或博士在读,特别优秀的大四保研生亦可,要求非应届(2027年及之后毕业) [3] - 技能要求熟练掌握Python等编程语言,熟悉SQL数据库,具备优秀编程能力与规范 [3] - 能力要求包括责任心强、自我驱动,并具备良好的信息搜集、逻辑思维、分析判断及沟通表达能力 [3] 候选人优先考虑项 - 具备扎实的金融市场基础知识,熟悉股票、债券、期货、指数及基金等核心概念 [4] - 数学基础好,有科研项目经历及SCI或EI收录的学术论文 [4] - 熟悉Wind、Bloomberg、天软等金融终端 [4] - 熟悉机器学习、深度学习,熟悉PyTorch、Linux,有GPU服务器使用及项目开发经验 [4] - 有其他机构量化投研相关实习经历 [4] 申请流程与方式 - 简历投递截止日期为2025年12月31日 [1] - 简历需投递至指定邮箱,邮件标题需按“【金融工程组】-【姓名】-【毕业学校】-【专业】”格式命名 [5] - 简历需以PDF格式发送,未按要求命名的邮件将被视作垃圾邮件处理 [5] - 简历收集截止后,公司将尽快为合格候选人安排笔试和面试 [5]
十年磨一芯,谷歌做对了什么?
财联社· 2025-11-29 12:45
文章核心观点 - 谷歌TPU正从内部专用AI加速器走向外部市场,其生态优势与成本效益对英伟达GPU的霸主地位构成挑战 [3][8][9] 谷歌TPU的发展历程与战略演进 - 2013年谷歌启动TPU项目,源于深度学习算力需求激增,自研ASIC加速器可将深度神经网络推理的总体能效降至原来的十分之一 [5] - 项目进展迅速,仅15个月完成初代TPU设计到数据中心部署,2016年通过AlphaGo击败李世石首次破圈 [6] - 2017年Transformer架构的出现与TPU高度适配,推动TPU从单一AI加速芯片升级为谷歌AI基础设施底座,并免费开放1000台Cloud TPU巩固生态 [7] - 后续引入液冷技术、4096颗芯片超节点及自研环形拓扑网络,提升性能并应用于广告、搜索等核心盈利产品线 [7] - TPU v7支持训练出多模态模型Gemini 3,使谷歌成为AI算力市场重要竞争者 [8] TPU的技术架构与成本优势 - TPU采用极简"脉动阵列"架构,牺牲硬件通用性以最大化深度学习效率,设计理念紧扣成本优化 [8] - 项目起源可追溯至2006年,但当时GPU算力冗余未推进,体现"量体裁衣"的务实商业逻辑 [8] - TPU v6及后续版本目标成为"推理时代最省钱的商业引擎" [7] 市场影响与竞争格局 - 谷歌云内部高管预计TPU市场扩张可抢占英伟达年收入份额的10%,Meta拟斥资数十亿美元购买TPU [3] - 大摩预测2027年谷歌TPU外销量达100万颗,引发投资者对英伟达市场份额侵蚀的担忧 [3] - 英伟达紧急声明强调其产品比ASIC具备更高性能、通用性及可替代性 [3] - 谷歌通过"芯片-云-模型-应用"全栈AI能力构建生态护城河,形成垂直整合的差异化优势 [9]
摩尔线程发布Torch-MUSA v2.7.0
证券时报网· 2025-11-28 10:41
公司产品发布 - 摩尔线程正式发布了其PyTorch深度学习框架的MUSA扩展库的新版本Torch-MUSA v2.7.0 [1] - 新版本在功能集成、性能优化与硬件支持方面实现了进一步突破 [1]
谷歌AI往事:隐秘的二十年,与狂奔的365天
36氪· 2025-11-27 20:13
公司近期业绩与产品表现 - Gemini应用月活跃用户从上一季度的4.5亿大幅提升至6.5亿[2] - Gemini 3在各类主流基准上展现统治级表现,Nano Banana Pro模型将AI生图精度与想象力提升到新高度[2][43] - 公司进入罕见的产品加速期,接连发布视频模型Veo 3、虚拟世界生成模型Genie 3等“王炸”产品[43][44] 公司AI技术发展历史与积淀 - 公司二十多年间的AI投资贯穿现代深度学习绝大部分关键节点,从拉里·佩奇对“终极搜索引擎”的想象,到“猫论文”、DeepMind、TPU[4][6] - 在Transformer论文发表前十年,世界上几乎所有知名AI人才都曾在公司工作过[5] - 公司首次语言模型实验始于2000年左右,开发出拼写纠错功能,并进化出内部昵称为PHIL的概率语言模型[10][11] 关键技术突破与商业影响 - 2012年“猫论文”使用16000个CPU核心训练九层神经网络,通过无监督学习识别YouTube视频中的猫,证明无监督学习可行性[14][15] - “猫论文”技术催生推荐系统机制,被应用于YouTube并奠定其全球最大视频平台基础,后续被Facebook、Instagram、字节跳动效仿,创造数千亿美元收入[15][17] - 公司开发出Transformer架构,其模型彻底碾压基于LSTM的谷歌翻译方案,证明模型规模越大效果越好[34] 重要收购与人才战略 - 2014年以5.5亿美元收购DeepMind,获得最豪华AI研究团队,但收购间接导致OpenAI、Anthropic、xAI等公司诞生[22][23][24] - 收购DeepMind后,公司向英伟达订购4万块GPU,订单价值1.3亿美元,后继续花费数亿美元购买GPU[25][27] - 为应对ChatGPT威胁,公司将Google Brain和DeepMind合并为Google DeepMind,并召回谢尔盖·布林等顶级人才参与Gemini项目[42] 自研芯片与基础设施 - 为解决GPU成本过高和算力不足问题,公司自研TPU芯片,专门针对神经网络矩阵乘法进行优化,效率远高于当时GPU[28][29][30] - TPU通过降低计算精度提高效率,避免公司向英伟达支付高额溢价(英伟达GPU系统毛利率高达75%至80%)[31] - 自研TPU使公司建立规模几乎与英伟达相当的芯片研发体系,服务于自身和谷歌云客户[30] 战略误判与危机应对 - 公司早期已开发出与ChatGPT接近的聊天机器人Mina,但因失控风险、收入模式冲突和法律风险未发布[36][37] - ChatGPT的出现使公司意识到AI从持续性创新转变为颠覆性创新,对构成生存威胁,内部发布红色警报[41][42] - 公司决定结束多模型并存局面,集中资源打造多模态旗舰模型Gemini,并于2023年5月宣布计划后,同年12月发布公共测试版本[42][43]
微软系 40 大 AI 科学家,为何钟情雷峰网的 GAIR 大会?
雷峰网· 2025-11-27 18:05
GAIR大会与微软系科学家的历史渊源 - 1998年张亚勤与李开复联合创办微软中国研究院,被称为中国人工智能的黄埔军校[5] - 2016年首届GAIR大会在深圳举办,由CCF和雷峰网主办,旨在促进学术界、产业界、投资界融合[7][8] - 七年来GAIR已成为微软系科学家的AI第二故乡,累计有40多名来自微软全球各地的科学家参与[9] 历届GAIR大会的重要里程碑 - 2018年第三届GAIR上微软系马毅、孙剑探讨深度学习的痼疾[9] - 2019年第四届GAIR上张正友、周明分别作为CVPR、ACL大会主席探讨人工智能多学科大一统[9] - 2020年第五届GAIR设立纪念Thomas Huang专场,沈向洋、颜水成、田奇等参与追忆[9] - 2023年第七届GAIR成为国内首个走向海外的AI产学融合顶会,黄学东院士离开微软后首秀[9] - 2025年12月将举办第八届GAIR全球人工智能与机器人大会[10] 微软系顶尖科学家的职业发展轨迹 - 沈向洋从微软全球执行副总裁转任IDEA理事长、香港科技大学校董会主席[14] - 黄学东从微软云与人工智能部首席AI技术官加入Zoom担任CTO[17] - 张宏江从微软亚太研发集团CTO转任北京智源人工智能研究院理事长[20] - 周明从微软亚洲研究院副院长孵化出澜舟科技,推出轻量化模型"孟子"[36] - 马维英从微软亚洲研究院常务副院长加入字节跳动,后转入张亚勤清华AIR团队[40] - 何晓冬从微软雷德蒙德研究院负责人转任京东集团高级副总裁、大模型负责人[46] 科学家在GAIR大会的技术分享重点 - 杨强在2016、2019、2020年分别分享人工智能成功条件、联邦学习发展及应用[22][23] - 孙剑在2017-2019年连续三届分享Face++研发方向、云端芯视觉计算、深度学习变革[50] - 颜水成在2017、2020年探讨深度学习精度极限与用户体验、芯片能与新基建[56] - 梅涛在2017-2021年分享视频内容生命周期、智能供应链机器视觉、感知到认知计算[60] - 郑宇在2019年演讲用大数据和AI打造智能城市[58] 科学家在产业界的技术影响力 - 张正友现任腾讯首席科学家,曾在GAIR分享计算机视觉三生三世[32] - 芮勇现任联想集团CTO,曾在GAIR分享计算机视觉从感知到认知的长征[34] - 赵峰现任清华大学AIR首席科学家,曾在GAIR分享IoT+AI赋能智慧家庭[42] - 华先胜曾任阿里巴巴副总裁,现任特斯联CTO,专注城市大脑视觉智能[54] - 余凯从百度研究院副院长创办地平线,在GAIR分享中国AI真实现状[72]