Workflow
Deep Learning
icon
搜索文档
全球首个「百万引用」学者诞生,Bengio封神,辛顿、何恺明紧跟
36氪· 2025-10-26 09:49
AI领域顶尖研究者学术影响力 - Yoshua Bengio总被引次数达987,920次,其中过去5年引用量为711,796次,占比72% [5] - Geoffrey Hinton总被引次数为972,944次,其中过去5年引用量为597,571次,占比61% [2][5] - 何恺明总被引次数超过75万次,达到756,424次,其中过去5年引用量为639,760次,占比高达84.6% [31][32] - Ilya Sutskever总被引次数超过70万次,达到706,612次,其中过去5年引用量为538,943次 [34][35] 高影响力论文与学术成就 - Bengio的《Generative adversarial nets》被引104,225次,《Deep learning》被引103,249次 [1] - Hinton的《Imagenet classification with deep convolutional neural networks》被引185,004次,《Deep learning》被引103,216次 [2] - 何恺明的《Deep Residual Learning for Image Recognition》被引298,327次,《Faster R-CNN》被引97,114次 [32] - Ilya Sutskever参与的《Imagenet classification with deep convolutional neural networks》被引185,909次 [35] AI领域发展里程碑 - 2018年Bengio、Hinton和Yann LeCun共同获得图灵奖,此后Bengio的引用量开始爆发性增长 [4][6] - 2012年AlexNet在ImageNet上取得突破性成果,被视为深度学习"引爆点" [17] - 2015年Nature发表LeCun、Bengio、Hinton的综述《深度学习》,成为标准理论引用来源 [19] - 2017年Transformer提出,2018年BERT证明预训练/微调范式,推动多模态与生成式AI发展 [21] AI学术生态发展趋势 - 2010-2022年全球AI论文总量从约8.8万增长至24万+,近乎三倍增长 [26] - AI占计算机科学论文比例从2013年的21.6%升至2023年的41.8%,几乎占据半壁江山 [26] - 2024年顶会投稿量激增:ICLR 2024共7,262投稿,NeurIPS 2024总投稿17,491,CVPR 2024投稿11,532 [26] - AI论文引用爆发式增长与AI时代发展相契合,奠基者的累积引用增长加速 [23][26] 其他高影响力研究者 - Yann LeCun被引次数超过43万次 [11] - Ian Goodfellow被引超过38万次 [40] - Jeff Dean被引373,153次 [44] - 李飞飞被引322,796次 [44] - Juergen Schmidhuber被引29万+ [40] - 吴恩达被引29万+ [40][47] - Noam Shazeer被引28万+ [40][55]
全球首个「百万引用」学者诞生!Bengio封神,辛顿、何恺明紧跟
自动驾驶之心· 2025-10-26 00:03
AI领域学术影响力里程碑 - Yoshua Bengio成为全球首位论文引用量突破100万次的学者,标志着AI学术影响力达到新高峰[2][3] - Geoffrey Hinton以97万次引用紧随其后,有望成为全球第二位突破百万引用的学者[5] - 深度学习三巨头(Bengio、Hinton、Yann LeCun)共同获得2018年图灵奖,其中LeCun引用量超过43万次[6][7][13] 顶尖AI研究者学术成就 - Yoshua Bengio在全球计算机科学领域排名第一,总引用量987,920次,近五年引用量711,796次,占比72%[8] - Geoffrey Hinton全球排名第二,总引用量963,982次,近五年引用量588,843次,占比61.1%[8] - 何恺明论文总被引超过75万次,其2016年发表的深度残差网络(ResNets)论文被引298,327次,是二十一世纪被引用次数最多的论文[48][51] - Ilya Sutskever论文总被引超过70万次,作为OpenAI和ChatGPT缔造者,与Hinton存在师徒关系[53][18] AI论文引用爆发式增长原因 - 2012年AlexNet在ImageNet上的突破性表现被视为深度学习"引爆点"[20] - 2017年Transformer架构提出和2018年BERT模型出现,推动预训练/微调范式发展,带来AI论文二次爆发[24] - 2010-2022年全球AI论文总量从约8.8万篇增长至24万篇以上,实现近三倍增长[30] - AI论文占计算机科学论文比例从2013年的21.6%升至2023年的41.8%,几乎占据计算机科学领域一半论文[31][32] AI领域学术会议活跃度 - ICLR 2024接收论文2260篇,投稿量较2023年增加2324篇[36] - NeurIPS 2024总投稿17491篇(主会15671篇),接收4497篇[36] - CVPR 2024投稿11532篇,接收2719篇,录用率23.6%[36] 其他高影响力AI研究者 - GAN之父Ian Goodfellow引用量38万+[61] - 谷歌人工智能负责人Jeff Dean引用量37万+[61] - ImageNet创建者李飞飞引用量32万+[61] - LSTM之父Juergen Schmidhuber引用量29万+,其1997年LSTM论文被引136,740次[61][67] - Coursera创始人吴恩达引用量29万+[61] - Gemini技术负责人Noam Shazeer引用量28万+,其参与的"Attention is All You Need"论文被引209,694次[61][69]
Nuix Wins Multiyear Contract with German Tax Authority to Strengthen Investigative and Regulatory Capabilities
Prnewswire· 2025-09-18 07:47
核心业务动态 - 公司赢得德国莱茵兰-普法尔茨州税务局的多年期法证分析软件供应合同 [1] - 该合作通过欧洲范围招标流程达成 客户认为其技术能提升审计和调查效率 [5] 产品技术优势 - Nuix Neo软件支持超过1000种文件类型的数据导入 采用负责任人工智能和深度关联分析技术 [2] - 软件实现工作流自动化 帮助调查人员从复杂数据集中发现关键证据并支持实时协作 [2] - 技术成果具备一致性、可审计性和可辩护性特点 [2] 客户合作生态 - 全球近100家监管机构使用公司技术处理复杂调查案件 [4] - 客户群体涵盖税务机构、廉政机构及其他监管组织 [3] - 技术帮助客户集中分析大型数据集 检测财务异常并强化税务合规性 [3] 行业地位延伸 - 公司近期获得深度学习训练人工智能技术的突破性专利 [6][7] - 被定义为数据处理、调查分析和智能软件领域的全球领导者 [6][7]
ZipRecruiter (NYSE:ZIP) 2025 Conference Transcript
2025-09-11 07:47
**行业与公司** - 行业:在线招聘平台,聚焦美国人才招聘市场,年市场规模超过3000亿美元[6] - 公司:ZipRecruiter (NYSE:ZIP),CEO Ian Siegel(创始人,任职15年),CFO Tim Yarbrough[1][4] **核心观点与论据** **1 公司战略与产品演进** - 从“量”转向“质”:初期聚焦批量推送职位至全网平台,后转向通过机器学习、深度学习提升候选人质量,当前重点为促进雇主与求职者快速匹配和互动[4][5] - 核心产品: - 简历数据库:内置消息功能,支持雇主主动联系候选人[10] - ZipIntro:24小时内通过算法匹配高契合度候选人并进行视频面试,类似“招聘速配”[10][14] - BreakRoom(收购):为一线工人提供雇主具体信息(如工作时长、薪资发放频率等),覆盖60%劳动力市场[14][15] - 差异化定位:与LinkedIn(侧重在职白领社交)、Indeed(大型在线招聘板)相比,ZipRecruiter定位为“匹配平台”,强调主动撮合与快速互动[9] **2 竞争格局与市场机会** - 在线招聘“新三巨头”:LinkedIn、Indeed、ZipRecruiter,传统巨头Monster和CareerBuilder已衰落[6] - 企业市场(Enterprise)为增长重点: - 当前收入占比SMB(中小企业)80% vs 企业20%,目标长期调整为50/50[24] - 挑战:需集成第三方招聘系统(如Workday、Taleo),已完成180个集成;企业预算多通过代理机构分配[25][28] - 品牌优势:雇主与求职者端品牌认知度超80%[13] **3 技术投入与AI应用** - 算法匹配:已应用近10年,基于历史百亿级交互数据优化,替代传统布尔搜索[13][17] - AI最新应用: - 大语言模型:提升双方互动效率(如自动消息促活)[14][18] - 内部效率提升:辅助工程师编码(生成单元测试)、替代重复性人工检查任务,但尚未导致裁员[20][21] **4 财务与运营表现** - 2025年趋势: - Q1付费雇主数环比增10%(对比此前连续下滑),Q2再环比增4%,显示劳动力市场企稳[32] - 预计Q4实现同比小幅增长[33][35] - 利润率目标:当前调整后EBITDA利润率中个位数,长期目标30%[48] - 驱动因素:企业收入占比提升、营销支出效率优化[48][49] **5 资本配置与投资优先级** - 优先顺序: 1. 有机投资(产品与技术)[52] 2. 战略并购(如BreakRoom)[52] 3. 股东回报(倾向股票回购)[52][53] - 现金流历史:创业前4.5年自筹资金,收入超5000万美元时仍保持正自由现金流[49] **其他重要内容** - 宏观环境挑战:过去32个月招聘连续下滑(对比2008金融危机时期22个月),当前关键词为“不确定性”(利率、关税等)[37][38] - 关键指标关注: - 雇佣数(每月全美约500万人)而非新增岗位数(如7.5万/月),后者对业务影响微弱[43] - 离职率(Quits Rate)回升为招聘复苏关键信号[39] - 流量增长:近两年求职者流量增速超越竞争对手,应用商店评分第一[44]
谷歌Nano Banana全网刷屏,起底背后团队
机器之心· 2025-08-29 12:34
产品发布 - Google DeepMind团队推出Gemini 2.5 Flash Image模型 具备原生图像生成与编辑能力 可快速生成高质量图像并在多轮对话中保持场景一致性 [2] - 模型引入交错生成机制 将复杂指令拆解为多轮操作 实现像素级完美编辑 用户仅需自然语言指令即可完成操作 [46] - 生成单张图像仅需十几秒 支持快速重试 显著提升创作效率 [49] 技术能力 - 模型具备优秀文本渲染能力 可在图像中正确生成简短文字如Gemini Nano 团队将文本渲染作为评估图像结构能力的新指标 [39][41] - 模型通过多模态理解与生成的紧密结合提升性能 图像理解为生成提供信息 生成反过来强化理解 [44] - 模型能利用视觉信号从世界学习额外知识 从而提升文本理解与生成能力 视觉信号成为理解世界的捷径 [45] 应用场景 - 在家居设计场景中 用户可快速可视化多种方案 如房间不同窗帘效果 模型能精准修改而不破坏整体环境 [49] - 在人物形象设计中 无论是更换服装 调整角度或生成复古风格 模型均能保持面部和身份一致性 [49] - 模型适合处理以某公司风格设计广告牌等任务 可直接将参考图像作为风格输入 操作比Imagen更方便 [52] 团队构成 - Logan Kilpatrick担任高级产品经理 领导Google AI Studio和Gemini API产品开发 曾任职OpenAI开发者关系负责人和Apple机器学习工程师 [6][8] - Kaushik Shivakumar担任研究工程师 专注于机器人技术 人工智能和多模态学习 参与Gemini 2.5模型开发 [12][14] - Robert Riachi担任研究工程师 专注于多模态AI模型开发 参与Gemini 2.0和2.5系列研发 致力于图像生成与对话AI结合 [17][20] - Nicole Brichtova担任视觉生成产品负责人 专注于构建生成模型 推动Gemini应用 Google Ads和Google Cloud产品发展 [24][26] - Mostafa Dehghani担任研究科学家 主要从事机器学习研究 参与开发多模态视觉语言模型PaLI-X和220亿参数Vision Transformer [29] 产品定位 - Gemini目标为整合所有模态向AGI方向迈进 利用知识转移在跨模态复杂任务中发挥作用 [50] - Imagen专注于文本到图像任务 在Vertex平台提供多种优化变体 适合目标明确 追求速度和性价比的场景 [50][51] - Gemini在复杂多模态工作流中优势突出 支持生成加编辑 多轮创意迭代 能理解模糊指令和利用世界知识 [52] 未来展望 - 期待模型展现智能 即使不完全遵循指令也能生成比描述更好的结果 让用户感受与更聪明系统互动 [53] - 关注模型事实性与功能性 希望生成既美观又准确无误的图表或信息图 甚至自动制作工作简报 [53]
Video Analytics Market Surges to $22.6 billion by 2028 - Dominated by Avigilon (Canada), Axis Communications (Sweden), Cisco (US)
GlobeNewswire News Room· 2025-08-19 21:45
市场规模与增长预测 - 视频分析市场预计从2023年83亿美元增长至2028年226亿美元 期间复合年增长率达223% [1] 增长驱动因素 - 关键基础设施领域对周界入侵和边界控制应用的需求是主要驱动因素 [3] - 深度学习与边缘系统集成将推动技术采用 提升节点分析能力 [4][6] - 实时处理非结构化监控数据的需求增加 应对网络攻击和数据盗窃事件 [5] - 政府法规对闭路电视监控的要求及无人机视频分析应用兴起 [5] 技术类型发展趋势 - 基于边缘计算的类型预计实现最高增长率 其架构将分析功能嵌入摄像头硬件 [4] - 边缘设备通过内置高性能芯片提升计算能力 支持实时音视频事件警报及高级分析功能(如排队管理、热力图) [4] 部署模式分析 - 云部署模式预计呈现更高增长率 采用视频分析即服务(VAaaS)交付模式 [7] - 云服务优势包括降低运营成本(OPEX)和资本支出(CAPEX) 提供实时监控、数据可用性及远程分析能力 [7] 垂直领域应用 - 政府与国防垂直领域在2023年占据最大市场份额 涵盖城市监控和边境安全 [8] - 欧美恐怖袭击事件加剧对城市监控解决方案需求 应用场景包括交通管控、人群流量管理、面部识别及摄像头防破坏检测 [9] - 智慧城市建设中视频分析用于提升基础设施运营效率和安全环境 [8][9] 主要企业格局 - 市场参与者包括Avigilon(加拿大)、Axis Communications(瑞典)、思科(美国)、霍尼韦尔(美国)、IBM(美国)等全球企业 [5] - 区域厂商涵盖AllGoVision(印度)、Genetec(加拿大)、Gorilla Technology(台湾)等 [5]
Gorilla Technology Sets H1 2025 Conference Call for August 14 at 8:30 a.m. ET
Newsfile· 2025-08-08 22:00
公司公告 - Gorilla Technology Group Inc (NASDAQ: GRRR) 将于2025年8月14日美东时间8:30举行电话会议 讨论截至2025年6月30日的六个月财务业绩 [1] - 财务报告将在电话会议前通过新闻稿发布 [1] - 电话会议提供免费拨入号码(+1-833-752-4853)和国际线路(+1-647-849-3362) 建议提前5-10分钟接入 [1] 业务概况 - 公司总部位于英国伦敦 是全球安全智能/网络智能/商业智能和物联网技术解决方案提供商 [3] - 核心解决方案涵盖智慧城市/网络/视频安防/安全融合及物联网 应用领域包括政府公共服务/制造业/电信/零售/交通运输/医疗及教育 [3] - 技术优势集中在AI与深度学习驱动的智能视频监控/人脸识别/车牌识别/边缘计算/事后分析及高级网络安全技术 [4] 技术能力 - 通过AI技术整合提升城市运营效率 强化安全防护与系统韧性 改善居民生活质量 [4] - 产品组合聚焦智能视频监控和网络安全领域 具备端到端的技术整合能力 [4] 投资者沟通 - 电话会议将提供网络直播及回放 网址为https://www.gowebcasting.com/14147 [2] - 更多公司信息可通过官网Gorilla-Technology.com获取 [5]
DEEPX and Baidu Form AI Ecosystem Partnership to Accelerate Global On-Device AI Projects in Drones, Robotics, and OCR
GlobeNewswire News Room· 2025-08-08 15:00
合作公告 - 公司与百度签署PaddlePaddle技术生态系统合作协议 开始战略合作以推广适用于全球工业场景的AI解决方案 [1] - 作为百度开源深度学习框架PaddlePaddle的官方生态合作伙伴 公司将共同参与各类工业AI项目 基于技术兼容性共同开发产品 并开展全球客户推广活动 [3] 技术平台 - PaddlePaddle是中国首个开源深度学习框架 作为创建和运行AI模型的核心技术平台 其名称源自"PArallel Distributed Deep LEarning" 设计用于快速处理海量数据并在多种设备上高效运行 [4] - 该平台广泛应用于智慧城市 自动驾驶 图像识别 语音处理等领域 被数千家企业机构采用 提供从AI模型开发到部署的全栈支持 包括预训练模型 轻量化工具和可视化工具等 [5] 产品验证 - 公司量产芯片DX-M1已在百度第五代PP-OCR和VLM模型上完成实时演示 在边缘计算环境中展现出极高的帧率和能效表现 [6] - 合作范围将扩展至无人机和机器人领域 百度团队将现有AI模型编译至DX-M1芯片 实现商业化部署 [7] 技术适配 - 公司正在转换10个行业广泛使用的OpenVINO AI模型 使其兼容DX-M1芯片 这些模型将通过百度PaddlePaddle生态与全球合作伙伴共享 [8] - 公司开发中的V-NPU视觉AI专用加速卡已完成初期演示 预计9月开始量产 同时与百度讨论下一代产品开发合作 [9] 市场推广 - 双方计划在8月底深圳国际通用人工智能大会上联合参展 向全球客户进行现场演示和联合营销 [10] - 百度表示公司将为其AI技术生态增添强大的边缘计算能力 显著提升PaddlePaddle模型在OCR 机器人 无人机等行业的实际应用性 [11][12] 公司背景 - 公司专注于低功耗设备端AI芯片开发 持有美中韩三国超过350项专利申请 在设备端AI芯片领域拥有全球最大专利组合之一 [13] - 产品已与现代起亚机器人实验室 POSCO DX LGU+等客户开展量产合作 并与120多家全球机构在智能摄像头 智慧工厂等领域建立合作关系 [14]
Caris Life Sciences Publishes Study Showing its Multi-Layer AI-Based Tissue of Origin Predictions are Best-in-Class and Identify when Patients have been Misdiagnosed
Prnewswire· 2025-08-05 20:30
技术突破 - Caris GPSai™采用深度学习多层AI模型 基于全外显子组和全转录组测序(WES/WTS)技术 显著提升原发灶不明癌症(CUP)和误诊肿瘤的诊断准确性 [1] - 新版本从传统机器学习转向深度学习 能够更精确预测肿瘤组织来源并识别潜在误诊病例 支持更精准的治疗决策 [2] - 模型基于超过200,000例Caris测序病例数据训练 可将肿瘤分类为90个类别 [3] 临床验证数据 - 在非CUP病例中展示95.0%的肿瘤组织来源识别准确率 [3] - 在回顾性验证(N=21,549)和前瞻性验证(N=76,271)中 对CUP病例成功报告84.0%的组织来源 对非CUP病例成功报告96.3%的组织来源 [3] - 八个月临床使用中改变704例患者诊断 其中86.1%的病例基于1级临床证据影响治疗资格 53.6%的受调查医生据此调整治疗方案 [4] 应用案例 - 具体案例显示一名被诊断为三阴性乳腺癌的女性患者 经GPSai确认为B细胞淋巴瘤 修正诊断对患者生活产生重大影响 [5] - 该工具无需额外组织样本 通过影像学和分子标记等正交证据支持诊断变更 [4] 公司技术平台 - Caris建立大规模多组学临床基因组数据库 结合新一代测序技术、AI机器学习及高性能计算平台 [6] - 技术平台覆盖疾病早期检测、诊断、监测、治疗方案选择及药物开发等精准医疗应用场景 [6] - 公司在美国凤凰城、纽约、剑桥及日本东京、瑞士巴塞尔设有分支机构 服务覆盖美国及其他国际市场 [7]
别再乱选AI课程了——这些书才是你的正解
36氪· 2025-08-03 08:03
编程与软件工程 - 编程能力与软件工程技能是进入AI领域的必备基础,OpenAI首席技术官Greg Brockman支持这一观点 [1] - AI领域最具影响力的人往往是同时精通软件工程与机器学习的专家,优秀软件工程师在AI领域潜力非凡 [1] - Python凭借易用性和完善生态成为AI领域首选语言,但热门AI工程师岗位可能需要掌握Java/GO/Rust等后端语言 [1] - 建议从Python入门,但未来可能需要转向其他语言,持续实践是掌握编程技能的最佳方式 [2] - 推荐Python学习资源包括4小时启蒙课、全网最受推崇的体系课程、面试刷题平台和哈佛CS50计算机导论 [5] 数学与统计学 - 成为顶尖AI从业者需理解模型底层原理,推荐资源包括《数据科学实用统计学》和《机器学习数学基础》 [9] - DeepLearning.AI推出的数学专项课程涵盖微积分、线性代数、统计概率等核心内容,专为AI/ML设计 [9] 机器学习 - 当前主流AI指生成式AI(GenAI),属于机器学习分支,但AI概念可追溯至上世纪50年代神经网络诞生时 [6][8] - 推荐机器学习资源包括《Scikit-Learn、Keras与TensorFlow机器学习实战》和机器学习专项课,后者新增推荐系统与强化学习内容 [12] - 《统计学习导论》是掌握机器学习根基的绝佳教材,传授学科精髓 [12] 深度学习与大语言模型 - 深度学习是AI的子集,当前所有生成式AI算法源于此领域,包括大语言模型、扩散模型和Transformer架构 [10] - PyTorch是深度学习框架首选,2021年77%研究论文采用该框架,HuggingFace平台92%模型为其专属 [13] - 推荐资源包括深度学习专项课、Andrej Karpathy的《大语言模型入门》和《神经网络:从零进阶》 [13] 人工智能工程 - AI工程师的核心工作是运用基础GenAI模型开发产品,工作性质更接近传统软件工程而非机器学习工程 [11] - 《实用MLOps指南》是模型部署领域必备书,覆盖容器化、脚本编写、云系统和模型监控等全流程 [11] - 《人工智能工程实践》是当红教材,作者Chip Huyen是生产环境ML/AI系统权威专家 [14]