Workflow
深度学习
icon
搜索文档
超97万:Yoshua Bengio成历史被引用最高学者,何恺明进总榜前五
机器之心· 2025-08-25 14:08
全球顶尖科学家学术影响力排名 - Yoshua Bengio成为全球被引用次数最多的科学家 总被引用量达973,655次 近五年引用量698,008次[1][3] - 排名基于AD Scientific Index平台 涵盖全球2,626,749名科学家 涉及221个国家地区24,576家机构[3] - Bengio的生成对抗网络论文引用量突破100,904次 深度学习论文引用量达100,061次[3] 人工智能领域核心研究者表现 - Geoffrey Hinton排名第二 总被引量952,643次 近五年引用577,970次 占比60.7%[4][6] - Hinton参与的AlexNet论文引用量高达182,853次 标志着深度学习在计算机视觉领域的突破[4][5] - 何恺明排名第五 总被引量735,881次 近五年引用619,578次 ResNet论文引用量达290,239次[8][10] - ResNet被Nature评为21世纪被引量最多论文 引用范围在103,756-254,074次之间[10][11] 跨学科高影响力研究者 - 医学领域Ahmedin Jemal排名第三 总被引量924,788次 近五年引用520,211次 占比56.3%[8] - 数学与生物学交叉领域Eric Lander排名第四 总被引量737,656次 近五年引用247,907次 占比33.6%[8] - Ilya Sutskever排名第七 总被引量671,834次 近五年引用504,890次 ImageNet论文引用量182,853次[11][14][15] 高影响力论文特征分析 - 顶级论文持续产生深远影响 如AlexNet(2012年)和ResNet(2016年)至今仍被广泛引用[5][10] - 计算机视觉领域论文占据主导地位 前10名中包括多篇图像识别和神经网络相关研究[10][11] - 生成对抗网络和注意力机制等基础架构论文引用量显著 如Attention Is All You Need引用范围56,201-150,832次[11][15]
科学界论文高引第一人易主!AI站上历史巅峰
量子位· 2025-08-25 13:54
Yoshua Bengio学术成就 - Yoshua Bengio成为各领域被引用次数最多的在世科学家 总引用量超过95万次[1][4] - 2018年与Geoffrey Hinton、Yann LeCun共同获得图灵奖 表彰深度神经网络突破性贡献[4][12] - 三篇核心论文引用量极高:2014年GAN论文引用100,904次 2015年《Deep learning》引用100,061次 2016年深度学习著作引用81,400次[16][17] 关键学术贡献 - 2003年发表《一种神经概率语言模型》 解决语言建模维度灾难问题 为GPT等大语言模型奠定基础[4][14] - 2014年作为共同作者提出生成对抗网络(GAN) 推动计算机视觉领域发展[4][16] - 在注意力机制、循环神经网络、词嵌入等方向做出开创性工作 影响机器翻译与自然语言处理发展[13][16] 学术背景与职业轨迹 - 1986-1991年于麦吉尔大学完成计算机科学本硕博 师从Geoffrey Hinton[10] - 曾在MIT与贝尔实验室从事研究 期间与Yann LeCun开展合作[10] - 1993年起任职蒙特利尔大学 现任蒙特利尔学习算法研究所(MILA)所长[11] 行业影响力与创业动态 - 2024年6月成立非营利组织LawZero 已筹集3000万美元启动资金 专注于AI系统透明度与安全性研究[19][20] - 其弟Samy Bengio现任苹果公司AI与机器学习研究高级总监[9] - 深度学习研究成果直接推动自然语言处理与计算机视觉技术商业化应用[4][16] 学术引用排名格局 - Geoffrey Hinton以94万次总引用量位列第二 与Bengio差距微弱[21] - 何恺明以73万次引用量排名第五 Ilya Sutskever以67万次引用量排名第七[24] - AD Scientific Index覆盖全球260万科研人员 数据每20天更新一次 排名每2天重新计算[23]
地平线HSD量产在即:国内最像特斯拉FSD的辅助驾驶系统,定义行业新高度
IPO早知道· 2025-08-25 11:39
产品与技术优势 - 地平线发布高性能城区辅助驾驶产品HSD,基于征程6P打造一段式端到端系统,实现光子输入到轨迹输出的超低时延,提升安全、效率和舒适性 [3] - HSD被誉为国内最像特斯拉FSD的系统,覆盖城区、高速、乡间小路、停车场等场景,支持复杂道路拓扑下的精准感知和流畅通行 [3] - 征程6P算力高达560TOPS,具备高集成度、高算力、高效率、高处理能力、高接入能力及高安全六大特点 [8] - 地平线采用"一段式端到端+强化学习"架构,通过自我探索激发模型潜力,实现智能涌现 [8] - 公司已建立超3万个场景数据集的安全测试场景库,完成超1000万公里大里程回灌,并获得全球首张ISO 8800 AI功能安全认证 [10] 市场进展与商业成果 - HSD已与全球近10家汽车品牌达成合作意向,首搭奇瑞星途星纪元E05车型并即将量产 [3] - 截至今年一季度末,地平线前装量产出货超800万套,量产上市车型超200个,量产定点车型超310个 [16] - 征程家族累计量产即将突破1000万套,将成为国内首家达成千万套出货量的企业 [16] - 高阶辅助驾驶市场快速增长,今年前5个月中国乘用车城区NOA交付量达90.22万辆,同比增长152.5% [5] 发展战略与行业定位 - 公司坚持"软硬一体"战略,十年间推出三代BPU架构,计算性能提升超1000倍,支持超10款计算方案规模化量产 [19] - 2023年发布端到端自动驾驶大模型UniAD并获CVPR最佳论文,2024年推出Vision Mamba模型超越Vision Transformer [20] - 地平线是国内唯一具备"软硬全栈+大规模落地经验+开放生态"的智驾科技企业,有望通过HSD成为高阶辅助驾驶市场顶级玩家 [23] - 公司强调"以快打慢"的竞争策略,认为技术创新速度和产品质量是维持市场领导地位的核心 [15][21] 技术演进与行业趋势 - 城区辅助驾驶经历从规则系统到混合系统,再到端到端技术的突破,实现性能体验跃迁和安全性的显著提升 [7] - 端到端技术突破使城区辅助驾驶上限大幅提高,带来系统能力和心理安全性的双重提升 [7] - 行业正从技术验证阶段迈向大规模普及阶段,地平线通过持续技术迭代保持竞争优势 [5][16]
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心· 2025-08-24 12:02
大模型技术发展推动AI专用芯片需求 - 大模型技术进步显著提升对AI专用芯片的关注度 专用芯片在计算任务负载中效率更高 谷歌TPU自2015年部署后已迭代至第7代 采用最先进制程工艺并针对机器学习推理任务优化架构[1] - TPU技术推动Gemini等大模型发展 加拿大西安大略大学团队基于学术研究目的开发开源TinyTPU芯片 支持机器学习推理和训练功能[1] TinyTPU开发动机与设计理念 - 项目初衷包括构建机器学习负载芯片的实践吸引力 以及填补同时支持推理和训练的开源加速器代码库空白[5] - 团队采用"Hacky Way"设计理念 优先尝试自主方案而非依赖逆向工程或AI代码生成工具 强调基础原理推导和硬件设计学习[6] - 开发过程注重深度学习算法与硬件设计的结合 通过图形化表达强化理解[6] TPU技术原理与架构特性 - TPU作为专用集成电路(ASIC)专注于提升机器学习推理和训练速度 与通用GPU相比在数学运算效率上具有显著优势[9] - 核心采用脉动阵列结构 由处理单元(PE)网格组成 每个PE执行乘累加运算 在时钟周期内同步处理数据[26][28] - 矩阵乘法占Transformer计算操作的80-90% 在超大型模型中达95% 占CNN计算操作的70-80% 脉动阵列专门优化此类运算[14] TinyTPU实现方案与技术细节 - 选择XOR问题作为验证场景 使用2x2脉动阵列(而非TPUv1的256x256) 输入为4x2矩阵代表4种二进制组合[18][21][23] - 采用权重平稳架构 通过矩阵旋转90度 输入交错延迟和权重转置实现数据对齐[35][38][44] - 集成偏差模块和LeakyReLU激活函数(泄漏因子α=0.5) 采用流水线技术将操作分解为多时钟周期以提升效率[50][52][58] - 创新性引入双倍缓冲机制 通过影子缓冲区预加载权重 减少50%时钟周期 支持持续推理[61][64] - 控制单元采用24位指令集(ISA)实现标志控制和数据加载 后期扩展至94位指令集以满足训练需求[68][117] 训练功能实现与优化 - 支持反向传播训练 使用均方误差(MSE)作为损失函数 通过链式法则计算梯度[71][74][75] - 发现前向传播与反向传播的数学对称性:前向使用转置权重矩阵相乘 反向使用未转置矩阵相乘[79][108] - 开发向量处理单元(VPU)统一处理逐元素操作 整合偏差 激活 损失和梯度计算模块[89][92] - 设计统一缓冲区(UB)模块存储激活值 权重和临时数据 配备双读写端口减少数据争用[97][98] - 对激活导数模块实施缓存优化 减少统一缓冲区访问次数[102][104] 性能验证与实际应用 - 通过GTKWave波形模拟验证权重更新功能 展示一个训练周期后参数变化[119] - 完整架构支持持续数据流处理 最大化脉动阵列利用率 实现推理和训练的硬件级协同[118]
淘宝灰度测试“AI万能搜”新功能,电商搜索迎来变革
搜狐财经· 2025-08-22 09:24
淘宝AI搜索技术升级 - 公司推出"AI万能搜"新功能 目前处于灰度测试阶段 入口位于淘宝搜索激活页[3] - 该功能采用口语化交互模式 用户可通过日常对话式提问获取商品推荐 例如"适合职场新人的简约风格连衣裙"或"预算500元左右送父亲的实用礼物"[3] - 系统基于AI技术理解语义和场景需求 生成包含商品链接、测评视频、选购指南的多维答案报告 覆盖购物攻略、口碑对比、优惠信息等全链路消费需求[3] 技术实现与功能特性 - 功能依托阿里云通义大模型技术能力 结合淘宝海量商品数据与用户行为洞察 具备强大语义理解、意图识别和内容生成能力[4] - 系统能自动拆解预算、场景、人群、偏好等需求维度 例如输入"如何选择手机"时自动解析性价比、预算区间、续航能力等核心维度[4] - 具备"购物偏好"功能 采用协同过滤算法参考用户偏好 使AI既拥有产品知识又了解用户品味[4] 用户体验优化 - 结果页面提供AI提炼的核心选购标准、针对性避坑提醒及搭配建议[4] - 若用户对结果不满意 系统会引导细化需求 提供"按品牌筛选"或"对比同价位机型"等二次提问选项[4] - 对于"适合小户型的高性价比空调"类查询 除推荐机型外还提供安装注意事项、能效对比、用户评价摘要及使用效果短视频[4] 技术细节待明确 - 尚未明确是否使用DeepSeek等其他模型 以及搜索数据是基于商品详情还是种草笔记[5]
深度学习与转债定价:转债量化定价2.0
财通证券· 2025-08-20 09:47
报告行业投资评级 未提及 报告的核心观点 - 深度学习或能对转债定价,基于万能近似定理,若转债定价存在解析解,神经网络模型可拟合结果 [2][5] - 设计多层感知机模型(MLP),通过多层非线性变换学习定价模型,添加 11 种因子非线性拟合定价特征 [2][5] - 模型收敛性好且外推泛化能力出色,对样本外数据有强解释能力 [2][8] - 结合 MC 模型和传统 BS 模型,三个模型可在多场景辅助投资活动 [2][13] - 神经网络模型显示当前市场定价有高估,但仍有上行空间 [2][13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好 [2][16] - 模型在下修定价方面有较好效果 [2][19] 根据相关目录分别进行总结 深度学习定价模型的思路与设计 - 参考 BS 公式,中国可转债是复杂期权,可能存在复杂定价公式,基于万能近似定理,神经网络模型可拟合定价结果 [5] - 设计 MLP 模型,建立有限隐藏层,通过多层非线性变换学习定价模型,添加 11 种因子拟合定价特征 [5] - 模型收敛性好且外推泛化能力出色,选择 2022 - 2023 年因子数据训练和测试,剔除异常数据,第 100 轮迭代误差收敛,对 2024 - 1Q2025 数据解释能力强 [8] - 与 BS 公式和 MC 模型相比,MLP 模型定价效果更强,拟合市场整体转债价格平均值和所有转债价格时误差更小、稳定性更强 [10] - MLP 模型批量计算定价结果速度快,考虑转债特性和市场环境,定价更贴近实际,但存在不可解释性和需大量历史数据训练的问题 [11] 转债量化定价 2.0——模型有哪些应用? - 结合 MC 模型和传统 BS 模型,三个模型可在新券定价、市场解释、条款定价等场景辅助投资 [13] - 神经网络模型显示当前市场定价有高估,但截至 2025 年 8 月 15 日,市场价格中位数估值高估幅度不大,转债估值虽在高位但仍有上行空间 [13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好,超 50% 转债上市价格在 MC - MLP 框定区间,2024 年 11 月后超 80% 被捕捉 [16] - 模型在下修定价方面有较好效果,2025 年一季度多数转债提议下修第二个交易日价格能被 MLP 预测价格区间框定或接近上下沿 [19]
每经热评丨人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-19 23:07
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知融合 [1] - 运动会在真实竞技环境中检验传感器识别 运动控制 路径规划等综合能力 暴露技术缺陷并提供改进方向 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工 宇树科技 加速进化等头部整机企业 [2] - 赛事考验算法数据质量 硬件供应链稳定性到运维响应速度的整个生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人产品获得超过2000台订单 [2] 社会影响层面 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解机器人能力 [3] - 赛事荣誉体系和竞争氛围为青年人才提供展示舞台 激励投身机器人科研领域 [3] - 竞技活动推动技术融合与突破 促进前沿技术从实验室走向大众市场 [3]
图灵奖得主杨立昆沉寂数月后发声:AI安全是工程问题,不必恐慌“失控”
36氪· 2025-08-19 10:50
划重点: 2025年7月1日,Meta正式宣布成立 Meta超级智能实验室(Meta Superintelligence Labs),以加速通用人工智能(AGI)的研发进程。在 这一重组过程中,马克·扎克伯格展现出对AI顶尖人才的强烈渴求,他主导的一系列高调挖角行动迅速震动了整个科技行业。然而,在此 过程中,长期担任Meta基础AI研究实验室(FAIR)首席科学家的杨立昆(Yann LeCun)却逐渐被"边缘化",淡出了公众视野。 自2023年夏季以来,Llama模型家族已被下载约8亿次,这个数字令人震惊。 让AI的行为与人类价值观保持一致,更像是一个工程与设计问题,就像当年通过工程手段让喷气式飞机安全飞行一 样。 杨立昆提出"目标驱动架构",核心思路是为系统设定清晰的目标和必要的安全边界,使其在既定范围内执行任务。 AI可能像15世纪的印刷术一样,引发一场新的文艺复兴,放大人类智慧。 年轻人不要被负面的、耸人听闻的故事吓倒;要认识到自己的力量,主动塑造自己想要的未来。 沉寂数月后,这位被誉为"人工智能教父"之一的科学家,在法国巴黎接受一位人工智能专家(也是硅谷一家初创公司的联合创始人、首 席技术官)——芭芭 ...
几何计算联袂深度学习 提升疾病诊断准确率
科技日报· 2025-08-19 09:22
科技日报讯 (记者金凤)记者8月17日从东南大学获悉,该校教授顾忠泽团队联合中国科学院外籍 院士丘成桐团队等研发出基于几何表面参数化的多组学预测技术。该技术能提升对结直肠肿瘤等实体瘤 的组织分型与分子标志物的预测准确率,有望支撑人工智能在病理图像分析领域的应用。相关成果近日 刊发于中国工程院院刊《工程学》。 "人工智能已经在病理诊断中有不少应用,但现有算法多用于自然图像领域,其处理不规则病理图 像的能力有限。"论文第一作者、东南大学生物科学与医学工程学院博士生黄锴介绍,当碰到病理组织 分布不均匀等情况时,人工智能对疾病的预测准确度就会大打折扣。 "病理切片中的组织形状很不规则,造成图像中有许多空白区域,这些空白对于疾病的诊断没有意 义,我们将包含少量空白的不规则组织的图像提取出来,再将这些图像转换为正方形。"论文共同通讯 作者李铁香介绍,团队通过几何映射技术,保留了病理图像关键特征,同时引入多尺度和各向异性信 息,提升病理切片图像中有关肿瘤区域的信息量。经过这番处理,既减少了对无用信息的储存、处理, 又能增强卷积神经网络对肿瘤特征的学习能力。 黄锴介绍,团队使用该方法在573名结直肠癌患者的1802张切片上进 ...
每经热评︱人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-18 15:40
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知的融合 [1] - 运动会使技术缺陷在传感器识别运动控制路径规划等环节暴露 推动机械结构人工智能光学传感材料等多学科技术进步 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工宇树科技加速进化等头部整机企业 [2] - 赛事考验算法数据质量硬件供应链稳定性运维响应速度等全生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人获得超过2000台订单 [2] 社会影响 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解人形机器人应用场景 [3] - 赛事荣誉体系和竞争氛围激励青年人才投身机器人科研领域 加速行业人才培养 [3] - 竞技活动推动技术从实验室走向大众市场 实现产业革新 [3]