深度学习
搜索文档
创业黑马:子公司黑马天启联合厦门算能推出了政企服务一体机
证券日报网· 2025-08-29 19:45
公司产品发布 - 子公司黑马天启联合厦门算能于2024年1月推出政企服务一体机 旨在解决政府与中小企业在项目申报过程中的问题 [1] - 产品利用企业及知识产权大数据 自然语言处理 深度学习技术及政策大模型 实现政策信息快速获取 项目精准匹配和申报材料高效生成 [1] - 产品依托算能SG系列智算服务器打造 采用软硬件一体化设计 可满足不同场景需求 [1] 产品价值与影响 - 政企服务一体机降低企业申报成本并提高申报成功率 [1] - 产品有助于提升政策执行效率和透明度 促进政府与企业合作共赢 [1] 未来发展策略 - 公司将根据市场需求和行业发展决定下一步发展策略 [1]
英伟达自动驾驶算法工程师面试
自动驾驶之心· 2025-08-29 07:32
公司招聘流程与职位设置 - 公司职位划分非常细致 特别是规划控制方向 如自主记忆泊车-自动开出职位[3] - 公司今年没有校招名额 主要通过实习转正方式招聘 实习转正概率较大且支持线上实习[3] - 招聘流程包括笔试和五轮技术面试 每轮面试均包含算法题考察[3] 笔试内容与考察重点 - 笔试包含三道算法题 涉及图搜索、模拟和动态规划 难度为LeetCode中等水平[4] - 具体题目包括对数组相邻元素进行异或操作后求和最大化 问题可转化为不相邻元素选取最大值问题[4] - 测试用例通过率分别为90%、0%和70% 主要问题在于模拟题未完成和动态规划边界处理[4] 技术面试深度与范围 - 面试问题覆盖项目经验、算法理论和工程实践 如MPC优化问题构造、求解器选择、约束设计等[5] - 非线性优化器知识被深入考察 包括GN/LM/共轭梯度区别、line search与trust region应用场景等[5] - 规划算法要求熟练掌握Hybrid A*流程、与A*区别、运动学约束算法改进方法如kinodynamic-RRT等[12] 算法编码能力测试 - 编码题涵盖数据结构基础如链表操作(合并、拷贝构造)和经典算法如棋盘路径动态规划[6][8] - 题目难度从基础到进阶 包括带障碍物的路径规划、TopK问题求解(堆排序应用)、岛屿数量DFS计算等[8][11][13] - 算法实现要求兼顾效率 如BFS被提示超时后需优化为动态规划或记忆化搜索[8] 行业技术趋势与人才需求 - 自动驾驶技术栈呈现趋同态势 传统多算法方向向统一方案如one model、VLM、VLA演进[22] - 行业对跨领域技能需求增加 如感知转大模型、规控转具身智能 反映技术壁垒提升[22] - 专业社群规模近4000人 覆盖30+技术方向 显示行业对系统化学习路径的需求[25] 公司技术团队协作特点 - 工作中需频繁参考学术论文 组内与组间合作紧密 工程问题解决占比较高[9][13] - 技术主管面试采用全英文 考察项目深度如EKF原理、工程调参经验 并关注实习时间与offer选择[14]
科学界论文高引第一人易主,Hinton、何恺明进总榜前五!
机器人圈· 2025-08-27 17:41
学术引用排名分析 - Yoshua Bengio总被引用量达973,655次 近五年引用量698,008次 位列全球科学家首位[1] - 其2014年发表的生成对抗网络论文引用量突破100,904次 2015年深度学习论文引用量达100,061次[1][2] - Geoffrey Hinton总被引用量超95万次 近五年引用量57万次 排名第二[3] - Hinton参与的AlexNet论文引用量达181,968次 为计算机视觉领域突破性研究[3][5] 跨学科引用表现 - 医学领域研究者Ahmedin Jemal总引用量924,788次 近五年引用量520,211次 排名第三[7] - 数学与生物学交叉领域研究者Eric Lander总引用量737,656次 近五年引用量247,907次 排名第四[7] - 何恺明总引用量735,881次 其2016年ResNet论文引用量达290,239次 排名第五[9] - ResNet被Nature评为21世纪被引量最多论文 引用范围在103,756-254,074次之间[9][10] 高影响力论文特征 - AlexNet论文引用量181,968次 推动深度学习在计算机视觉应用[3][5] - 生成对抗网络与深度学习论文引用量均超10万次 形成持续学术影响[1][2] - 全球科学家排名涵盖2,626,749名研究者 涉及221个学科领域[1] - Ilya Sutskever总引用量超67万次 单篇最高引用18万次 排名第七[10]
打磨7年,李航新书《机器学习方法(第2版)》发布,有了强化学习,赠书20本
机器之心· 2025-08-27 11:18
文章核心观点 - 李航老师推出了新版教材《机器学习方法(第2版)》,旨在构建一个覆盖监督学习、无监督学习、深度学习与强化学习的完整知识框架,以反映当前机器学习技术的全貌[4][5] - 新版教材是对其经典著作《统计学习方法》系列的全面更新和扩展,新增了深度学习和强化学习等关键内容,以解决现有教材内容滞后于技术快速发展的问题[3][4] - 该书定位为大学教材、辅助读物或专业人员的参考书,历时7年完成,标志着作者最初写作规划的最终版[22] 书籍内容与结构 - 全书共分为4篇,分别对应监督学习、无监督学习、深度学习和强化学习四个主要分支[5] - 第1篇监督学习介绍了线性回归、感知机、支持向量机、最大熵模型与逻辑斯谛回归、提升方法、隐马尔可夫模型和条件随机场等方法[7] - 第2篇无监督学习介绍了聚类、奇异值分解、主成分分析、马尔可夫链蒙特卡罗法、EM算法、潜在语义分析、潜在狄利克雷分配等方法[8] - 第3篇深度学习介绍了前馈神经网络、卷积神经网络、循环神经网络、Transformer、扩散模型、生成对抗模型等方法[9] - 第4篇强化学习是新增且独立成篇的内容,系统介绍了马尔可夫决策过程、多臂老虎机、近端策略优化、深度Q网络等方法[4][10] 书籍特点与更新 - 新版教材不仅新增了强化学习篇章,还增加了若干监督学习方法(如线性回归),并根据读者反馈对监督学习的大部分内容和无监督学习的少部分内容做了大幅修改[11] - 书中删除了部分目前已不常用的技术,如部分机器学习优化算法[11] - 每章详细介绍一两种机器学习方法,从具体例子入手,并由浅入深地给出严格的数学推导,以帮助读者直观理解基本思路并掌握基本原理[12] - 书中包含公式和图表,适合作为教材,并为满足进一步学习需要,总结了方法要点、提供了习题并列出主要参考文献[18][19] - 全书统一了符号用法,修改了几十处错误,并重新绘制了几乎所有的插图,以增加可读性[21] 作者与背景 - 作者李航是ACM Fellow、ACL Fellow和IEEE Fellow,拥有京都大学和东京大学的学术背景,并曾任职于NEC中央研究所、微软亚洲研究院、华为诺亚方舟实验室,目前在字节跳动Seed部门工作[24] - 其主要研究方向为自然语言处理、信息检索、机器学习、数据挖掘[24] - 该书从2018年开始写作,历经2022年出版的第1版(增加了深度学习内容),至2024年12月完成第2版,总计历时7年[22]
陶朗食品双AI解决方案国内首秀,水果分选进入双AI时刻
中国食品网· 2025-08-26 14:48
产品技术展示 - 公司携两款双AI光学分选分级平台Spectrim搭载LUCAi™与InVision²搭载LUCAi™亮相2025中国国际水果展和亚洲国际果蔬展览会 这是双AI分选分级平台首次在中国境内同台展出 [1] - LUCAi™人工智能引擎基于深度学习技术 通过超过250000张数据图片驱动数据库 精准识别水果的各类瑕疵 包括蓝莓的疤痕 发霉 发软 皱缩 开裂等 [2] - 双AI系统突破水果复杂瑕疵识别瓶颈 可识别传统机器学习难以处理的轻度腐烂 日灼伤 软果 剪切损伤 果窝缺陷等 [2] - AI系统依赖全球不同地区20多个果季采集的水果图像训练数据 LUCAi™引擎每秒可处理多达40000张图像 能分辨细微缺陷差异并量化严重程度 [3] - Spectrim搭载LUCAi™支持苹果 柑橘 猕猴桃 核果等水果分选 InVision²搭载LUCAi™支持樱桃等小果分选 [4] 技术优势与行业影响 - 双AI分选平台剔除人工分选主观偏差 挖掘传统技术无法触及的品质细节 重新定义水果的"智"与"质" [3] - 技术为水果从采摘到上市提供精准品质坐标 保障消费者获得更可靠产品 为生产者创造更高附加值空间 [3] - 推动行业进入"品质可控 价值可知"的新生态 [3] - 展会现场搭建沉浸式体验区 展示双AI系统对苹果 柑橘 猕猴桃等多品类水果的精准瑕疵辨别与实时决策能力 [4] 中国市场战略 - 公司持续深化对中国市场的本土化布局 构建完整本地服务体系 提供从技术设备落地到产业升级的赋能方案 [5] - 已建成区域总部 制造基地 供应链中心及技术测试中心 形成覆盖研发 生产 服务的全链条布局 [5] - 本土化网络显著缩短设备交付与技术支持响应时间 确保客户获得24小时本地化运维保障 [5] - 人工智能分选系统通过采集本地化数据进行算法升级和智能学习 有效筛选地方特色瑕疵 保障果品品质 [5] - 采用"以本地数据训练全球算法"模式 使分选效果更贴合中国果品实际品质需求 [5] - 中国是全球最大水果生产与消费国 公司以双AI解决方案为支点 助力客户抢占高附加值市场 践行"在中国 为中国"战略 [5]
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 21:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
超97万:Yoshua Bengio成历史被引用最高学者,何恺明进总榜前五
机器之心· 2025-08-25 14:08
全球顶尖科学家学术影响力排名 - Yoshua Bengio成为全球被引用次数最多的科学家 总被引用量达973,655次 近五年引用量698,008次[1][3] - 排名基于AD Scientific Index平台 涵盖全球2,626,749名科学家 涉及221个国家地区24,576家机构[3] - Bengio的生成对抗网络论文引用量突破100,904次 深度学习论文引用量达100,061次[3] 人工智能领域核心研究者表现 - Geoffrey Hinton排名第二 总被引量952,643次 近五年引用577,970次 占比60.7%[4][6] - Hinton参与的AlexNet论文引用量高达182,853次 标志着深度学习在计算机视觉领域的突破[4][5] - 何恺明排名第五 总被引量735,881次 近五年引用619,578次 ResNet论文引用量达290,239次[8][10] - ResNet被Nature评为21世纪被引量最多论文 引用范围在103,756-254,074次之间[10][11] 跨学科高影响力研究者 - 医学领域Ahmedin Jemal排名第三 总被引量924,788次 近五年引用520,211次 占比56.3%[8] - 数学与生物学交叉领域Eric Lander排名第四 总被引量737,656次 近五年引用247,907次 占比33.6%[8] - Ilya Sutskever排名第七 总被引量671,834次 近五年引用504,890次 ImageNet论文引用量182,853次[11][14][15] 高影响力论文特征分析 - 顶级论文持续产生深远影响 如AlexNet(2012年)和ResNet(2016年)至今仍被广泛引用[5][10] - 计算机视觉领域论文占据主导地位 前10名中包括多篇图像识别和神经网络相关研究[10][11] - 生成对抗网络和注意力机制等基础架构论文引用量显著 如Attention Is All You Need引用范围56,201-150,832次[11][15]
科学界论文高引第一人易主!AI站上历史巅峰
量子位· 2025-08-25 13:54
Yoshua Bengio学术成就 - Yoshua Bengio成为各领域被引用次数最多的在世科学家 总引用量超过95万次[1][4] - 2018年与Geoffrey Hinton、Yann LeCun共同获得图灵奖 表彰深度神经网络突破性贡献[4][12] - 三篇核心论文引用量极高:2014年GAN论文引用100,904次 2015年《Deep learning》引用100,061次 2016年深度学习著作引用81,400次[16][17] 关键学术贡献 - 2003年发表《一种神经概率语言模型》 解决语言建模维度灾难问题 为GPT等大语言模型奠定基础[4][14] - 2014年作为共同作者提出生成对抗网络(GAN) 推动计算机视觉领域发展[4][16] - 在注意力机制、循环神经网络、词嵌入等方向做出开创性工作 影响机器翻译与自然语言处理发展[13][16] 学术背景与职业轨迹 - 1986-1991年于麦吉尔大学完成计算机科学本硕博 师从Geoffrey Hinton[10] - 曾在MIT与贝尔实验室从事研究 期间与Yann LeCun开展合作[10] - 1993年起任职蒙特利尔大学 现任蒙特利尔学习算法研究所(MILA)所长[11] 行业影响力与创业动态 - 2024年6月成立非营利组织LawZero 已筹集3000万美元启动资金 专注于AI系统透明度与安全性研究[19][20] - 其弟Samy Bengio现任苹果公司AI与机器学习研究高级总监[9] - 深度学习研究成果直接推动自然语言处理与计算机视觉技术商业化应用[4][16] 学术引用排名格局 - Geoffrey Hinton以94万次总引用量位列第二 与Bengio差距微弱[21] - 何恺明以73万次引用量排名第五 Ilya Sutskever以67万次引用量排名第七[24] - AD Scientific Index覆盖全球260万科研人员 数据每20天更新一次 排名每2天重新计算[23]
地平线HSD量产在即:国内最像特斯拉FSD的辅助驾驶系统,定义行业新高度
IPO早知道· 2025-08-25 11:39
产品与技术优势 - 地平线发布高性能城区辅助驾驶产品HSD,基于征程6P打造一段式端到端系统,实现光子输入到轨迹输出的超低时延,提升安全、效率和舒适性 [3] - HSD被誉为国内最像特斯拉FSD的系统,覆盖城区、高速、乡间小路、停车场等场景,支持复杂道路拓扑下的精准感知和流畅通行 [3] - 征程6P算力高达560TOPS,具备高集成度、高算力、高效率、高处理能力、高接入能力及高安全六大特点 [8] - 地平线采用"一段式端到端+强化学习"架构,通过自我探索激发模型潜力,实现智能涌现 [8] - 公司已建立超3万个场景数据集的安全测试场景库,完成超1000万公里大里程回灌,并获得全球首张ISO 8800 AI功能安全认证 [10] 市场进展与商业成果 - HSD已与全球近10家汽车品牌达成合作意向,首搭奇瑞星途星纪元E05车型并即将量产 [3] - 截至今年一季度末,地平线前装量产出货超800万套,量产上市车型超200个,量产定点车型超310个 [16] - 征程家族累计量产即将突破1000万套,将成为国内首家达成千万套出货量的企业 [16] - 高阶辅助驾驶市场快速增长,今年前5个月中国乘用车城区NOA交付量达90.22万辆,同比增长152.5% [5] 发展战略与行业定位 - 公司坚持"软硬一体"战略,十年间推出三代BPU架构,计算性能提升超1000倍,支持超10款计算方案规模化量产 [19] - 2023年发布端到端自动驾驶大模型UniAD并获CVPR最佳论文,2024年推出Vision Mamba模型超越Vision Transformer [20] - 地平线是国内唯一具备"软硬全栈+大规模落地经验+开放生态"的智驾科技企业,有望通过HSD成为高阶辅助驾驶市场顶级玩家 [23] - 公司强调"以快打慢"的竞争策略,认为技术创新速度和产品质量是维持市场领导地位的核心 [15][21] 技术演进与行业趋势 - 城区辅助驾驶经历从规则系统到混合系统,再到端到端技术的突破,实现性能体验跃迁和安全性的显著提升 [7] - 端到端技术突破使城区辅助驾驶上限大幅提高,带来系统能力和心理安全性的双重提升 [7] - 行业正从技术验证阶段迈向大规模普及阶段,地平线通过持续技术迭代保持竞争优势 [5][16]
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心· 2025-08-24 12:02
大模型技术发展推动AI专用芯片需求 - 大模型技术进步显著提升对AI专用芯片的关注度 专用芯片在计算任务负载中效率更高 谷歌TPU自2015年部署后已迭代至第7代 采用最先进制程工艺并针对机器学习推理任务优化架构[1] - TPU技术推动Gemini等大模型发展 加拿大西安大略大学团队基于学术研究目的开发开源TinyTPU芯片 支持机器学习推理和训练功能[1] TinyTPU开发动机与设计理念 - 项目初衷包括构建机器学习负载芯片的实践吸引力 以及填补同时支持推理和训练的开源加速器代码库空白[5] - 团队采用"Hacky Way"设计理念 优先尝试自主方案而非依赖逆向工程或AI代码生成工具 强调基础原理推导和硬件设计学习[6] - 开发过程注重深度学习算法与硬件设计的结合 通过图形化表达强化理解[6] TPU技术原理与架构特性 - TPU作为专用集成电路(ASIC)专注于提升机器学习推理和训练速度 与通用GPU相比在数学运算效率上具有显著优势[9] - 核心采用脉动阵列结构 由处理单元(PE)网格组成 每个PE执行乘累加运算 在时钟周期内同步处理数据[26][28] - 矩阵乘法占Transformer计算操作的80-90% 在超大型模型中达95% 占CNN计算操作的70-80% 脉动阵列专门优化此类运算[14] TinyTPU实现方案与技术细节 - 选择XOR问题作为验证场景 使用2x2脉动阵列(而非TPUv1的256x256) 输入为4x2矩阵代表4种二进制组合[18][21][23] - 采用权重平稳架构 通过矩阵旋转90度 输入交错延迟和权重转置实现数据对齐[35][38][44] - 集成偏差模块和LeakyReLU激活函数(泄漏因子α=0.5) 采用流水线技术将操作分解为多时钟周期以提升效率[50][52][58] - 创新性引入双倍缓冲机制 通过影子缓冲区预加载权重 减少50%时钟周期 支持持续推理[61][64] - 控制单元采用24位指令集(ISA)实现标志控制和数据加载 后期扩展至94位指令集以满足训练需求[68][117] 训练功能实现与优化 - 支持反向传播训练 使用均方误差(MSE)作为损失函数 通过链式法则计算梯度[71][74][75] - 发现前向传播与反向传播的数学对称性:前向使用转置权重矩阵相乘 反向使用未转置矩阵相乘[79][108] - 开发向量处理单元(VPU)统一处理逐元素操作 整合偏差 激活 损失和梯度计算模块[89][92] - 设计统一缓冲区(UB)模块存储激活值 权重和临时数据 配备双读写端口减少数据争用[97][98] - 对激活导数模块实施缓存优化 减少统一缓冲区访问次数[102][104] 性能验证与实际应用 - 通过GTKWave波形模拟验证权重更新功能 展示一个训练周期后参数变化[119] - 完整架构支持持续数据流处理 最大化脉动阵列利用率 实现推理和训练的硬件级协同[118]