Workflow
深度学习
icon
搜索文档
陶朗食品双AI解决方案国内首秀,水果分选进入双AI时刻
中国食品网· 2025-08-26 14:48
产品技术展示 - 公司携两款双AI光学分选分级平台Spectrim搭载LUCAi™与InVision²搭载LUCAi™亮相2025中国国际水果展和亚洲国际果蔬展览会 这是双AI分选分级平台首次在中国境内同台展出 [1] - LUCAi™人工智能引擎基于深度学习技术 通过超过250000张数据图片驱动数据库 精准识别水果的各类瑕疵 包括蓝莓的疤痕 发霉 发软 皱缩 开裂等 [2] - 双AI系统突破水果复杂瑕疵识别瓶颈 可识别传统机器学习难以处理的轻度腐烂 日灼伤 软果 剪切损伤 果窝缺陷等 [2] - AI系统依赖全球不同地区20多个果季采集的水果图像训练数据 LUCAi™引擎每秒可处理多达40000张图像 能分辨细微缺陷差异并量化严重程度 [3] - Spectrim搭载LUCAi™支持苹果 柑橘 猕猴桃 核果等水果分选 InVision²搭载LUCAi™支持樱桃等小果分选 [4] 技术优势与行业影响 - 双AI分选平台剔除人工分选主观偏差 挖掘传统技术无法触及的品质细节 重新定义水果的"智"与"质" [3] - 技术为水果从采摘到上市提供精准品质坐标 保障消费者获得更可靠产品 为生产者创造更高附加值空间 [3] - 推动行业进入"品质可控 价值可知"的新生态 [3] - 展会现场搭建沉浸式体验区 展示双AI系统对苹果 柑橘 猕猴桃等多品类水果的精准瑕疵辨别与实时决策能力 [4] 中国市场战略 - 公司持续深化对中国市场的本土化布局 构建完整本地服务体系 提供从技术设备落地到产业升级的赋能方案 [5] - 已建成区域总部 制造基地 供应链中心及技术测试中心 形成覆盖研发 生产 服务的全链条布局 [5] - 本土化网络显著缩短设备交付与技术支持响应时间 确保客户获得24小时本地化运维保障 [5] - 人工智能分选系统通过采集本地化数据进行算法升级和智能学习 有效筛选地方特色瑕疵 保障果品品质 [5] - 采用"以本地数据训练全球算法"模式 使分选效果更贴合中国果品实际品质需求 [5] - 中国是全球最大水果生产与消费国 公司以双AI解决方案为支点 助力客户抢占高附加值市场 践行"在中国 为中国"战略 [5]
让东北老铁人人都能当周杰伦
虎嗅APP· 2025-08-25 21:34
AI音乐行业发展历程 - 1938年贝尔实验室成功建造第一台电子语音合成器Voder 标志着AI与音频首次结缘[7] - 1957年通过算法生成人类历史上第一支计算机创作音乐作品《Illiac Suite》[7] - 2016年谷歌推出音乐生成项目Magenta 利用深度学习框架展示AI音乐生成能力[7] - 2024年Suno实现歌词 人声 伴奏等音乐内容一次性AI生成 被称为音乐界ChatGPT[9] 音潮公司核心战略 - 致力于实现音乐平权 让每个人都能用音乐记录生活 类比短视频平权塑造快手抖音的逻辑[10][35] - 通过自研音乐大模型技术 打造端到端生成能力 已建立国内最大音乐数据标注库[32][54] - 采用B端开放API接口与C端按首收费双轨模式 提供免费创作额度与IP收益分成机制[52][53] - 产品迭代周期为移动端三周一次 网页端双周一次 持续增加激发用户创作热情的功能[39][48] 技术突破与行业影响 - 2016年深度学习技术突破解决人声与伴奏分离行业痛点 分离效果异常干净[7][12] - Transformer架构大模型出现推动行业质变 千万级训练数据触发智力涌现现象[9][36] - 国内AI音乐研究人员屈指可数 资源有限导致领域封闭 仅少数高校培养相关人才[14] - 采用国产芯片降低训练推理成本 通过训推一体动态调度实现性价比优化[49] 市场竞争与差异化 - 与Suno形成差异化服务 聚焦MV配乐 YouTube版权音乐等垂直场景[60] - 面对Eleven Labs等国际竞争对手 采取API 创作工具 消费平台 IP衍生服务多维布局[61] - 产品设计融合游戏化社交元素 开发音果混合创作 音缘社交关系等独特功能[45] - 锁定学生群体作为核心用户 通过高频使用与新鲜事物接受度实现破圈传播[46] 团队构建与数据壁垒 - 核心团队包含音乐学院背景人才 算法团队可组成乐团 具备跨学科协同优势[40][62] - 与上海音乐学院建立联合实验室 由数十名学生参与构建音乐数据标注库[54] - 通过用户共创形成数据飞轮 用户花费时间越多则资产增值效应越显著[55] - 产品刚上线即获数十万注册量 通过世界人工智能大会等渠道实现推广[68]
超97万:Yoshua Bengio成历史被引用最高学者,何恺明进总榜前五
机器之心· 2025-08-25 14:08
全球顶尖科学家学术影响力排名 - Yoshua Bengio成为全球被引用次数最多的科学家 总被引用量达973,655次 近五年引用量698,008次[1][3] - 排名基于AD Scientific Index平台 涵盖全球2,626,749名科学家 涉及221个国家地区24,576家机构[3] - Bengio的生成对抗网络论文引用量突破100,904次 深度学习论文引用量达100,061次[3] 人工智能领域核心研究者表现 - Geoffrey Hinton排名第二 总被引量952,643次 近五年引用577,970次 占比60.7%[4][6] - Hinton参与的AlexNet论文引用量高达182,853次 标志着深度学习在计算机视觉领域的突破[4][5] - 何恺明排名第五 总被引量735,881次 近五年引用619,578次 ResNet论文引用量达290,239次[8][10] - ResNet被Nature评为21世纪被引量最多论文 引用范围在103,756-254,074次之间[10][11] 跨学科高影响力研究者 - 医学领域Ahmedin Jemal排名第三 总被引量924,788次 近五年引用520,211次 占比56.3%[8] - 数学与生物学交叉领域Eric Lander排名第四 总被引量737,656次 近五年引用247,907次 占比33.6%[8] - Ilya Sutskever排名第七 总被引量671,834次 近五年引用504,890次 ImageNet论文引用量182,853次[11][14][15] 高影响力论文特征分析 - 顶级论文持续产生深远影响 如AlexNet(2012年)和ResNet(2016年)至今仍被广泛引用[5][10] - 计算机视觉领域论文占据主导地位 前10名中包括多篇图像识别和神经网络相关研究[10][11] - 生成对抗网络和注意力机制等基础架构论文引用量显著 如Attention Is All You Need引用范围56,201-150,832次[11][15]
科学界论文高引第一人易主!AI站上历史巅峰
量子位· 2025-08-25 13:54
Yoshua Bengio学术成就 - Yoshua Bengio成为各领域被引用次数最多的在世科学家 总引用量超过95万次[1][4] - 2018年与Geoffrey Hinton、Yann LeCun共同获得图灵奖 表彰深度神经网络突破性贡献[4][12] - 三篇核心论文引用量极高:2014年GAN论文引用100,904次 2015年《Deep learning》引用100,061次 2016年深度学习著作引用81,400次[16][17] 关键学术贡献 - 2003年发表《一种神经概率语言模型》 解决语言建模维度灾难问题 为GPT等大语言模型奠定基础[4][14] - 2014年作为共同作者提出生成对抗网络(GAN) 推动计算机视觉领域发展[4][16] - 在注意力机制、循环神经网络、词嵌入等方向做出开创性工作 影响机器翻译与自然语言处理发展[13][16] 学术背景与职业轨迹 - 1986-1991年于麦吉尔大学完成计算机科学本硕博 师从Geoffrey Hinton[10] - 曾在MIT与贝尔实验室从事研究 期间与Yann LeCun开展合作[10] - 1993年起任职蒙特利尔大学 现任蒙特利尔学习算法研究所(MILA)所长[11] 行业影响力与创业动态 - 2024年6月成立非营利组织LawZero 已筹集3000万美元启动资金 专注于AI系统透明度与安全性研究[19][20] - 其弟Samy Bengio现任苹果公司AI与机器学习研究高级总监[9] - 深度学习研究成果直接推动自然语言处理与计算机视觉技术商业化应用[4][16] 学术引用排名格局 - Geoffrey Hinton以94万次总引用量位列第二 与Bengio差距微弱[21] - 何恺明以73万次引用量排名第五 Ilya Sutskever以67万次引用量排名第七[24] - AD Scientific Index覆盖全球260万科研人员 数据每20天更新一次 排名每2天重新计算[23]
地平线HSD量产在即:国内最像特斯拉FSD的辅助驾驶系统,定义行业新高度
IPO早知道· 2025-08-25 11:39
产品与技术优势 - 地平线发布高性能城区辅助驾驶产品HSD,基于征程6P打造一段式端到端系统,实现光子输入到轨迹输出的超低时延,提升安全、效率和舒适性 [3] - HSD被誉为国内最像特斯拉FSD的系统,覆盖城区、高速、乡间小路、停车场等场景,支持复杂道路拓扑下的精准感知和流畅通行 [3] - 征程6P算力高达560TOPS,具备高集成度、高算力、高效率、高处理能力、高接入能力及高安全六大特点 [8] - 地平线采用"一段式端到端+强化学习"架构,通过自我探索激发模型潜力,实现智能涌现 [8] - 公司已建立超3万个场景数据集的安全测试场景库,完成超1000万公里大里程回灌,并获得全球首张ISO 8800 AI功能安全认证 [10] 市场进展与商业成果 - HSD已与全球近10家汽车品牌达成合作意向,首搭奇瑞星途星纪元E05车型并即将量产 [3] - 截至今年一季度末,地平线前装量产出货超800万套,量产上市车型超200个,量产定点车型超310个 [16] - 征程家族累计量产即将突破1000万套,将成为国内首家达成千万套出货量的企业 [16] - 高阶辅助驾驶市场快速增长,今年前5个月中国乘用车城区NOA交付量达90.22万辆,同比增长152.5% [5] 发展战略与行业定位 - 公司坚持"软硬一体"战略,十年间推出三代BPU架构,计算性能提升超1000倍,支持超10款计算方案规模化量产 [19] - 2023年发布端到端自动驾驶大模型UniAD并获CVPR最佳论文,2024年推出Vision Mamba模型超越Vision Transformer [20] - 地平线是国内唯一具备"软硬全栈+大规模落地经验+开放生态"的智驾科技企业,有望通过HSD成为高阶辅助驾驶市场顶级玩家 [23] - 公司强调"以快打慢"的竞争策略,认为技术创新速度和产品质量是维持市场领导地位的核心 [15][21] 技术演进与行业趋势 - 城区辅助驾驶经历从规则系统到混合系统,再到端到端技术的突破,实现性能体验跃迁和安全性的显著提升 [7] - 端到端技术突破使城区辅助驾驶上限大幅提高,带来系统能力和心理安全性的双重提升 [7] - 行业正从技术验证阶段迈向大规模普及阶段,地平线通过持续技术迭代保持竞争优势 [5][16]
三个月、零基础手搓一块TPU,能推理能训练,还是开源的
机器之心· 2025-08-24 12:02
大模型技术发展推动AI专用芯片需求 - 大模型技术进步显著提升对AI专用芯片的关注度 专用芯片在计算任务负载中效率更高 谷歌TPU自2015年部署后已迭代至第7代 采用最先进制程工艺并针对机器学习推理任务优化架构[1] - TPU技术推动Gemini等大模型发展 加拿大西安大略大学团队基于学术研究目的开发开源TinyTPU芯片 支持机器学习推理和训练功能[1] TinyTPU开发动机与设计理念 - 项目初衷包括构建机器学习负载芯片的实践吸引力 以及填补同时支持推理和训练的开源加速器代码库空白[5] - 团队采用"Hacky Way"设计理念 优先尝试自主方案而非依赖逆向工程或AI代码生成工具 强调基础原理推导和硬件设计学习[6] - 开发过程注重深度学习算法与硬件设计的结合 通过图形化表达强化理解[6] TPU技术原理与架构特性 - TPU作为专用集成电路(ASIC)专注于提升机器学习推理和训练速度 与通用GPU相比在数学运算效率上具有显著优势[9] - 核心采用脉动阵列结构 由处理单元(PE)网格组成 每个PE执行乘累加运算 在时钟周期内同步处理数据[26][28] - 矩阵乘法占Transformer计算操作的80-90% 在超大型模型中达95% 占CNN计算操作的70-80% 脉动阵列专门优化此类运算[14] TinyTPU实现方案与技术细节 - 选择XOR问题作为验证场景 使用2x2脉动阵列(而非TPUv1的256x256) 输入为4x2矩阵代表4种二进制组合[18][21][23] - 采用权重平稳架构 通过矩阵旋转90度 输入交错延迟和权重转置实现数据对齐[35][38][44] - 集成偏差模块和LeakyReLU激活函数(泄漏因子α=0.5) 采用流水线技术将操作分解为多时钟周期以提升效率[50][52][58] - 创新性引入双倍缓冲机制 通过影子缓冲区预加载权重 减少50%时钟周期 支持持续推理[61][64] - 控制单元采用24位指令集(ISA)实现标志控制和数据加载 后期扩展至94位指令集以满足训练需求[68][117] 训练功能实现与优化 - 支持反向传播训练 使用均方误差(MSE)作为损失函数 通过链式法则计算梯度[71][74][75] - 发现前向传播与反向传播的数学对称性:前向使用转置权重矩阵相乘 反向使用未转置矩阵相乘[79][108] - 开发向量处理单元(VPU)统一处理逐元素操作 整合偏差 激活 损失和梯度计算模块[89][92] - 设计统一缓冲区(UB)模块存储激活值 权重和临时数据 配备双读写端口减少数据争用[97][98] - 对激活导数模块实施缓存优化 减少统一缓冲区访问次数[102][104] 性能验证与实际应用 - 通过GTKWave波形模拟验证权重更新功能 展示一个训练周期后参数变化[119] - 完整架构支持持续数据流处理 最大化脉动阵列利用率 实现推理和训练的硬件级协同[118]
淘宝灰度测试“AI万能搜”新功能,电商搜索迎来变革
搜狐财经· 2025-08-22 09:24
淘宝AI搜索技术升级 - 公司推出"AI万能搜"新功能 目前处于灰度测试阶段 入口位于淘宝搜索激活页[3] - 该功能采用口语化交互模式 用户可通过日常对话式提问获取商品推荐 例如"适合职场新人的简约风格连衣裙"或"预算500元左右送父亲的实用礼物"[3] - 系统基于AI技术理解语义和场景需求 生成包含商品链接、测评视频、选购指南的多维答案报告 覆盖购物攻略、口碑对比、优惠信息等全链路消费需求[3] 技术实现与功能特性 - 功能依托阿里云通义大模型技术能力 结合淘宝海量商品数据与用户行为洞察 具备强大语义理解、意图识别和内容生成能力[4] - 系统能自动拆解预算、场景、人群、偏好等需求维度 例如输入"如何选择手机"时自动解析性价比、预算区间、续航能力等核心维度[4] - 具备"购物偏好"功能 采用协同过滤算法参考用户偏好 使AI既拥有产品知识又了解用户品味[4] 用户体验优化 - 结果页面提供AI提炼的核心选购标准、针对性避坑提醒及搭配建议[4] - 若用户对结果不满意 系统会引导细化需求 提供"按品牌筛选"或"对比同价位机型"等二次提问选项[4] - 对于"适合小户型的高性价比空调"类查询 除推荐机型外还提供安装注意事项、能效对比、用户评价摘要及使用效果短视频[4] 技术细节待明确 - 尚未明确是否使用DeepSeek等其他模型 以及搜索数据是基于商品详情还是种草笔记[5]
深度学习与转债定价:转债量化定价2.0
财通证券· 2025-08-20 09:47
报告行业投资评级 未提及 报告的核心观点 - 深度学习或能对转债定价,基于万能近似定理,若转债定价存在解析解,神经网络模型可拟合结果 [2][5] - 设计多层感知机模型(MLP),通过多层非线性变换学习定价模型,添加 11 种因子非线性拟合定价特征 [2][5] - 模型收敛性好且外推泛化能力出色,对样本外数据有强解释能力 [2][8] - 结合 MC 模型和传统 BS 模型,三个模型可在多场景辅助投资活动 [2][13] - 神经网络模型显示当前市场定价有高估,但仍有上行空间 [2][13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好 [2][16] - 模型在下修定价方面有较好效果 [2][19] 根据相关目录分别进行总结 深度学习定价模型的思路与设计 - 参考 BS 公式,中国可转债是复杂期权,可能存在复杂定价公式,基于万能近似定理,神经网络模型可拟合定价结果 [5] - 设计 MLP 模型,建立有限隐藏层,通过多层非线性变换学习定价模型,添加 11 种因子拟合定价特征 [5] - 模型收敛性好且外推泛化能力出色,选择 2022 - 2023 年因子数据训练和测试,剔除异常数据,第 100 轮迭代误差收敛,对 2024 - 1Q2025 数据解释能力强 [8] - 与 BS 公式和 MC 模型相比,MLP 模型定价效果更强,拟合市场整体转债价格平均值和所有转债价格时误差更小、稳定性更强 [10] - MLP 模型批量计算定价结果速度快,考虑转债特性和市场环境,定价更贴近实际,但存在不可解释性和需大量历史数据训练的问题 [11] 转债量化定价 2.0——模型有哪些应用? - 结合 MC 模型和传统 BS 模型,三个模型可在新券定价、市场解释、条款定价等场景辅助投资 [13] - 神经网络模型显示当前市场定价有高估,但截至 2025 年 8 月 15 日,市场价格中位数估值高估幅度不大,转债估值虽在高位但仍有上行空间 [13] - MLP 和 MC 模型在新券定价上“高低搭配”,MC 适合大额高评级转债,MLP 对常规转债效果好,超 50% 转债上市价格在 MC - MLP 框定区间,2024 年 11 月后超 80% 被捕捉 [16] - 模型在下修定价方面有较好效果,2025 年一季度多数转债提议下修第二个交易日价格能被 MLP 预测价格区间框定或接近上下沿 [19]
每经热评丨人形机器人运动会启示:前沿技术走向大众需要催化剂
每日经济新闻· 2025-08-19 23:07
技术层面 - 全球首个人形机器人运动会在北京举行 来自16个国家280支队伍500余台机器人参与26个大项538个小项竞技 [1] - 人形机器人以人工智能和深度学习为内核 具备自主决策和自适应能力 实现感知行动与认知融合 [1] - 运动会在真实竞技环境中检验传感器识别 运动控制 路径规划等综合能力 暴露技术缺陷并提供改进方向 [1] 产业层面 - 运动会吸引192支高校赛队和88支企业赛队 包括天工 宇树科技 加速进化等头部整机企业 [2] - 赛事考验算法数据质量 硬件供应链稳定性到运维响应速度的整个生态系统成熟度 [2] - 亦庄人形机器人马拉松赛事后松延动力N2机器人产品获得超过2000台订单 [2] 社会影响层面 - 运动会搭建公众与前沿科技沟通桥梁 通过竞技形式让公众直观理解机器人能力 [3] - 赛事荣誉体系和竞争氛围为青年人才提供展示舞台 激励投身机器人科研领域 [3] - 竞技活动推动技术融合与突破 促进前沿技术从实验室走向大众市场 [3]
图灵奖得主杨立昆沉寂数月后发声:AI安全是工程问题,不必恐慌“失控”
36氪· 2025-08-19 10:50
划重点: 2025年7月1日,Meta正式宣布成立 Meta超级智能实验室(Meta Superintelligence Labs),以加速通用人工智能(AGI)的研发进程。在 这一重组过程中,马克·扎克伯格展现出对AI顶尖人才的强烈渴求,他主导的一系列高调挖角行动迅速震动了整个科技行业。然而,在此 过程中,长期担任Meta基础AI研究实验室(FAIR)首席科学家的杨立昆(Yann LeCun)却逐渐被"边缘化",淡出了公众视野。 自2023年夏季以来,Llama模型家族已被下载约8亿次,这个数字令人震惊。 让AI的行为与人类价值观保持一致,更像是一个工程与设计问题,就像当年通过工程手段让喷气式飞机安全飞行一 样。 杨立昆提出"目标驱动架构",核心思路是为系统设定清晰的目标和必要的安全边界,使其在既定范围内执行任务。 AI可能像15世纪的印刷术一样,引发一场新的文艺复兴,放大人类智慧。 年轻人不要被负面的、耸人听闻的故事吓倒;要认识到自己的力量,主动塑造自己想要的未来。 沉寂数月后,这位被誉为"人工智能教父"之一的科学家,在法国巴黎接受一位人工智能专家(也是硅谷一家初创公司的联合创始人、首 席技术官)——芭芭 ...