Workflow
计算机视觉
icon
搜索文档
可实时预警岩体微小变化!深大团队研发地质灾害防治系统
南方都市报· 2025-10-21 15:57
突破传统监测困境 据了解,地质灾害传统监测手段主要依赖埋设传感器和人工巡查,存在明显局限性。"传统方法如同'守 株待兔'。"黄惠比喻说:"传感器只能监测预设点位,无法覆盖整个风险区域;人工巡查则受限于天 气、地形,很多危险区域根本无法到达。" 针对这一难题,黄惠教授团队依托国家重点研发计划等多项重大科研项目,创新性地提出了核心图形信 息"云-边-端"协同处理技术,构建了一整套高效优化算子,实现了从"点式监测"到"体式防控"的跨越。 该系统基于计算机图形学、计算机视觉与深度学习相结合的智能监测方法,通过三个关键技术层面实现 突破:在运动检测方面,可有效捕捉监测区域的异常运动;在目标识别方面,对落石事件的识别准确率 超过85%;在精准测量方面,实现了对目标位移的高精度测量。 南都讯 记者伍曼娜 近日,深圳大学计算机与软件学院院长黄惠教授团队成功研发出新一代地质灾害智 能监测系统,该系统通过融合计算机视觉、深度学习与云边端协同技术,实现了对边坡落石、危岩移动 等地质灾害的全天候、全覆盖、智能化监测,彻底改变了传统"点式监测"的落后模式。 智能识别与精准测量 实现全天候值守 应用前景广阔 据了解,这套系统已在多个场景 ...
苹果盯上Prompt AI,不是买产品,是要伯克利团队的“视觉大脑”
36氪· 2025-10-14 08:59
收购交易概况 - 苹果公司正与计算机视觉初创企业Prompt AI进行收购事宜的“最后阶段谈判”[1] - 交易聚焦Prompt AI的核心技术与核心团队,若达成将成为苹果自2014年以30亿美元收购Beats Electronics后在AI领域的标志性动作[3] - 此次收购是硅谷巨头“人才收购”热潮的典型案例[3] 目标公司基本情况 - Prompt AI成立于2023年,员工数量仅11人[4] - 公司在2023年完成由AIX和Abstract Ventures联合领投的500万美元种子轮融资(约合3565.7万元人民币)[5] - 核心产品Seemour应用因商业模式未达预期计划下线,所有用户数据将被清除以保障隐私[7] - 本次收购对投资人只能收回部分资金,无法全额回本;部分未能加入苹果的员工将获得补偿并可申请苹果其他岗位[7] 技术价值与生态适配 - Seemour应用具备与家庭安防摄像头连接的三大核心功能:精准识别(区分人物/宠物/物体)、场景描述(生成文字说明并回答自然语言问题)、隐私保护(本地设备处理数据)[8] - 技术高度契合苹果HomeKit智能家居生态短板,并与苹果“端侧AI”“隐私优先”战略一致[8] - 底层“环境实时感知”和“空间场景解析”技术可支撑苹果AI智能眼镜研发与自动驾驶路况判断需求[8] 苹果收购策略分析 - 苹果收购偏好“谨慎又聚焦”,最大并购案仍为2014年30亿美元收购Beats[9] - 历史上多次进行“小而精”团队收购,如2011年5亿美元收购Anobit(提升存储性能)、2012年3.56亿美元收购AuthenTec(推出Touch ID)、2013年3.6亿美元收购PrimeSense(用于Face ID)[10] - 2020年收购WaveOne(视频压缩)和Lattice Data(数据可视化)等技术团队均整合至iPhone、Apple Watch等核心产品[10] - 与Meta用143亿美元收购Scale AI、谷歌用24亿美元拿下Windsurf相比,苹果倾向低调收购小型团队以快速融入产品线,规避监管与整合风险[7] 行业竞争与战略动机 - 苹果在AI领域感到“紧迫”,去年6月推出的“Apple智能”系列功能市场反响平平,需通过收购追赶Meta、谷歌等对手在计算机视觉领域的优势[11] - “人才收购”可实现低成本快速补能力,Prompt AI团队拥有加州大学伯克利分校博士及伯克利人工智能研究实验室背景,收购可缩短研发周期并避免团队磨合问题[11][13] - 硅谷巨头普遍采用“人才收购”模式,Meta收Scale AI、谷歌收Windsurf均以获取核心团队为目标,苹果策略更侧重“小而美+精准适配”自身生态(如HomeKit、AR、自动驾驶)[14] 潜在行业影响 - 若收购成功,可能成为苹果AI战略布局的“重要转折点”[15] - 反映AI竞争从“技术堆砌”转向“生态适配”,巨头更关注技术能否融入现有产品体系并解决用户真实需求[15] - 提示初创公司在AI赛道应聚焦细分领域“精准技术突破”,而非追求“大而全的商业模式”[15]
ImageNet作者苏昊被曝任教复旦
量子位· 2025-10-10 11:52
文章核心观点 - 核心观点为华人学者苏昊(Hao Su)可能从加州大学圣地亚哥分校(UCSD)转赴复旦大学任教,此消息尚未得到官方确认 [1][12][51] - 苏昊是人工智能领域,特别是计算机视觉与具身智能方向的顶尖学者,是ImageNet、ShapeNet、PointNet等多个奠基性项目的核心贡献者 [4][14][24][29][32] - 其职业动向与复旦大学在具身智能领域的战略布局(如成立可信具身智能研究院)相关联,可能预示着中国在AI前沿领域的投入与人才吸引力的提升 [51][52][55] 苏昊的学术背景与成就 - 苏昊现任加州大学圣地亚哥分校计算机科学学院副教授、具身智能实验室主任,并于2023年获得晋升 [14][49] - 其研究历程经历了从自然语言处理到2D计算机视觉,再到3D视觉,最终聚焦于具身智能与机器人的演进 [20][21][22][28][34] - 他是多个里程碑式项目的关键人物:参与ImageNet数据集工作 [24]、主导创建大规模3D数据集ShapeNet(包含超过300万个3D CAD模型,覆盖3135个类别) [29][30]、共同提出PointNet(被引21,737次)和PointNet++(被引16,103次)模型 [32][33]、发布PartNet数据集 [33]、开发机器人模拟器SAPIEN和仿真平台ManiSkill [35][37] - 2024年,他与谢赛宁共同获得CVPR青年学者奖 [5] 苏昊的创业实践:Hillbot - 苏昊于2024年联合创办具身智能公司Hillbot并担任首席技术官 [43] - 公司核心技术产品包括Sapien仿真器和ManiSkill机器人仿真训练平台,专注于通过模拟和3D生成技术解决机器人领域数据采集成本高的问题 [42][45] - 公司已推出轮式机器人Hillbot Alpha,应用于零售店、咖啡馆和制造车间等复杂环境的移动操纵任务 [45] - 在技术合作上,Hillbot与英伟达合作,利用Nvidia Cosmos平台生成高仿真视频训练数据 [47] - 公司已获得Cherubic Ventures的投资 [48] 复旦大学在具身智能领域的布局 - 复旦大学于2024年1月成立了可信具身智能研究院,为吸引顶尖人才提供了具有竞争力的薪酬条件(基本薪资60万到100万,绩效上不封顶) [55] - 有传闻称复旦大学可能投资苏昊创办的Hillbot公司,并且苏昊可能成为相辉研究院、学敏高等研究院的双聘对象 [52] - 目前该研究院的领导职务(如院长)尚未正式公布,被解读为可能为引进资深学者预留位置 [57]
算法小垃圾跳槽日记 2024&2025版
自动驾驶之心· 2025-10-06 12:05
行业技术趋势 - 计算机视觉领域传统算法需求锐减,检测、分割等已被归类为传统算法,类似SVM、SIFT的地位 [8] - 市场需求高度集中于大模型、多模态、文生图/视频以及自动驾驶端到端大模型等前沿方向 [8] - 自动驾驶公司的感知岗位是计算机视觉领域内少数仍有需求的领域 [8] 企业招聘动态 - 2024年求职机会相比2021年显著增多,各大厂及知名中小厂均能提供较多面试机会 [8] - 面试流程密集,存在单日进行多达8场面试的情况,反映出招聘活动活跃 [4] - 企业招聘考核标准趋严,几乎所有公司都要求手写LeetCode代码题,高频题目包括实现NMS、MultiHeadSelfAttention、MLP的前向和反向、岛屿数量等 [9][11] 业务部门价值 - 公司中台部门业务价值受到质疑,缺乏自有业务,主要承接其他部门已深度优化的算法任务,难以形成系统性业务积累 [6] - 行业出现去中台化趋势,中台部门对求职者吸引力较低 [6] - 相比中台,拥有稳定业务的部门(如内容安全)更具吸引力 [6]
刚毕业的AI博士,滞销了
投资界· 2025-09-28 15:35
AI博士就业市场两极分化 - AI博士就业市场呈现残酷的两极分化,顶端人才被企业重金争抢,而绝大多数普通AI博士缺乏市场议价权[5] - 金字塔尖的应届AI博士综合年薪已突破200万元,并能获得远低于市场价的期权等额外福利,但这类人才需具备名校出身、重磅研究、竞赛大奖等标签[10] - 普通AI博士面临“大厂够不上,中厂养不起”的困境,大模型算法岗位招录比至少10:1,国企研究所招录比甚至高达200:1[8] 企业人才招聘策略 - 头部互联网公司推出专门人才计划(如字节跳动“Top Seed”、华为“天才少年”、阿里T-Star)争夺顶尖AI博士,提供科研自由、资源优先和百万年薪等基本条件[10] - 中小厂更注重用人性价比,期待高薪聘请的博士人才能直接匹配业务需求,不愿投入培养成本[9] - 企业因AI岗位高薪资和高试错成本,更倾向于通过熟人推荐方式招聘,业内存在导师或实验室负责人推荐学生/师弟师妹进入团队的现象[21][22] 学术研究与企业需求脱节 - 博士阶段需常年深耕单一领域,但企业当前聚焦通用大模型商业化,更需要整体优化模型的综合能力而非细分领域专长[18][19] - 学界研究成果与企业应用需求存在脱节,例如博士在学校的细分研究方向(如节省数据成本方法)在大厂充足算力资源下意义不大[18] - 企业需要博士人才直接贡献于变现,多数AI博士在实习期间主要工作是用现有模型微调产品功能,而非发挥专业特长[19][20] 学术发表体系压力 - AI顶会论文数量激增,AAAI今年接收近2.9万篇论文,几乎是去年的两倍,中国投稿占三分之二,而五年前AAAI-21仅接收9034篇[13] - 博士为达到就业门槛需“凑”论文,非热门研究方向博士需要更多论文加持,业界招聘实际要求往往高于公开标准(需5篇论文而非1-2篇)[12] - 评审系统因论文数量激增而跟不上,采用“众包”模式导致评审质量参差,常出现因跨领域研究匹配错误或评审不理解内容的情况[13][14] 个人求职困境案例 - 普通AI博士面临“泡池子”招聘现象,终面后等待十天半个月成为常态,最终因公司“钓到更大的鱼”而被拒[7] - 博士为提升竞争力采取“战术性延毕”策略,回校攒论文、补实习以应对严峻就业市场[22] - AI行业技术迭代快速(如从传统NLP算法到大模型),博士长期深耕方向与行业需求变化存在时间错配风险[22]
美睫机器人:嫁接睫毛又快又好
科技日报· 2025-09-18 08:17
技术应用 - 美睫机器人集成计算机视觉与人工智能技术实现自动化睫毛嫁接[1] - 机器人通过扫描眼部轮廓和面部肌肉微动作进行实时动态调整[1] - AI算法将睫毛嫁接位置误差控制在10微米以内的高精度水平[1] 服务效率 - 传统人工睫毛嫁接需耗时120分钟以上[1] - 美睫机器人将整个过程缩短至20分钟 效率提升83%[1] - 操作前需清洁睫毛并粘贴带引导条码的眼贴膜辅助定位[1] 行业变革 - 自动化技术正在改变传统美容服务行业的工作模式[1] - 计算机视觉技术为个性化美睫方案提供技术支持[1] - 机器人的应用显著提升了美容服务的标准化程度和操作精度[1]
苹果首款智能眼镜聚焦无屏设计 预计12至16个月内推出
环球网资讯· 2025-09-15 12:20
产品发布计划 - 公司计划在未来12至16个月内推出首款无显示屏智能眼镜产品 与Meta Ray-Bans形成直接竞争 [1] - 完整版智能眼镜需等待数年时间 主要受限于设备微型化与减重技术瓶颈 [3] - 分析师预测智能眼镜可能于2026年发布 不排除因技术优化推迟至2027年的可能性 [3] 产品技术特性 - 首款智能眼镜采用无屏设计 配备摄像头与具备播放录音功能的音频系统 [3] - 产品需连接iPhone实现数据处理 无法独立运行 [3] - 公司同步研发内置红外感应摄像头的AirPods 可检测用户环境并向iPhone及Apple Intelligence传输视频数据 [4] 生态系统优势 - 公司具备硬件与生态系统深度融合能力 可实现智能眼镜与iPhone无缝协同 [4] - 现有iPhone用户群体对生态产品认可度高 可能主动选择苹果智能眼镜 [4] - 竞争对手在推动智能眼镜与iPhone兼容时面临技术与适配难题 [4] 产品协同战略 - 配备摄像头的AirPods未来可与智能眼镜协同工作 通过多摄像头视角为Apple Intelligence提供更丰富数据支撑 [5] - 结合AirPods现有高品质音频单元与麦克风 整套系统音视频体验将进一步提升 [5] - 多角度拍摄与音频技术结合可能形成"1+1>2"的产品协同效应 [5]
复旦微电:FPGA系列产品的应用,尚未涉及向脑机接口领域开拓
格隆汇· 2025-09-12 17:29
业务布局 - FPGA芯片应用于通信 工业控制及高可靠领域[1] - 正在拓展计算机视觉 机器学习 高速数字处理等应用场景[1] - 当前应用未涉及脑机接口领域[1]
Diebold Nixdorf (NYSE:DBD) 2025 Conference Transcript
2025-09-11 01:32
**公司概况与核心市场** * 公司为Diebold Nixdorf (NYSE: DBD) 专注于银行和零售两大终端市场[6] * 银行市场拥有全球性业务 与所有全球性银行合作 核心是提供分支自动化解决方案 包括循环ATM、柜员现金循环机和软件套件 以提升银行分支效率 银行运营成本中60%为分支网络开支[6][7] * 零售市场在欧洲占据领先地位 为欧洲自助结账和POS终端第一名 但美国市场份额很小 当前战略重点是将欧洲成功经验复制到北美市场[7][8] **战略重点与增长机会** * 银行领域机会在于扩展服务能力和产品组合 以解决端到端现金生态系统 目标是通过硬件、软件和服务组合提升分支效率[6][8] * 零售领域机会在于扩张北美市场 通过AI驱动的防损解决方案(如减少盗窃)和计算机视觉技术(如生鲜产品识别、年龄验证)实现差异化[8][28][30] * 公司设定了三年战略计划目标 包括2027年实现中个位数收入增长、15%的EBITDA利润率(约6亿美元)以及超过60%的自由现金流转换(约3.75亿至4亿美元)[12] **财务表现与资本配置** * 已连续三个季度实现正自由现金流 2025年上半年表现强劲[10] * 产品毛利率从两年前的低双位数提升至中高20%范围 2025年第二季度达到28%(接近29%) 目标每年提升25-50个基点[18][48] * 服务毛利率为关键机会点 目前为26%(2024年底) 目标每年提升50-100个基点[48] * 资本配置优先考虑维持1.5倍净债务杠杆率(行业最佳资产负债表)和股票回购 已宣布1亿美元回购计划 第二季度回购3800万美元 剩余6200万美元[13] * 2025年自由现金流指引上限为2.1亿美元(40%转换率) 预计2026年达50% 2027年达60% 三年累计自由现金流目标为8亿美元[12][54] **运营效率与执行改进** * 通过精益生产和持续改进文化提升运营效率 欧洲供应链质量改善30% 准时交付提升25%[49] * 订单交付周期从超过180天缩短至60天 得益于本地化制造战略(德国服务欧洲、北美坎顿服务美洲、巴西服务南美等)[46] * 管理层强调"言出必行"文化 注重执行和问责制[11][17] **ATM业务与分支自动化** * 全球ATM数量约200万台 公司安装基数为80万台 已升级20-25万台至DN系列循环ATM 每年刷新6-7万台 设备寿命5-7年[32] * 95%以上的ATM销售附带服务合同 提供5-7年的稳定年金收入[33] * 分支自动化解决方案可自动化90%以上的人工交易 将单次交易成本从柜员的8美元降至自动化设备的1美元以下[36] * 软件连接物理分支和数字渠道 实现全渠道体验 银行收入60%以上来自服务[25] **零售市场扩张策略** * 目标客户为杂货商和一般商品零售商 针对40个大型账户开展试点 已有19个概念验证项目和6个试点进行中[27][39] * 利用欧洲成功客户(如H&M、IKEA、Aldi)作为基础 拓展北美客户[39] * 预计2025年第三季度零售业务将实现环比和同比增长 主要受美国扩张推动[40] **风险与缓解措施** * 关税影响约为500-1000万美元 通过本地化制造(如北美坎顿工厂全面生产ATM)和精益生产力抵消[52][53] * 需求可见性高 订单积压达9.8亿美元(为多年最高) 为2025年下半年提供90%以上可见度[46] **管理层与治理** * 高管薪酬与长期股东价值创造完全对齐 奖励与股价挂钩(65美元、75美元、95美元)[21] * 董事会大幅刷新 目前仅保留一名两年前的成员 注重改善治理和投资者透明度[19]
刚刚,李飞飞主讲的斯坦福经典CV课「2025 CS231n」免费可看了
机器之心· 2025-09-04 17:33
课程概述 - 斯坦福大学2025年春季《CS231n:深度学习与计算机视觉》课程正式上线,专注于深度学习架构细节及视觉识别任务[1] - 课程重点围绕图像分类、定位和检测等端到端模型学习,特别是图像分类领域[2] - 课程为期10周,学生将实现并训练神经网络,深入理解计算机视觉前沿研究[3] - 结业时学生可在真实世界视觉问题上训练和应用数百万参数的神经网络[4] - 通过实践作业和课程项目,学生掌握深度学习工具集及深度神经网络训练与微调的工程技巧[5] 讲师团队 - 李飞飞担任主讲人之一,为斯坦福教授、World Labs CEO,领导创建ImageNet项目并推动深度学习在计算机视觉领域的革命性突破,近期研究方向为空间智能与世界模型[6] - Ehsan Adeli为斯坦福大学精神病学与行为科学系及计算机科学系助理教授,研究方向包括计算机视觉、计算神经科学、医学影像分析等[6] - Justin Johnson为密歇根大学助理教授及FAIR研究科学家,研究兴趣包括视觉推理、图像生成和3D推理[6] - Zane Durante为斯坦福大学三年级博士生,导师为李飞飞和Ehsan Adeli,研究方向包括多模态视觉理解及人工智能在医疗健康中的应用[7] 课程资源 - 课程全部18个视频已在Youtube免费开放,第一和最后一堂课由李飞飞讲授[12] - Youtube播放列表包含18个视频,总观看次数达984次,其中第一讲观看次数为7410次,第二讲为1057次,第三讲为706次,第四讲为442次[12] - 视频地址为https://www.youtube.com/playlist?list=PLoROMvodv4rOmsNzYBMe0gJY2XS8AQg16[12] 课程内容目录 - 课程内容涵盖线性分类器图像分类、正则化与优化、神经网络与反向传播、卷积神经网络图像分类[16] - 包括卷积神经网络训练与架构、循环神经网络、注意力机制与Transformers、目标识别与图像分割[16] - 涉及视频理解、大规模分布式训练、自监督学习、生成式模型、3D视觉、视觉与语言、机器人学习及以人为中心的人工智能[16]