计算机视觉

搜索文档
美睫机器人:嫁接睫毛又快又好
科技日报· 2025-09-18 08:17
技术应用 - 美睫机器人集成计算机视觉与人工智能技术实现自动化睫毛嫁接[1] - 机器人通过扫描眼部轮廓和面部肌肉微动作进行实时动态调整[1] - AI算法将睫毛嫁接位置误差控制在10微米以内的高精度水平[1] 服务效率 - 传统人工睫毛嫁接需耗时120分钟以上[1] - 美睫机器人将整个过程缩短至20分钟 效率提升83%[1] - 操作前需清洁睫毛并粘贴带引导条码的眼贴膜辅助定位[1] 行业变革 - 自动化技术正在改变传统美容服务行业的工作模式[1] - 计算机视觉技术为个性化美睫方案提供技术支持[1] - 机器人的应用显著提升了美容服务的标准化程度和操作精度[1]
苹果首款智能眼镜聚焦无屏设计 预计12至16个月内推出
环球网资讯· 2025-09-15 12:20
产品发布计划 - 公司计划在未来12至16个月内推出首款无显示屏智能眼镜产品 与Meta Ray-Bans形成直接竞争 [1] - 完整版智能眼镜需等待数年时间 主要受限于设备微型化与减重技术瓶颈 [3] - 分析师预测智能眼镜可能于2026年发布 不排除因技术优化推迟至2027年的可能性 [3] 产品技术特性 - 首款智能眼镜采用无屏设计 配备摄像头与具备播放录音功能的音频系统 [3] - 产品需连接iPhone实现数据处理 无法独立运行 [3] - 公司同步研发内置红外感应摄像头的AirPods 可检测用户环境并向iPhone及Apple Intelligence传输视频数据 [4] 生态系统优势 - 公司具备硬件与生态系统深度融合能力 可实现智能眼镜与iPhone无缝协同 [4] - 现有iPhone用户群体对生态产品认可度高 可能主动选择苹果智能眼镜 [4] - 竞争对手在推动智能眼镜与iPhone兼容时面临技术与适配难题 [4] 产品协同战略 - 配备摄像头的AirPods未来可与智能眼镜协同工作 通过多摄像头视角为Apple Intelligence提供更丰富数据支撑 [5] - 结合AirPods现有高品质音频单元与麦克风 整套系统音视频体验将进一步提升 [5] - 多角度拍摄与音频技术结合可能形成"1+1>2"的产品协同效应 [5]
复旦微电:FPGA系列产品的应用,尚未涉及向脑机接口领域开拓
格隆汇· 2025-09-12 17:29
业务布局 - FPGA芯片应用于通信 工业控制及高可靠领域[1] - 正在拓展计算机视觉 机器学习 高速数字处理等应用场景[1] - 当前应用未涉及脑机接口领域[1]
Diebold Nixdorf (NYSE:DBD) 2025 Conference Transcript
2025-09-11 01:32
**公司概况与核心市场** * 公司为Diebold Nixdorf (NYSE: DBD) 专注于银行和零售两大终端市场[6] * 银行市场拥有全球性业务 与所有全球性银行合作 核心是提供分支自动化解决方案 包括循环ATM、柜员现金循环机和软件套件 以提升银行分支效率 银行运营成本中60%为分支网络开支[6][7] * 零售市场在欧洲占据领先地位 为欧洲自助结账和POS终端第一名 但美国市场份额很小 当前战略重点是将欧洲成功经验复制到北美市场[7][8] **战略重点与增长机会** * 银行领域机会在于扩展服务能力和产品组合 以解决端到端现金生态系统 目标是通过硬件、软件和服务组合提升分支效率[6][8] * 零售领域机会在于扩张北美市场 通过AI驱动的防损解决方案(如减少盗窃)和计算机视觉技术(如生鲜产品识别、年龄验证)实现差异化[8][28][30] * 公司设定了三年战略计划目标 包括2027年实现中个位数收入增长、15%的EBITDA利润率(约6亿美元)以及超过60%的自由现金流转换(约3.75亿至4亿美元)[12] **财务表现与资本配置** * 已连续三个季度实现正自由现金流 2025年上半年表现强劲[10] * 产品毛利率从两年前的低双位数提升至中高20%范围 2025年第二季度达到28%(接近29%) 目标每年提升25-50个基点[18][48] * 服务毛利率为关键机会点 目前为26%(2024年底) 目标每年提升50-100个基点[48] * 资本配置优先考虑维持1.5倍净债务杠杆率(行业最佳资产负债表)和股票回购 已宣布1亿美元回购计划 第二季度回购3800万美元 剩余6200万美元[13] * 2025年自由现金流指引上限为2.1亿美元(40%转换率) 预计2026年达50% 2027年达60% 三年累计自由现金流目标为8亿美元[12][54] **运营效率与执行改进** * 通过精益生产和持续改进文化提升运营效率 欧洲供应链质量改善30% 准时交付提升25%[49] * 订单交付周期从超过180天缩短至60天 得益于本地化制造战略(德国服务欧洲、北美坎顿服务美洲、巴西服务南美等)[46] * 管理层强调"言出必行"文化 注重执行和问责制[11][17] **ATM业务与分支自动化** * 全球ATM数量约200万台 公司安装基数为80万台 已升级20-25万台至DN系列循环ATM 每年刷新6-7万台 设备寿命5-7年[32] * 95%以上的ATM销售附带服务合同 提供5-7年的稳定年金收入[33] * 分支自动化解决方案可自动化90%以上的人工交易 将单次交易成本从柜员的8美元降至自动化设备的1美元以下[36] * 软件连接物理分支和数字渠道 实现全渠道体验 银行收入60%以上来自服务[25] **零售市场扩张策略** * 目标客户为杂货商和一般商品零售商 针对40个大型账户开展试点 已有19个概念验证项目和6个试点进行中[27][39] * 利用欧洲成功客户(如H&M、IKEA、Aldi)作为基础 拓展北美客户[39] * 预计2025年第三季度零售业务将实现环比和同比增长 主要受美国扩张推动[40] **风险与缓解措施** * 关税影响约为500-1000万美元 通过本地化制造(如北美坎顿工厂全面生产ATM)和精益生产力抵消[52][53] * 需求可见性高 订单积压达9.8亿美元(为多年最高) 为2025年下半年提供90%以上可见度[46] **管理层与治理** * 高管薪酬与长期股东价值创造完全对齐 奖励与股价挂钩(65美元、75美元、95美元)[21] * 董事会大幅刷新 目前仅保留一名两年前的成员 注重改善治理和投资者透明度[19]
刚刚,李飞飞主讲的斯坦福经典CV课「2025 CS231n」免费可看了
机器之心· 2025-09-04 17:33
课程概述 - 斯坦福大学2025年春季《CS231n:深度学习与计算机视觉》课程正式上线,专注于深度学习架构细节及视觉识别任务[1] - 课程重点围绕图像分类、定位和检测等端到端模型学习,特别是图像分类领域[2] - 课程为期10周,学生将实现并训练神经网络,深入理解计算机视觉前沿研究[3] - 结业时学生可在真实世界视觉问题上训练和应用数百万参数的神经网络[4] - 通过实践作业和课程项目,学生掌握深度学习工具集及深度神经网络训练与微调的工程技巧[5] 讲师团队 - 李飞飞担任主讲人之一,为斯坦福教授、World Labs CEO,领导创建ImageNet项目并推动深度学习在计算机视觉领域的革命性突破,近期研究方向为空间智能与世界模型[6] - Ehsan Adeli为斯坦福大学精神病学与行为科学系及计算机科学系助理教授,研究方向包括计算机视觉、计算神经科学、医学影像分析等[6] - Justin Johnson为密歇根大学助理教授及FAIR研究科学家,研究兴趣包括视觉推理、图像生成和3D推理[6] - Zane Durante为斯坦福大学三年级博士生,导师为李飞飞和Ehsan Adeli,研究方向包括多模态视觉理解及人工智能在医疗健康中的应用[7] 课程资源 - 课程全部18个视频已在Youtube免费开放,第一和最后一堂课由李飞飞讲授[12] - Youtube播放列表包含18个视频,总观看次数达984次,其中第一讲观看次数为7410次,第二讲为1057次,第三讲为706次,第四讲为442次[12] - 视频地址为https://www.youtube.com/playlist?list=PLoROMvodv4rOmsNzYBMe0gJY2XS8AQg16[12] 课程内容目录 - 课程内容涵盖线性分类器图像分类、正则化与优化、神经网络与反向传播、卷积神经网络图像分类[16] - 包括卷积神经网络训练与架构、循环神经网络、注意力机制与Transformers、目标识别与图像分割[16] - 涉及视频理解、大规模分布式训练、自监督学习、生成式模型、3D视觉、视觉与语言、机器人学习及以人为中心的人工智能[16]
计划2026年商业化应用!马斯克:特斯拉未来约80%价值将来自于Optimus擎天柱机器人【附人形机器人行业发展趋势】
前瞻网· 2025-09-02 19:00
公司战略与产品定位 - 特斯拉CEO埃隆·马斯克认为公司未来约80%的价值将来自Optimus擎天柱机器人 [2] - Optimus机器人被定位为"解放人类劳动"的核心载体 计划于2026年实现商业化应用 [2] - 机器人使命是改变人们对劳动的认知 帮助人们摆脱枯燥或危险的工作 [3] - 特斯拉预计Optimus将采用即将推出的AI5芯片 并依赖英伟达芯片训练FSD系统 [3] 市场前景与政策环境 - 2024年中国人形机器人市场规模约27.6亿元 [4] - 工信部指导意见明确到2027年产业实现规模化发展 成为重要经济增长新引擎 [4] - 前瞻产业研究院预计2030年全球人形机器人出货量将达到3.80万台 [5] - 人形机器人行业涵盖机械工程 电子技术 计算机科学和人工智能等多领域技术 [3] 技术发展与行业动态 - 人形机器人应用场景不断拓展 包括家庭服务 医疗护理 工业生产和教育娱乐 [3] - 全球多家科技巨头和初创公司积极推进人形机器人量产计划 [7] - 行业面临研发成本高 技术成熟度和市场接受度等挑战 [7] - 深度学习 自然语言处理和计算机视觉等技术突破推动行业发展 [3] 市场预期与风险因素 - 预测平台数据显示用户认为特斯拉Optimus在2027年前上市概率仅为40% [3]
2025年中国AI工业质检行业发展历程、产业链、市场规模、重点企业及未来趋势研判:AI工业质检市场规模快速增长,3C电子为最大应用领域[图]
产业信息网· 2025-08-30 09:02
AI工业质检行业概述 - AI工业质检基于AI视觉算法及相关硬件解决方案 对工业产品外观表面细粒度质量进行检测 实现缺陷自动识别与分类 [3] - 核心技术包括机器视觉与深度学习 替代传统人工目检 解决效率低下、标准不一、漏检率高等痛点 [1][13] - 主要应用于3C电子、汽车制造、新能源电池、半导体等精密制造领域 [1][13] 技术优势与特点 - 具备高效性、准确性、一致性、可迭代性及数据分析五大技术优势 [4][5] - 高效性体现在快速处理大量数据与产品 提升检测效率 [5] - 准确性通过深度学习与计算机视觉技术实现 避免人为干扰 [5] - 深度学习算法减少对人为主观特征的依赖 通过自动提取特征与参数优化提升检测精度 [7] 市场规模与增长 - 中国AI工业质检市场规模从2017年9亿元增长至2024年454亿元 年复合增长率75.09% [1][13] - 预计2025年市场规模达649亿元 [1][13] - 图像传感器作为核心硬件 市场规模从2017年296.34亿元增长至2024年948.98亿元 年复合增长率18.09% [9] - 图像传感器产量从2017年10.73亿颗增至2024年52.06亿颗 年复合增长率25.31% [9] 产业链结构 - 上游包括机器视觉算法库、光学器件及图像传感器等硬件 [7] - 下游应用以3C电子为主导 市场份额超50% 汽车制造占比18.6% [10] - 图像传感器需求从2017年38.79亿颗增至2024年70.2亿颗 年复合增长率8.84% [9] 竞争格局与重点企业 - 行业集中度较低 前五企业市场份额合计44.7% [14] - 百度智能云、创新奇智、腾讯云市场份额分别为10.6%、10.4%、10.2% [14] - 百度集团2025年第一季度营业收入324.52亿元 同比增长2.98% [14] - 创新奇智2024年集成产品及解决方案营业收入11.49亿元 数据解决方案服务营业收入0.72亿元 [16] 技术发展趋势 - 向全自动化方向发展 基于深度学习的视觉检测系统替代人工质检 [16] - 融合边缘计算与5G技术 实现毫秒级缺陷识别与分拣 [16] - 应用场景从3C电子、汽车向新能源、生物医药等领域拓展 [17] - 多模态技术融合高光谱成像、3D视觉及红外热成像 扩展检测边界 [18] - 生成式AI与仿真技术降低模型开发成本 加速算法迭代 [19] 相关企业 - 上市企业包括百度集团-SW、创新奇智、格科微、思特威、比亚迪等 [2] - 非上市企业包括腾讯云、微亿智造、阿丘科技、华为、商汤科技等 [3]
字节跳动再失大将,豆包大模型视觉研究负责人冯佳时离职
搜狐财经· 2025-08-27 13:06
核心高管变动 - 字节跳动豆包大模型视觉基础研究团队负责人冯佳时确认离职 此前公司曾于六月辟谣该消息[1] - 冯佳时师从AI顶尖学者颜水成 曾任新加坡国立大学助理教授 拥有超过400篇学术论文 谷歌学术引用量达6.9万次[3][11] - 其主导推动视频多模态大模型Sa2VA和自回归视频生成模型VideoWorld等创新研究[11] 研发团队架构 - 豆包大模型团队核心成员包括视觉基础研究负责人冯佳时 AML和Foundation团队负责人项亮 大语言模型研究负责人王明轩[6][8][10] - 项亮同时为《推荐系统实践》作者及Resys China推荐系统社区创始人[8] - 王明轩专注于模型超级对齐、可解释性及合成数据等研究方向[10] 人才流动情况 - 自去年12月以来 字节大模型团队连续流失多位核心人才 包括剪映产品负责人张逍然 TikTok算法负责人陈志杰 火山引擎AI应用产品线骆怡航[13] - 公司通过全球招聘弥补人才缺口 以数千万年薪招募原阿里通义大模型技术团队关键成员[13] - 近期新增高管包括经纬创投合伙人熊飞(加入飞书团队)及谷歌DeepMind研究副总裁吴永辉(担任Seed基础研究负责人)[13] 行业竞争态势 - AI大模型领域人才争夺战持续加剧[19] - 字节跳动在面临人才流失挑战的同时 仍积极通过招募顶级人才维持行业领先地位[13][19]
科学界论文高引第一人易主!AI站上历史巅峰
量子位· 2025-08-25 13:54
Yoshua Bengio学术成就 - Yoshua Bengio成为各领域被引用次数最多的在世科学家 总引用量超过95万次[1][4] - 2018年与Geoffrey Hinton、Yann LeCun共同获得图灵奖 表彰深度神经网络突破性贡献[4][12] - 三篇核心论文引用量极高:2014年GAN论文引用100,904次 2015年《Deep learning》引用100,061次 2016年深度学习著作引用81,400次[16][17] 关键学术贡献 - 2003年发表《一种神经概率语言模型》 解决语言建模维度灾难问题 为GPT等大语言模型奠定基础[4][14] - 2014年作为共同作者提出生成对抗网络(GAN) 推动计算机视觉领域发展[4][16] - 在注意力机制、循环神经网络、词嵌入等方向做出开创性工作 影响机器翻译与自然语言处理发展[13][16] 学术背景与职业轨迹 - 1986-1991年于麦吉尔大学完成计算机科学本硕博 师从Geoffrey Hinton[10] - 曾在MIT与贝尔实验室从事研究 期间与Yann LeCun开展合作[10] - 1993年起任职蒙特利尔大学 现任蒙特利尔学习算法研究所(MILA)所长[11] 行业影响力与创业动态 - 2024年6月成立非营利组织LawZero 已筹集3000万美元启动资金 专注于AI系统透明度与安全性研究[19][20] - 其弟Samy Bengio现任苹果公司AI与机器学习研究高级总监[9] - 深度学习研究成果直接推动自然语言处理与计算机视觉技术商业化应用[4][16] 学术引用排名格局 - Geoffrey Hinton以94万次总引用量位列第二 与Bengio差距微弱[21] - 何恺明以73万次引用量排名第五 Ilya Sutskever以67万次引用量排名第七[24] - AD Scientific Index覆盖全球260万科研人员 数据每20天更新一次 排名每2天重新计算[23]
"六边形战士"GPU公司完成亿元新融资
是说芯语· 2025-08-24 09:39
融资与资金用途 - 公司完成近亿元B2轮融资 由飞图创投领投[2] - 资金将重点投入RPP芯片产业化推进 核心技术研发升级以及边缘计算和AI芯片推理市场拓展[2] - 公司曾在今年3月完成数千万元B1轮融资 由长石资本领投 达泰资本 江门长信 硕明等机构跟投[2] 公司背景与研发布局 - 公司成立于2017年 已在珠海 深圳 西安及美国设立研发中心[2] - 经过8年持续技术研发与产品迭代 建立起完整AI计算产品矩阵[3] 核心技术架构 - 自主研发可重构并行处理器架构(RPP)专为并行计算设计[4] - RPP架构具有生态兼容性和超高能效并行计算能力 打破高性能芯片与通用芯片界限[4] - 底层兼容CUDA编程语言和多种开发工具 实现边缘AI应用快速高效部署[4] - 融合GPGPU通用性与NPU高效计算能力 在大模型推理 计算机视觉等领域具有优势[4] 产品特性与商业化进展 - RPP-R8芯片已在AI PC 医疗检测 存储服务器等多个领域实现商业化落地 与联想等头部企业建立深度合作[6] - RPP-R8 AE7100E芯片是业界最小最薄GPGPU 功耗控制在10W以下 适配Qwen Llama Stable Diffusion等主流大模型[6] - AI芯片AE7100尺寸为17mm × 17mm 集成该芯片的M.2加速卡尺寸为22mm x 88mm[6] - M.2加速卡拥有32TOPS算力及60GB/s内存带宽 可动态控制功耗 支撑大模型在笔记本电脑等设备运行[6] - 已适配DeepSeek Llama3-8B Stable Diffusion 通义千问 BitNet等开源模型[6] 战略发展方向 - 公司将围绕打造自有产权高端通用型芯片的发展方向前行[7]