Workflow
Computer Vision
icon
搜索文档
谢赛宁苏昊CVPR25获奖!华人博士王建元一作拿下最佳论文
量子位· 2025-06-14 00:44
CVPR 2025奖项总结 青年学者奖 - 谢赛宁以一作身份与何恺明合作完成ResNeXt并参与MAE,均为计算机视觉领域影响深远的工作[4] - 苏昊是李飞飞的博士生,曾参与计算机视觉领域知名项目ImageNet[3] 最佳论文奖 - 获奖论文《VGGT: Visual Geometry Grounded Transformer》由Meta和牛津大学联合提出,首次实现单次前馈端到端预测完整3D场景信息[5] - VGGT基于Vision Transformer,采用交替"全局-帧内"自注意力机制,性能超越现有几何或深度学习方法[13][17] - 模型输入支持1-200张图像,输出包含相机参数、深度图、点云图等核心3D属性[15] 最佳学生论文 - 获奖论文《Neural Inverse Rendering from Propagating Light》提出基于物理模型的神经逆向渲染方法,可从LiDAR数据重建场景几何和材质[25][26] - 核心技术包括时间分辨辐射缓存和神经网络加速计算,应用于自动驾驶和虚拟现实领域[27][29] 最佳论文荣誉奖 MegaSaM - 提出改进的深度视觉SLAM系统,能处理动态场景的单目视频,在相机姿态和深度估计方面优于传统方法[32][33] Navigation World Models - LeCun团队开发的可控视频生成模型,能基于视觉观测和导航动作预测未来画面,采用条件扩散变换器技术[38][39] Molmo and PixMo - 72亿参数视觉-语言模型Molmo超越Claude 3.5 Sonnet等闭源模型,配套数据集PixMo完全独立于闭源模型生成[45][48] 3D Student Splatting and Scooping - 改进3D高斯泼溅技术,采用Student's t分布实现正负密度建模,组件数量最多减少82%仍保持质量[53][56]
Ambarella (AMBA) 2025 Conference Transcript
2025-06-04 06:00
纪要涉及的公司 Ambarella(AMBA) 核心观点和论据 1. **公司发展历程与转型** - 2004年成立,专注个人视频内容,凭借专有视频处理技术实现盈利[3][4] - 2012年上市后,拓展至安防、无人机、汽车等市场,并引入视频分析和计算机视觉技术[5] - 2018年开始提升第二代计算机视觉技术,过去六年AI收入从0增长到上季度的75%,五年复合年增长率达60%[6] - 目前70%收入来自物联网,30%来自汽车,近80%收入来自AI处理器,已从单纯视频处理公司转型为视频AI公司[7] 2. **边缘AI定义与竞争格局** - 边缘AI指多数AI功能在边缘设备完成,区别于数据收集后在云端进行AI处理的模式[12][13] - 竞争对手包括NVIDIA、Qualcomm及约50家初创公司,但自2018年以来已向边缘AI设备发货超3200万颗AI处理器,具有竞争优势[14] 3. **DeepSeek的影响** - DeepSeek展示了不同参数模型,公司的CV75芯片能高效运行15亿参数模型,CV72或CV75能运行80亿参数模型,为边缘运行强大模型创造了机会[17][18] 4. **产品优化分工** - 客户负责对大公司生成的模型进行再训练,公司负责将再训练模型移植到芯片并高效运行,提供编译器工具,与客户合作优化模型[20][21][23] 5. **财务表现与市场反应** - Q1业绩比预期好33%,Q2指引上调5% - 6%,全年指引上调5%,但股价下跌10%。下跌原因之一是市场认为公司对CV3或自动驾驶更新讨论不足,但实际公司仍在大力投资,未更新是因客户方面无重大进展[29] 6. **业务应用与ASP增长** - 新应用包括视频会议、便携式视频、可穿戴相机、边缘基础设施等,均基于第三代AI基础设施,ASP因AI性能提升而显著增长,目前公司平均ASP为13 - 14美元,预计将继续增长[37][38][40] 7. **遗留业务与未来展望** - 上季度传统视频处理业务占比25%,预计未来三到四年逐渐下降,最终99%收入将来自AI产品[42] 8. **市场规模与发展策略** - 未来两到三年增长来自物联网,三到四年最大机会是在CV3获得重大设计订单,要成长为十亿美元公司,收购可能不可避免,扩大规模可解决放弃低利润业务的问题[45][46] 9. **供应链与成本结构** - 因技术限制,无法在代工方面实现多元化,但选择三星,在韩国和美国得克萨斯州有工厂,从地缘政治角度供应链具有韧性[48][49] 10. **毛利率与目标** - 毛利率持续高于58 - 62%目标,公司会放弃低利润业务,未来因汽车业务竞争,毛利率可能呈下降趋势[50][52][54] 11. **研发强度与盈利预期** - 过去十年在CV flow和自动驾驶方面投入巨大,未来将利用现有架构和软件开拓新市场,有望在利润上体现运营杠杆[56] 12. **汽车市场现状** - 市场存在财务和库存问题,客户投资放缓,决策周期延长,业务模式转向更注重价值的工程,以更快进入市场获利[58][59] 13. **汽车机会与模态关系** - 认为高级别自动驾驶不能仅依靠摄像头,集成多传感器模态的域控制器仍是公司的发展方向,公司将从中受益[60] 14. **未来增长驱动因素** - 可穿戴相机等终端设备的销量增长,以及边缘基础设施业务在明年下半年开始产生收入,公司将为边缘基础设施提供完整参考设计和软件,客户可在此基础上进行定制[61][63][65] 其他重要但可能被忽略的内容 1. 公司在汽车业务方面,虽有设计订单如Aurora、Ketiag等正在推进,但上季度失去一个重大设计订单,需思考如何向投资者传达设计活动情况[35] 2. 公司目前在中国的收入占比为15%,且多数客户若不在中国消费,会在国外制造,对中国市场的依赖有限[43]
MicroAlgo Inc. Develops Quantum Convolutional Neural Network (QCNN) Architecture to Enhance the Performance of Traditional Computer Vision Tasks Using Quantum Mechanics Principles
Prnewswire· 2025-05-13 03:00
量子视觉计算研究 - 公司宣布开展量子视觉计算研究 探索量子计算与传统卷积神经网络的融合 正在开发量子卷积神经网络(QCNN)架构以提升传统计算机视觉任务的性能[1] - QCNN架构创新性地结合量子计算的并行性和经典卷积神经网络的特征提取能力 利用量子比特作为信息载体 通过量子叠加和纠缠特性实现多任务并行处理[2] - 该架构借鉴经典CNN的卷积层、池化层和全连接层结构 对图像数据进行特征提取、降维和分类 同时提升计算速度和识别精度[2] 技术原理 - 量子态编码阶段将预处理后的图像特征映射到量子比特 利用量子叠加和纠缠特性建立特征关联网络[5] - QCNN处理阶段:量子卷积层利用量子并行性提取深层特征 量子池化层进行降维保留关键特征 量子全连接层完成分类分析[6] - 最终通过量子测量将量子态结果转换为经典数据形式 输出目标类别和位置等信息[7] 应用场景 - 自动驾驶领域可实现道路标志、车辆和行人的快速精准识别 提升系统安全性和可靠性[8] - 医疗影像分析可实现快速准确诊断 辅助医生制定治疗方案[8] - 安防监控领域支持实时异常行为检测和预警 提高安防效率和准确性[8] - 其他应用场景包括智能制造、航空航天和智慧城市等 推动相关行业技术升级和智能化转型[8] 公司背景 - 公司专注于定制化中央处理算法的开发与应用 通过算法与软硬件集成提供综合解决方案[9] - 服务范围包括算法优化、算力加速(无需硬件升级)、轻量级数据处理和数据智能服务[9] - 解决方案帮助客户增加用户数量、提升满意度、实现成本节约和降低能耗[9]
顶尖科学家Rob Fergus重掌FAIR,15万引用学者回归Meta,战略转向AGI
量子位· 2025-05-09 13:00
Meta FAIR新负责人上任 - Rob Fergus接替离职的Joelle Pineau成为Meta FAIR新负责人 此前外界猜测Meta重心转向AI商业化产品 FAIR定位不明朗[3] - LeCun宣布FAIR新目标是高级机器智能 即AGI[4] - Rob Fergus是FAIR联合创始人 曾与LeCun共同创立该机构[10] Rob Fergus的职业生涯 - 横跨学术界和工业界顶级机构 硕士毕业于加州理工 2005年牛津电子工程博士 博士论文获英国最佳计算机科学论文奖[7] - 2007年起在纽约大学任教 2009年与LeCun创立CILVR实验室[8] - 2014年共同创办FAIR 2020-2025年在DeepMind领导纽约团队[10][11] - 论文总被引用次数接近15万次 h-index为89 i10-index为143[12][13] 研究领域与代表作 - 研究兴趣包括机器学习(深度学习方法在表示学习和生成模型中的应用) 计算机视觉(物体识别 图像搜索 计算摄影)[13] - 代表作ZFNet提出可视化CNN中间层特征和分类器操作的新技术 被引用24413次[14] - 对抗样本领域开山之作《Intriguing properties of neural networks》被引用19163次 与Ilya Sutskever等合作[16][17] - 大模型时代代表作包括与LeCun等合作的Cambrian-1系列开源多模态模型[19] 回归FAIR后的计划 - 今年4月已回到Meta 在GenAI部门帮助提升Llama的记忆和个性化能力[2] - 表示将致力于构建改变人们与科技互动方式的人性化体验[21]
Oddity Tech .(ODD) - 2025 Q1 - Earnings Call Transcript
2025-04-30 20:30
财务数据和关键指标变化 - 2025年Q1营收增长27%,达到2.68亿美元,调整后EBITDA为5200万美元,调整后EBITDA利润率为19.5%,自由现金流为8700万美元 [5] - 净营收增长主要由订单增加驱动,平均订单价值同比增长4%,部分受高价格产品如护肤品推动,部分被国际市场更快增长抵消 [26] - 2024年重复收入占总营收超60%,2025年占比继续增加 [27] - 毛利率为74.9%,同比扩大116个基点,超出72%的指引 [27] - 调整后摊薄每股收益为0.69美元,高于0.61 - 0.63美元的指引 [29] - 预计2025年全年营收增长22 - 23%,即7.9 - 7.98亿美元,将全年毛利率展望从70%提高到71%,调整后EBITDA展望提高到1.57 - 1.61亿美元,调整后每股收益展望提高到1.99 - 2.04美元 [31] 各条业务线数据和关键指标变化 - Il Makiage有望在2028年实现1亿美元营收目标,Ile Macriage Skin今年有望接近该品牌营收的40% [11] - Foil Child在推出第三年持续强劲增长,有望今年突破2亿美元营收大关,利润率健康 [14] - Brand three计划在Q3软启动,Q4正式推出,是一个从医疗级皮肤和身体问题入手的远程医疗平台,未来将扩展到新的医疗领域 [16] - Brand four按计划将于2026年推出 [21] 各个市场数据和关键指标变化 - 美国市场目前占公司业务约80%,国际市场占比不到20%,美国和国际市场在Q1均实现两位数增长 [38] 公司战略和发展方向和行业竞争 - 公司定位在行业增长的重要方向,一是消费者向线上转移,公司已是主导的D2C平台;二是向高效能产品转移,公司在Quality Labs加速能力建设,持续投资产品开发各领域 [6] - 2025年战略重点包括继续推动现有品牌发展、推出新品牌、增加对Oddity Labs的投资以及提升技术能力 [11][15][21][22] - 与竞争对手相比,公司国际业务拓展空间大,有机会通过国际业务实现规模增长 [13] 管理层对经营环境和未来前景的评论 - 公司认为当前是巨大机遇,其商业模式使其在当下环境中能积极进取,行业结构变化如线上业务增长将增强公司优势 [23][24] - 尽管市场波动,但公司业务表现强劲,有信心实现长期20%的营收增长和20%的调整后EBITDA利润率目标 [30][32] 其他重要信息 - 公司预计2025年关税和相关成本将对毛利率产生50 - 100个基点的影响,部分将通过内部效率和其他缓解措施抵消,预计这些逆风因素可控 [31][57] 总结问答环节所有的提问和回答 问题1: 国际业务对本季度的提升有多少,以及FTC通过的点击取消规则对业务的潜在影响 - 国际业务在Q1表现出色,美国和国际市场均实现两位数增长,国际业务目前占比不到20%,公司对其未来增长非常乐观并将继续推进 [38][39] - 公司团队已针对点击取消规则做了大量工作,认为该规则对业务影响不大,公司采用选择加入而非选择退出模式,取消流程自助、在线且简单,测试表明无重大影响 [40][41] 问题2: 毛利率上升的最大因素是什么,未来三到五年对毛利率的预期如何 - 毛利率不是团队的关键绩效指标,团队更关注DC利润率(即扣除媒体支出后的毛利率) [46] - 本季度毛利率上升部分得益于团队在供应链、物流、履行等方面的出色执行,以及历史上对毛利率的保守指引 [47] - 长期来看,公司预计毛利率维持在60%多的较高水平,但会致力于维持20%或更高的调整后EBITDA利润率 [48] 问题3: 对Brand three的期待原因,以及关税指导中假设的具体关税水平 - 公司为Brand three投入近四年,在视觉技术方面进展良好,市场需求大,产品范围广且经过大规模测试,对其推出充满信心 [54][55][56] - 2025年预计关税对毛利率的影响为50 - 100个基点,公司希望降低该影响,2026年预计关税压力可控,不会影响长期营收和EBITDA利润率目标 [57] 问题4: 国际业务重点是扩大现有市场还是进入新市场,以及收购的优先级和战略重点 - 国际业务机会巨大,公司过去几年在欧洲等市场进行投资和测试,目前已在多个市场正式推出业务,也开始在一些大型发展中市场测试且结果良好 [64][65][66] - 收购方面,公司寻求获取自身没有的资源,如具有强大产品的品牌、生物技术和AI领域的资源 [67] 问题5: SG&A中广告部分的情况,广告支出效率,以及远程医疗基础设施平台的潜在用途 - 公司未设定3倍的广告支出回报目标,更关注维持20%的调整后EBITDA利润率,SG&A投资主要集中在新品牌开发、Labs建设和技术投入等方面 [73][74][75] - 远程医疗平台一旦建立基础设施、拥有医生资源和配送处方产品的能力,就具备了大规模扩展的潜力,但出于竞争原因,具体扩展领域不便透露 [80]
Mobileye selects Valens Semiconductor's VA7000 MIPI A-PHY chipsets for automated and autonomous driving projects
Prnewswire· 2025-04-02 18:30
文章核心观点 Mobileye选用Valens的VA7000芯片组用于自动驾驶平台,双方合作验证了MIPI A - PHY标准的前景,对汽车行业意义重大 [1][2] 合作情况 - Mobileye工程执行副总裁表示很高兴将Valens符合MIPI A - PHY标准的VA7000芯片组作为支持自动驾驶平台光路的关键组件,期待与Valens合作拓展生态并将技术带给更多汽车制造商 [1] - Mobileye在对芯片组进行广泛测试后选择VA7000,该芯片在多种参数上表现优越,有显著性能优势 [1] - Valens CEO称与Mobileye的合作验证了MIPI A - PHY的前景,Mobileye选择VA7000证明其能高精度传输数据,此次合作是汽车行业重要里程碑 [2] MIPI A - PHY标准情况 - MIPI A - PHY是首个用于高速传感器和显示连接的汽车行业标准,能满足下一代ADAS要求,实现高带宽、低延迟连接和乘客安全保障 [2] - 自发布后,MIPI A - PHY生态系统不断发展和多样化,吸引新公司基于此标准设计产品,Valens是首个推出符合A - PHY标准产品VA7000芯片组的公司 [2] 公司介绍 Mobileye Global Inc - 以自动驾驶和驾驶辅助技术引领移动革命,在人工智能、计算机视觉、地图绘制和软硬件集成方面有专业知识 [3] - 自1999年成立以来推动了先进驾驶辅助系统广泛应用,开创了REM™众包地图、True Redundancy™传感和Responsibility Sensitive Safety™(RSS)等技术 [3] - 截至2024年,全球超2亿辆车搭载其EyeQ技术,2022年从英特尔独立上市,英特尔保留多数股权 [3] Valens Semiconductor - 是高性能连接领域的领导者,其芯片组集成到众多领先客户设备中,推动音视频安装、视频会议发展,助力ADAS和自动驾驶演进 [4] - 推动连接技术边界,其技术是HDBaseT®和MIPI A - PHY等行业标准基础 [4]
深圳云天励飞技术股份有限公司_公司科创板首次公开发行股票招股说明书(注册稿)
2023-02-10 11:30
发行信息 - 发行股数不超过8878.3430万股,占发行后总股本比例不低于25%,采用超额配售选择权发行股票数量不超过首次公开发行股票数量的15%,发行后总股本不超过35513.3720万股[9][63][64][101] - 2022年6月30日发行前每股净资产4.73元,发行前每股收益 -0.86元[64][101] - 发行方式采用网下对投资者询价配售与网上向社会公众投资者定价发行相结合的方式或证券监管部门认可的其他方式,承销方式为余额包销[102] 业绩数据 - 2019 - 2022年上半年公司净利润分别为-50976.47万元、-39834.40万元、-38990.29万元及-23007.47万元[12][15][150] - 截至2022年6月末,公司合并口径累计未分配利润为-99187.86万元[12][15][150] - 2019 - 2022年1 - 6月公司营业收入分别为23041.15万元、42633.77万元、56570.09万元及18539.19万元,2022年1 - 6月同比下滑40.01%[39][87][135] - 预计公司2022年1 - 9月营业收入21025.00 - 34711.65万元,较2021年1 - 9月下降30.57% - 39.43%[42] - 预计公司2022年1 - 9月净利润 -31959.00 - -30544.28万元,亏损幅度扩大4.63% - 11.58%[42] - 预计公司2022年1 - 9月扣除非经常性损益后归属于母公司股东的净利润 -37352.00 - -39472.00万元,亏损幅度扩大9.54% - 15.76%[42] - 2022年第三季度预计营业收入2485.81 - 5560.81万元,前期收入下降趋势将扭转[42] - 2022年第三季度预计净利润及扣除非经常性损益后归属于母公司股东的净利润亏损幅度同比收窄[42] 市场数据 - 2020年和2021年中国计算机视觉行业市场规模分别约为406.3亿元和669.1亿元,公司近两年计算机视觉解决方案市场份额预计在1%左右[21][124] - 2020年中国云端AI芯片市场规模达111.7亿元,边缘与终端芯片为39亿元,公司2020年AI芯片相关收入处于百万量级,2021年增至千万级[21][124][125] 研发与技术 - 公司算法技术达到业内领先水平,多项成果获国家级奖项[70] - 公司是业内少数自主研发芯片并实现流片、量产及市场化销售的公司之一,自研芯片DeepEye1000已独立商用[71] - 公司DeepEye1000芯片于2019年度完成研发,新一代芯片DeepEdge 10于报告期内开始流片[72] - 公司多次参与人工智能国家级行业标准制定,2020年入选全国信息技术标准化技术委员会人工智能分技术委员会单位委员名单并当选可信赖研究组副组长[74] 风险提示 - 公司所在人工智能领域前期研发投入高,产品规模化销售前需持续投入,未来可能持续亏损,首次公开后短期内无法现金分红[15][16] - 公司持续亏损可能面临业务拓展、人才引进、团队稳定、研发投入、市场开拓等方面的困难[17] - 公司上市后未盈利状态持续或未弥补亏损扩大,可能触及退市条件[18] - 国内人工智能行业竞争激烈,公司经营规模与大型企业相比存在劣势[19][20][122][123] - 公司AI芯片业务未来持续销售和获得订单存在不确定性,技术迭代或使产品失去竞争力[23] - 公司于2020年5月被美国商务部列入“实体清单”,对采购等产生限制[35][131] - 人工智能行业核心技术泄密及核心技术人员流失会对公司业务发展和研发工作进程造成不利影响[116] 募集资金 - 城市AI计算中枢及智慧应用研发项目总投资80,064.72万元,拟投入募集资金80,000.00万元[98] - 面向场景的下一代AI技术研发项目总投资30,010.00万元,拟投入募集资金30,000.00万元[98] - 基于神经网络处理器的视觉计算AI芯片项目总投资50,088.60万元,拟投入募集资金50,000.00万元[98]