Computer Science

搜索文档
实验室10篇论文被ICCV 2025录用
自动驾驶之心· 2025-07-02 21:54
论文研究成果总结 论文1 - 提出类别级几何学习框架用于三维点云分割的域泛化问题 通过几何嵌入感知点云细粒度属性并构建类别级几何属性 耦合几何嵌入与语义学习提升泛化能力 [1] - 引入几何一致性学习模拟潜在三维分布并对齐类别级几何嵌入 使模型关注几何不变信息 实验验证该方法在域泛化三维分割中具有竞争力 [1] 论文2 - 开发分层变分测试时提示生成方法 通过Hyper Transformer动态生成文本/视觉提示 解决传统方法提示模板固定导致的领域适应性问题 [3] - 采用变分推理减轻提示模板敏感性和分布偏移 通过分层条件提示捕捉深层上下文依赖 实验显示该方法在零样本准确率上达到SOTA [3] 论文3 - 提出知识引导部件分割框架(KPS) 利用大语言模型构建部件结构知识图谱 通过结构知识引导模块将关系信息嵌入视觉特征 [5][6] - 设计粗粒度物体引导模块增强整体类别感知 实现复杂场景下的精细部件分割 突破传统方法忽视部件结构联系的局限 [5][6] 论文4 - 构建TopicGeo统一检索匹配框架 通过CLIP提示学习嵌入文本语义主题 消除多时相遥感图像的类内/类间分布差异 [9] - 采用中心自适应标签分配与离群点剔除机制优化检索匹配流程 实验表明该方法在召回率和匹配精度上均优于分离范式 [9] 论文5 - 提出视觉语言交互关系挖掘模型(VL-IRM) 通过多模态交互学习解决开放词汇场景图生成中的关系感知缺失问题 [11] - 开发关系生成模型增强文本模态的开放式关系探索能力 利用视觉引导扩展关系文本空间语义 实验验证其广义关系表征优势 [11] 论文6 - 设计VGMamba网络实现三维视觉定位 包含属性Mamba、位置Mamba和多模态融合Mamba三模块 通过SVD分解与滑动窗口捕获属性特征 [13] - 提出属性到位置线索推理机制 融合语言查询与点云空间信息精准定位目标物体 在复杂语义查询场景下表现优异 [13] 论文7 - 创新动态中心距离(DCD)度量 通过元学习框架计算特征空间样本难度 解决噪声标签学习中简单样本主导问题 [15] - 结合DCD与半监督训练策略 聚焦硬样本优化分类损失 在合成/真实噪声数据集及医学图像中验证鲁棒性 [15] 论文8 - 提出BuCSFR方法实现粗标签到细粒度表征学习 通过自底向上构建树状图适应动态类别变化 无需预定义类别数量 [17] - 基于最小信息损失准则迭代合并实例 利用EM框架协同优化树状图构建与特征可分性 在物种识别等任务中表现突出 [17] 论文9 - 开发类别特异选择性特征增强模型 针对长尾多标签分类中样本稀缺类别敏感性丧失问题 利用类激活图定位关键区域 [19][20] - 设计渐进式注意力增强机制 按头部-中部-尾部类别顺序提升低置信度响应 实验显示其在标签不平衡场景下的泛化优势 [19][20] 论文10 - 建立部分匹配子图定位框架 通过高斯分布建模跨模态歧义性 放宽指令文本与点云地图严格对齐假设 [22][23] - 提出不确定性感知相似性度量 将定位阶段的不确定性传播至场景识别阶段 提升真实噪声场景下的任务协同性 [22][23] 学术会议背景 - ICCV 2025为计算机视觉A类顶会 本届收到11239份投稿 录用率24% 将于10月19-25日在夏威夷举办 [25] 技术社区资源 - 具身智能之心知识星球聚集近1500名开发者 覆盖40+开源项目与60+数据集 涉及VLA、VLN、Diffusion Policy等前沿方向 [29][30] - 3D视觉之心社区聚焦三维重建、NeRF、SLAM等技术 提供行业交流与求职对接服务 [26][27]
50年僵局打破!MIT最新证明:对于算法少量内存胜过大量时间
机器之心· 2025-05-25 11:51
计算资源理论突破 - MIT理论计算机科学家Ryan Williams最新研究颠覆传统认知 证明少量计算内存比大量计算时间更具理论价值 该成果打破计算机科学界50年来的固有观念[1] - 研究建立数学程序可将任意算法转化为占用空间显著更少的形式 空间需求降幅达时间预算的平方根级(O(√t log t))[1][14][16] - 该成果不仅揭示空间约束下的计算范围 还首次严格证明有限时间内无法完成的计算类型[3] 计算复杂性理论发展 - 1965年Hartmanis和Stearns开创性定义时间与空间的数学概念 奠定复杂性分类基础[5] - P类(多项式时间可解)与PSPACE类(多项式空间可解)的关系成为核心问题 学界普遍认为PSPACE包含更多难题[6][7] - 1975年Hopcroft团队首次建立时空关联 证明空间至少比时间略强 但后续研究陷入50年僵局[7][8] 关键技术突破路径 - 2010年Stephen Cook提出树评估问题 但证明存在内存占用假设的漏洞[10] - 2023年James Cook与Mertz推翻刚性存储假设 开发出空间效率显著提升的新算法[10][12] - Williams将Cook-Mertz算法扩展为通用工具 通过分块计算(t/b个块)和隐式树构造实现空间复杂度突破[14][15][16] 理论意义 - 采用柔性石子(squishy pebbles)存储模型 突破Paul等人证明的通用模拟不可能性[8][14] - 计算图规约至树评估问题的创新方法 使空间复杂度从线性关系降至平方根关系[15][16] - 虽无直接应用价值 但为P与PSPACE关系问题提供全新研究路径[14][16]
i人如何在学术会议有效社交?滑铁卢大学教授Gautam Kamath亲授心得
机器之心· 2025-05-03 12:18
机器之心报道 编辑:蛋酱、刘欣 i 人参与大型学术会议,如何在享受人群的同时展开有效社交? 我希望能做到以下两件事: 有点难度,但「其实也并非完全不可能」。 「我写了一篇关于如何在计算机科学会议上与人建立联系(也就是交朋友)的文章。这类活动可能会让人 感到畏惧,所以这里有一些建议,教你如何应对。」 这是加拿大计算机科学家、滑铁卢大学教授 Gautam Kamath 刚刚写出的一篇博客。 博客地址: https://kamathematics.wordpress.com/2025/05/01/tips-on-how-to-connect-at-academic-conferences/ 具体来说,他的建议包含几种操作: 但 Gautam 也说了:学术会议本身就让人紧张了,实在不爱好社交也别勉强。 说得有道理,好好享受茶歇吧(bushi)! 以下是博客原文,机器之心进行了整理,有「装 e」需要的读者请逐字学习: 我曾经是个有点笨拙的青少年。如果你是一位正在阅读这篇文章的计算机科学研究员,那么很有可能你也 曾如此。如何应对社交场合并结交朋友并不总是凭直觉就能做到的,这是需要学习的。这一点在参加学术 会议时尤其明显, ...