计算机图形学
搜索文档
做了一份3DGS的学习路线图,面向初学者
自动驾驶之心· 2025-11-22 10:01
文章核心观点 - 3D高斯泼溅(3DGS)技术,特别是前馈式3DGS(Feed-Forward GS),正成为自动驾驶、医疗、虚拟现实和游戏等领域的新兴重要技术栈 [2] - 场景重建或世界模型是行业急需攻克的关键场景,其中自动驾驶的业内闭环是核心痛点 [4] - 为满足行业需求,推出了《3DGS理论与算法实战教程》,旨在系统性地讲解从原理到实战的知识,帮助学习者全面掌握3DGS技术栈 [6] 技术应用与行业需求 - 3DGS技术已在多个领域获得广泛应用,主流技术方向包括2DGS、3DGS、4DGS和前馈GS [2] - 自动驾驶行业对场景重建和世界模型有迫切需求,业内闭环是真正的技术痛点 [4] - 传统三维重建领域也存在技术升级的刚需 [4] 课程内容与结构 - 课程核心算法涵盖静态重建3DGS、动态重建4DGS、表面重建2DGS、前馈式3DGS以及量产问题讨论 [6] - 课程设计思路是从计算机图形学基础讲起,逐步深入到3DGS原理、自动驾驶应用及前沿研究方向 [10][11][12][13][14] - 课程包含六个章节:3DGS背景知识、原理算法、自动驾驶应用、研究方向、前馈式3DGS及答疑讨论 [10][11][12][13][14][15] - 课程采用离线视频教学,配合VIP群内答疑和三次线上答疑,学习周期预计两个半月 [17] 课程具体章节重点 - 第一章重点讲解计算机图形学基础,包括三维空间表达、渲染管线及3DGS开发工具如SuperSplat、COLMAP和Gsplat [10] - 第二章深入讲解3DGS原理、核心伪代码及动态重建、表面重建等算法,实战部分使用英伟达开源3DGRUT框架 [11] - 第三章聚焦自动驾驶仿真重建,重点分析Street Gaussian、OmniRe和Hierarchy UGP三篇工作,实战使用DriveStudio [12] - 第四章探讨3DGS重要研究方向,包括COLMAP扩展、深度估计及Relighting,并分析其工业界应用与学术前景 [13] - 第五章梳理前馈式3DGS的发展历程与原理,讲解AnySplat和WorldSplat等最新算法 [14] 目标人群与学习收获 - 课程面向具备一定计算机图形学基础、了解视觉重建技术、并拥有Python和PyTorch基础的学习者 [19] - 学习者需自备GPU,推荐算力在RTX 4090及以上 [19] - 学后收获包括掌握3DGS理论知识和技术栈、熟悉算法开发框架、并能与学术界及工业界同行持续交流 [19]
可实时预警岩体微小变化!深大团队研发地质灾害防治系统
南方都市报· 2025-10-21 15:57
技术突破与核心优势 - 新一代地质灾害智能监测系统融合计算机视觉、深度学习与云边端协同技术,实现对边坡落石、危岩移动等地质灾害的全天候、全覆盖、智能化监测[1] - 系统创新性地提出核心图形信息“云-边-端”协同处理技术,构建高效优化算子,实现从“点式监测”到“体式防控”的跨越[3] - 在运动检测、目标识别、精准测量三个关键技术层面实现突破,其中对落石事件的识别准确率超过85%[3] 应用场景与市场前景 - 系统应用场景广泛,包括山区公路隧道口和高边坡路段24小时监测、铁路沿线落石灾害预警、矿山开采区边坡稳定性监测以及水利工程边坡安全[5] - 该系统已在深圳市尖岗山公园投入应用,实现对危岩及落石的24小时不间断监控和报警[5] - 监测设备内置大容量太阳能供电系统,具备强大环境适应性与能源自给能力,可实现24小时不间断运行[5] 系统运行机制与行业影响 - 设备通过高分辨率摄像头捕捉岩体微小变化,利用内置智能算法实时分析研判,一旦监测到异常立即触发多级预警并通过4G/5G网络将数据实时上传至云端管理平台[5] - 系统实现了从“被动等待”到“主动预判”的转变,推动地质灾害监测预警进入“全域感知、智能推演、精准预警”的新阶段[5]
妙笔生维:线稿驱动的三维场景视频自由编辑
机器之心· 2025-08-19 10:43
三维场景视频编辑技术发展 - 移动摄影设备普及推动三维场景视频编辑需求增长 用户可通过手机或相机快速获取多视角视频 但高效自由编辑这些内容仍是关键挑战 包括添加新物体、去除元素或替换已有部分等能力 在VR、AR和短视频创作中应用前景广泛[2] - 现有经典方法局限在于仅支持预定义三维模型库 限制用户个性化创意表达 且难以处理光影融合和阴影生成等照片级真实感需求 移除物体后的空缺区域填补也缺乏最优解决方案[3] Sketch3DVE技术创新 - 提出基于线稿的三维场景视频编辑方法 用户通过简单线稿即可重塑视频内容 支持个性化添加、移除或替换对象 技术论文发表于SIGGRAPH 2025并入选Video Trailer[3][6] - 支持单张静态图片编辑 用户可先指定虚拟相机路径生成动态视频 再进行任意编辑 突破传统静态图像处理限制[5] - 采用DUSt3R三维重建算法分析场景 输出点云和相机参数 通过深度图对齐和反投影技术实现三维几何一致性 构建基于点云引导的视频生成模型 融合编辑帧、多视角视频和原始视频信息[13][14] 行业技术对比 - 现有视频生成模型分为两类:直接输入相机参数控制视角 或从单图像构建显式三维表示(如NeRF) 但均无法处理含大幅度相机运动的真实视频编辑[8] - 早期视频编辑方法基于Stable Diffusion逐帧处理 新方法利用视频模型提取运动特征 但主要擅长外观编辑 几何结构层面效果较差 难以处理大视角变化场景[9] - 线稿交互方式已广泛应用于内容生成 VIRES和SketchVideo等现有方法面向通用场景 无法保持三维几何一致性 Sketch3DVE填补该技术空白[9][12] 应用效果展示 - 支持首帧线稿标记编辑区域 生成添加/删除/替换物体的高质量结果 新物体具有三维一致性[16] - 可处理含阴影和反射的复杂场景 通过真实视频数据集训练生成合理编辑效果[17] - 支持颜色笔画指定外观 生成自然真实的三维场景编辑 也兼容图像补全方法直接编辑首帧[18][19] - 相比传统模型插入方法 解决了个性化定制不足、渲染失真和物体去除难题 降低专业软件使用门槛[20][22]
奥克兰大学计算机科学本科申请:人工智能与编程的前沿突破
搜狐财经· 2025-05-27 12:42
专业优势 - 奥克兰大学计算机科学本科专业拥有卓越学术资源与雄厚师资力量 在国际上享有盛誉 科研成果丰硕 在人工智能 数据科学 网络安全等领域处于行业前沿 [3] - 教授团队来自世界各地 学术研究成果斐然 发表众多高影响力论文 并与谷歌 微软等国际科技巨头保持密切合作 将行业最新动态带入课堂 [3] - 配备先进计算机实验室 包括高性能计算集群 虚拟现实设备等 满足复杂编程实验和人工智能项目开发需求 [3] - 与众多科技企业合作 提供实习和就业机会 使学生接触实际商业项目 积累实践经验 [3] 申请要求 - 国际学生需完成高中教育且三年平均成绩达80%以上 数学和物理等相关学科成绩需突出 [4] - 中国学生高考成绩需达所在省份一本线以上 或凭借A-Level IB等国际课程成绩申请 [4] - 语言要求雅思总分6.5且单项不低于6.0 托福总分90以上且写作不低于21 未达标者可先参加语言课程 [4] 学习内容 - 大一课程包括计算机科学导论 编程基础(Python和Java) 离散数学等 建立整体认知和基本技能 [6] - 大二 大三核心课程涵盖数据结构与算法 计算机系统原理 数据库系统等 深入理解底层逻辑 [6] - 选修课程包括人工智能 机器学习 计算机图形学 网络安全等 探索前沿领域 [6] - 设置项目实践课程 学生分组完成实际编程项目 如开发智能应用程序或设计网络安全系统 锻炼团队协作和解决问题能力 [6]