[CVPR-24] Text-to-3D using Gaussian Splatting

2024-03-19 04:12

本文主要是介绍[CVPR-24] Text-to-3D using Gaussian Splatting,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

  • 3DGS对初始化敏感;
  • 引入基于Point-E的3D SDS可以缓解多脸问题;
  • 外观细化阶段可以有效抑制异常点,并提高可视化效果;
  • 不需要对SDS的改进,用gudiance scale=100可以取得很不错的结果。

[pdf | proj | code]

方法

Geometry Optimization

  • text-to-3D任务通畅存在严重的双脸问题。不同于NeRF和DMTE等3D表征,3DGS可以显示控制每个点的位置。因此,本文提出通过Point-E + SDS loss优化3DGS的位置变量。
  • 其中,p_tx_t分别表示加噪的高斯位置和渲染图像。

Appearance Refinement

  • 本文引入了额外的外观细化阶段(appearance refinement stage),该阶段间歇执行,仅使用2D图片先验细化和稠密化3DGS。
  • 3DGS中使用的稠密化方法需要设置梯度阈值。然而,这个阈值在使用SDS损失时不好确认。由于SDS具有较强的随机性,使用较小阈值会导致产生大量的随机点,较大阈值则会导致点较少进而影响表达能力。
  • 为解决该问题,本文提出基于紧凑的稠密化方法(compactness-based densification),可以和较大的位置梯度阈值搭配使用。
  • 具体来说,对每个高斯点,首先通过KD树获取K个最近邻点;对每个近邻,如果他们之间的距离小于他们半径之和,则在他们中间新增一个高斯点,新增点的半径为距离残差。
  • 如下图所示,本文所提出的稠密化方法可以填补空洞,得到更好的几何结构。

  • 为了剪除不需要的高斯点,本文引入了一个透明度正则项,其权重正比于它到中心点的距离(extra loss to regularize opacity with a weight proportional to its distance to the center)。
  • 为了确保在外观细化阶段中,高斯点不发生较大位移,本文引入了针对位置的正则项。
  • 外观细化阶段损失如下:
  • 其中,sg()是梯度截停操作,p_io_i是第i个高斯点的位置和透明度。

Initialization with Geometry Prior

  • 前人工作发现3DGS初始化对结果影响较大。因此,本文使用Point-E来初始化3DGS位置,颜色则随机初始化。
  • 缩放、可见度初始化为一个常数,旋转矩阵初始化为单位矩阵。

实验

Implementation Details

  • SD 1.5,gudiance scale设置为100,使用了view-dependent prompt
  • 500 iter进行一次稠密化,T_{pos} = 0.02。本文提出的compactness-based densification 1000-iter执行一次。每200-iter移除掉可见度小于\alpha_{min}=0.05的点。
  • 在几何优化阶段:\lambda_{SDS}=0.1, \lambda_{3D}=0.01;在外观细化阶段\lambda_{SDS}=0.1, \lambda_{mean}=1.0, \lambda_{opacity}=100.0

消融实验

这篇关于[CVPR-24] Text-to-3D using Gaussian Splatting的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/824751

相关文章

MySQL中VARCHAR和TEXT的区别小结

《MySQL中VARCHAR和TEXT的区别小结》MySQL中VARCHAR和TEXT用于存储字符串,VARCHAR可变长度存储在行内,适合短文本;TEXT存储在溢出页,适合大文本,下面就来具体的了解... 目录一、VARCHAR 和 TEXT 基本介绍1. VARCHAR2. TEXT二、VARCHAR

Three.js构建一个 3D 商品展示空间完整实战项目

《Three.js构建一个3D商品展示空间完整实战项目》Three.js是一个强大的JavaScript库,专用于在Web浏览器中创建3D图形,:本文主要介绍Three.js构建一个3D商品展... 目录引言项目核心技术1. 项目架构与资源组织2. 多模型切换、交互热点绑定3. 移动端适配与帧率优化4. 可

Python按照24个实用大方向精选的上千种工具库汇总整理

《Python按照24个实用大方向精选的上千种工具库汇总整理》本文整理了Python生态中近千个库,涵盖数据处理、图像处理、网络开发、Web框架、人工智能、科学计算、GUI工具、测试框架、环境管理等多... 目录1、数据处理文本处理特殊文本处理html/XML 解析文件处理配置文件处理文档相关日志管理日期和

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图

Python使用Matplotlib绘制3D曲面图详解

《Python使用Matplotlib绘制3D曲面图详解》:本文主要介绍Python使用Matplotlib绘制3D曲面图,在Python中,使用Matplotlib库绘制3D曲面图可以通过mpl... 目录准备工作绘制简单的 3D 曲面图绘制 3D 曲面图添加线框和透明度控制图形视角Matplotlib

无人叉车3d激光slam多房间建图定位异常处理方案-墙体画线地图切分方案

墙体画线地图切分方案 针对问题:墙体两侧特征混淆误匹配,导致建图和定位偏差,表现为过门跳变、外月台走歪等 ·解决思路:预期的根治方案IGICP需要较长时间完成上线,先使用切分地图的工程化方案,即墙体两侧切分为不同地图,在某一侧只使用该侧地图进行定位 方案思路 切分原理:切分地图基于关键帧位置,而非点云。 理论基础:光照是直线的,一帧点云必定只能照射到墙的一侧,无法同时照到两侧实践考虑:关

MiniGPT-3D, 首个高效的3D点云大语言模型,仅需一张RTX3090显卡,训练一天时间,已开源

项目主页:https://tangyuan96.github.io/minigpt_3d_project_page/ 代码:https://github.com/TangYuan96/MiniGPT-3D 论文:https://arxiv.org/pdf/2405.01413 MiniGPT-3D在多个任务上取得了SoTA,被ACM MM2024接收,只拥有47.8M的可训练参数,在一张RTX

SAM2POINT:以zero-shot且快速的方式将任何 3D 视频分割为视频

摘要 我们介绍 SAM2POINT,这是一种采用 Segment Anything Model 2 (SAM 2) 进行零样本和快速 3D 分割的初步探索。 SAM2POINT 将任何 3D 数据解释为一系列多向视频,并利用 SAM 2 进行 3D 空间分割,无需进一步训练或 2D-3D 投影。 我们的框架支持各种提示类型,包括 3D 点、框和掩模,并且可以泛化到不同的场景,例如 3D 对象、室

【Python报错已解决】AttributeError: ‘list‘ object has no attribute ‘text‘

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 文章目录 前言一、问题描述1.1 报错示例1.2 报错分析1.3 解决思路 二、解决方法2.1 方法一:检查属性名2.2 步骤二:访问列表元素的属性 三、其他解决方法四、总结 前言 在Python编程中,属性错误(At

Science|癌症中三级淋巴结构的免疫调节作用与治疗潜力|顶刊精析·24-09-08

小罗碎碎念 Science文献精析 今天精析的这一篇综述,于2022-01-07发表于Science,主要讨论了癌症中的三级淋巴结构(Tertiary Lymphoid Structures, TLS)及其在肿瘤免疫反应中的作用。 作者类型作者姓名单位名称(中文)通讯作者介绍第一作者Ton N. Schumacher荷兰癌症研究所通讯作者之一通讯作者Daniela S. Thomm