CV每日论文--2024.6.11

2024-06-13 16:52
文章标签 cv 每日 论文 2024.6

本文主要是介绍CV每日论文--2024.6.11,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、GaussianCity: Generative Gaussian Splatting for Unbounded 3D City Generation

中文标题:GaussianCity:生成无界 3D 城市的生成高斯泼溅

简介:这篇论文提出了一种名为"GaussianCity"的高效3D城市生成框架,解决了基于NeRF的方法和3D高斯喷洒(3D-GS)在无限尺度3D城市生成方面的局限性。

主要创新点如下:

紧凑的3D场景表示:引入BEV-Point作为高度压缩的中间表示,确保无限场景的VRAM使用量保持恒定,从而实现无限城市生成。

空间感知的高斯属性解码器:提出了空间感知的BEV-Point解码器,利用点序列化器集成BEV点的结构和上下文特征,产生高质量的3D高斯属性。

与基于NeRF的方法相比,GaussianCity大幅提高了计算效率。同时,与直接应用3D-GS于大规模城市场景相比,GaussianCity通过紧凑的场景表示和空间感知解码器,克服了内存不足的问题,可以高效合成无限的3D城市。

广泛的实验表明,GaussianCity在无人机视角和街景视角下的3D城市生成都取得了最先进的结果。与最近提出的CityDreamer方法相比,GaussianCity的生成速度提高了60倍,达到了10.72 FPS的实时性能。

总之,GaussianCity通过创新的3D场景表示和解码策略,有效解决了大规模3D城市生成的计算效率和内存限制问题,为城市可视化、游戏、仿真等应用提供了重要的技术支撑

2、IllumiNeRF: 3D Relighting without Inverse Rendering

中文标题:IlumiNeRF:无需逆向渲染的 3D 重新照明

简介:这篇论文提出了一种新的可重光视图合成方法,摆脱了传统基于反向渲染的方法,而是采用更简单高效的策略。

当前的可重光视图合成方法通常基于反向渲染,试图从输入图像中解开物体几何、材质和光照因素,并通过可微分蒙特卡罗渲染进行优化。这种方法计算成本高昂,容易出错。

为了解决这一问题,本文提出了一种新方法:

1. 首先使用一个以光照为条件的图像扩散模型,对每个输入图像进行重新照明。

2. 然后利用这些重新照明的图像,重建一个神经辐射场(NeRF)。

3. 最后从重建的NeRF中渲染出目标照明下的新视角图像。

作者证明了这种基于扩散模型的策略出奇地有竞争力,在多个重照基准测试中实现了最先进的性能。与传统的基于反向渲染的方法相比,该方法计算简单高效,避免了可微分渲染优化过程中的错误。

总的来说,这项工作提出了一种全新的可重光视图合成方法,通过利用图像扩散模型实现了更加优雅和高效的解决方案,为相关领域带来了重要进展。感兴趣的读者可以访问项目页面https://illuminerf.github.io/了解更多详情。

3、NaRCan: Natural Refined Canonical Image with Integration of Diffusion Prior for Video Editing

中文标题:NaRCan:自然精致的规范图像与扩散先验的集成用于视频编辑

简介:通过整合混合变形场和扩散先验,生成高质量的自然规范图像来代表输入视频。

主要创新点如下:

1. 利用单应性建模全局运动,并采用多层感知器(MLPs)捕捉局部残差变形,增强模型处理复杂视频动态的能力。

2. 在训练的早期引入扩散先验,确保生成的规范图像保持高质量的自然外观,适用于视频编辑中的各种下游任务,这是当前基于规范的方法所无法实现的。

3. 结合低秩适应(LoRA)微调,并引入噪声和扩散先验更新调度技术,将训练过程加速了14倍。

广泛的实验结果表明,NaRCan在各种视频编辑任务中均优于现有方法,生成了连贯和高质量的编辑视频序列。

与传统基于规范的方法相比,NaRCan通过混合变形场和扩散先验的独特设计,确保生成的规范图像保持自然外观,同时大幅提高了训练效率。这为视频编辑、合成等应用提供了重要的技术支撑。

感兴趣的读者可以访问项目页面https://koi953215.github.io/NaRCan_page/查看视频结果,了解NaRCan的更多细节。精致的规范图像与扩散先验的集成用于视频编辑

简介:

这篇关于CV每日论文--2024.6.11的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1057874

相关文章

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

论文翻译:arxiv-2024 Benchmark Data Contamination of Large Language Models: A Survey

Benchmark Data Contamination of Large Language Models: A Survey https://arxiv.org/abs/2406.04244 大规模语言模型的基准数据污染:一项综述 文章目录 大规模语言模型的基准数据污染:一项综述摘要1 引言 摘要 大规模语言模型(LLMs),如GPT-4、Claude-3和Gemini的快

论文阅读笔记: Segment Anything

文章目录 Segment Anything摘要引言任务模型数据引擎数据集负责任的人工智能 Segment Anything Model图像编码器提示编码器mask解码器解决歧义损失和训练 Segment Anything 论文地址: https://arxiv.org/abs/2304.02643 代码地址:https://github.com/facebookresear

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟)

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟) 题目描述 给定一个链表,链表中的每个节点代表一个整数。链表中的整数由 0 分隔开,表示不同的区间。链表的开始和结束节点的值都为 0。任务是将每两个相邻的 0 之间的所有节点合并成一个节点,新节点的值为原区间内所有节点值的和。合并后,需要移除所有的 0,并返回修改后的链表头节点。 思路分析 初始化:创建一个虚拟头节点

每日一题|牛客竞赛|四舍五入|字符串+贪心+模拟

每日一题|四舍五入 四舍五入 心有猛虎,细嗅蔷薇。你好朋友,这里是锅巴的C\C++学习笔记,常言道,不积跬步无以至千里,希望有朝一日我们积累的滴水可以击穿顽石。 四舍五入 题目: 牛牛发明了一种新的四舍五入应用于整数,对个位四舍五入,规则如下 12345->12350 12399->12400 输入描述: 输入一个整数n(0<=n<=109 ) 输出描述: 输出一个整数

论文翻译:ICLR-2024 PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS

PROVING TEST SET CONTAMINATION IN BLACK BOX LANGUAGE MODELS https://openreview.net/forum?id=KS8mIvetg2 验证测试集污染在黑盒语言模型中 文章目录 验证测试集污染在黑盒语言模型中摘要1 引言 摘要 大型语言模型是在大量互联网数据上训练的,这引发了人们的担忧和猜测,即它们可能已

OmniGlue论文详解(特征匹配)

OmniGlue论文详解(特征匹配) 摘要1. 引言2. 相关工作2.1. 广义局部特征匹配2.2. 稀疏可学习匹配2.3. 半稠密可学习匹配2.4. 与其他图像表示匹配 3. OmniGlue3.1. 模型概述3.2. OmniGlue 细节3.2.1. 特征提取3.2.2. 利用DINOv2构建图形。3.2.3. 信息传播与新的指导3.2.4. 匹配层和损失函数3.2.5. 与Super

每日一练7:简写单词(含链接)

1.链接 简写单词_牛客题霸_牛客网 2.题目 3.代码1(错误经验) #include <iostream>#include <string>using namespace std;int main() {string s;string ret;int count = 0;while(cin >> s)for(auto a : s){if(count == 0){if( a <=

BERT 论文逐段精读【论文精读】

BERT: 近 3 年 NLP 最火 CV: 大数据集上的训练好的 NN 模型,提升 CV 任务的性能 —— ImageNet 的 CNN 模型 NLP: BERT 简化了 NLP 任务的训练,提升了 NLP 任务的性能 BERT 如何站在巨人的肩膀上的?使用了哪些 NLP 已有的技术和思想?哪些是 BERT 的创新? 1标题 + 作者 BERT: Pre-trainin

【每日刷题】Day113

【每日刷题】Day113 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 91. 解码方法 - 力扣(LeetCode) 2. LCR 098. 不同路径 - 力扣(LeetCode) 3. 63. 不同路径 II - 力扣(LeetCode) 1. 91. 解码方法 - 力扣(LeetCode) //思路:动态规划。 cl