CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】

本文主要是介绍CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

CVPR2024|AIGC相关论文汇总(如果觉得有帮助,欢迎点赞和收藏)

  • Awesome-CVPR2024-AIGC
  • 1.图像生成(Image Generation/Image Synthesis)
      • ECLIPSE: A Resource-Efficient Text-to-Image Prior for Image Generations
      • InstanceDiffusion: Instance-level Control for Image Generation
      • Instruct-Imagen: Image Generation with Multi-modal Instruction
      • MACE: Mass Concept Erasure in Diffusion Models
      • PAIR-Diffusion: Object-Level Image Editing with Structure-and-Appearance Paired Diffusion Models
      • Residual Denoising Diffusion Models
  • 2.图像编辑(Image Editing)
      • PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models
  • 3.视频生成(Video Generation/Image Synthesis)
      • Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners
  • 4.视频编辑(Video Editing)
  • 5.3D生成(3D Generation/3D Synthesis)
      • EscherNet: A Generative Model for Scalable View Synthesis
  • 6.其他多任务(Others)
      • InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks
      • Q-Instruct: Improving Low-level Visual Abilities for Multi-modality Foundation Models
  • 参考
  • 相关整理

Awesome-CVPR2024-AIGC

A Collection of Papers and Codes for CVPR2024 AIGC

整理汇总下今年CVPR AIGC相关的论文和代码,具体如下。

欢迎star,fork和PR~
优先在Github更新:Awesome-CVPR2024-AIGC,欢迎star~
知乎:https://zhuanlan.zhihu.com/p/684325134

参考或转载请注明出处

CVPR2024官网:https://cvpr.thecvf.com/Conferences/2024

CVPR完整论文列表:

开会时间:2024年6月17日-6月21日

论文接收公布时间:

【Contents】

  • 1.图像生成(Image Generation/Image Synthesis)
  • 2.图像编辑(Image Editing)
  • 3.视频生成(Video Generation/Image Synthesis)
  • 4.视频编辑(Video Editing)
  • 5.3D生成(3D Generation/3D Synthesis)
  • 6.其他多任务(Others)

1.图像生成(Image Generation/Image Synthesis)

ECLIPSE: A Resource-Efficient Text-to-Image Prior for Image Generations

  • Paper: https://arxiv.org/abs/2312.04655
  • Code: https://github.com/eclipse-t2i/eclipse-inference

InstanceDiffusion: Instance-level Control for Image Generation

  • Paper: https://arxiv.org/abs/2402.03290
  • Code: https://github.com/frank-xwang/InstanceDiffusion

Instruct-Imagen: Image Generation with Multi-modal Instruction

  • Paper: https://arxiv.org/abs/2401.01952

MACE: Mass Concept Erasure in Diffusion Models

  • Paper:
  • Code: https://github.com/Shilin-LU/MACE

PAIR-Diffusion: Object-Level Image Editing with Structure-and-Appearance Paired Diffusion Models

  • Paper: https://arxiv.org/abs/2303.17546
  • Code: https://github.com/Picsart-AI-Research/PAIR-Diffusion

Residual Denoising Diffusion Models

  • Paper: https://arxiv.org/abs/2308.13712
  • Code: https://github.com/nachifur/RDDM

2.图像编辑(Image Editing)

PIA: Your Personalized Image Animator via Plug-and-Play Modules in Text-to-Image Models

  • Paper: https://arxiv.org/abs/2312.13964
  • Code: https://github.com/open-mmlab/PIA

3.视频生成(Video Generation/Image Synthesis)

Seeing and Hearing: Open-domain Visual-Audio Generation with Diffusion Latent Aligners

  • Paper: https://arxiv.org/abs/2308.13712
  • Code: https://github.com/yzxing87/Seeing-and-Hearing

4.视频编辑(Video Editing)

5.3D生成(3D Generation/3D Synthesis)

EscherNet: A Generative Model for Scalable View Synthesis

  • Paper: https://arxiv.org/abs/2402.03908
  • Code: https://github.com/kxhit/EscherNet

6.其他多任务(Others)

InternVL: Scaling up Vision Foundation Models and Aligning for Generic Visual-Linguistic Tasks

  • Paper: https://arxiv.org/abs/2312.14238
  • Code: https://github.com/OpenGVLab/InternVL

Q-Instruct: Improving Low-level Visual Abilities for Multi-modality Foundation Models

  • Paper: https://arxiv.org/abs/2311.06783
  • Code: https://github.com/Q-Future/Q-Instruct
    持续更新~

参考

CVPR 2024 论文和开源项目合集(Papers with Code)

相关整理

  • Awesome-AIGC-Research-Groups
  • Awesome-Low-Level-Vision-Research-Groups
  • Awesome-CVPR2024-CVPR2021-CVPR2020-Low-Level-Vision
  • Awesome-ECCV2020-Low-Level-Vision

这篇关于CVPR2024|AIGC(图像生成,视频生成等)相关论文汇总(附论文链接/开源代码/解析)【持续更新】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/758287

相关文章

使用python生成固定格式序号的方法详解

《使用python生成固定格式序号的方法详解》这篇文章主要为大家详细介绍了如何使用python生成固定格式序号,文中的示例代码讲解详细,具有一定的借鉴价值,有需要的小伙伴可以参考一下... 目录生成结果验证完整生成代码扩展说明1. 保存到文本文件2. 转换为jsON格式3. 处理特殊序号格式(如带圈数字)4

Java使用Swing生成一个最大公约数计算器

《Java使用Swing生成一个最大公约数计算器》这篇文章主要为大家详细介绍了Java使用Swing生成一个最大公约数计算器的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下... 目录第一步:利用欧几里得算法计算最大公约数欧几里得算法的证明情形 1:b=0情形 2:b>0完成相关代码第二步:加

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

一文解析C#中的StringSplitOptions枚举

《一文解析C#中的StringSplitOptions枚举》StringSplitOptions是C#中的一个枚举类型,用于控制string.Split()方法分割字符串时的行为,核心作用是处理分割后... 目录C#的StringSplitOptions枚举1.StringSplitOptions枚举的常用

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

MyBatis延迟加载与多级缓存全解析

《MyBatis延迟加载与多级缓存全解析》文章介绍MyBatis的延迟加载与多级缓存机制,延迟加载按需加载关联数据提升性能,一级缓存会话级默认开启,二级缓存工厂级支持跨会话共享,增删改操作会清空对应缓... 目录MyBATis延迟加载策略一对多示例一对多示例MyBatis框架的缓存一级缓存二级缓存MyBat

前端缓存策略的自解方案全解析

《前端缓存策略的自解方案全解析》缓存从来都是前端的一个痛点,很多前端搞不清楚缓存到底是何物,:本文主要介绍前端缓存的自解方案,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、为什么“清缓存”成了技术圈的梗二、先给缓存“把个脉”:浏览器到底缓存了谁?三、设计思路:把“发版”做成“自愈”四、代码

Vue3视频播放组件 vue3-video-play使用方式

《Vue3视频播放组件vue3-video-play使用方式》vue3-video-play是Vue3的视频播放组件,基于原生video标签开发,支持MP4和HLS流,提供全局/局部引入方式,可监听... 目录一、安装二、全局引入三、局部引入四、基本使用五、事件监听六、播放 HLS 流七、更多功能总结在 v