CV计算机视觉每日开源代码Paper with code速览-2023.11.28

2023-12-01 17:44

本文主要是介绍CV计算机视觉每日开源代码Paper with code速览-2023.11.28,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【图像分割】Stable Segment Anything Model

  • 论文地址:https://arxiv.org//pdf/2311.15776

  • 开源代码(即将开源):https://github.com/fanq15/Stable-SAM

2.【目标跟踪】Single-Model and Any-Modality for Video Object Tracking

  • 论文地址:https://arxiv.org//pdf/2311.15851

  • 开源代码(即将开源):https://github.com/Zongwei97/UnTrack

3.【视频超分辨率重建】Enhancing Perceptual Quality in Video Super-Resolution through Temporally-Consistent Detail Synthesis using Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.15908

  • 开源代码(即将开源):https://github.com/claudiom4sir/StableVSR

4.【多模态】Video-Bench: A Comprehensive Benchmark and Toolkit for Evaluating Video-based Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.16103

  • 开源代码:https://github.com/PKU-YuanGroup/Video-Bench

5.【多模态】ViT-Lens-2: Gateway to Omni-modal Intelligence

  • 论文地址:https://arxiv.org//pdf/2311.16081

  • 开源代码:https://github.com/TencentARC/ViT-Lens

6.【多模态】GaussianEditor: Editing 3D Gaussians Delicately with Text Instructions

  • 论文地址:https://arxiv.org//pdf/2311.16037

  • 工程主页:GaussianEditor: Editing 3D Gaussians Delicately with Text Instructions

  • 代码即将开源

7.【多模态】EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension

  • 论文地址:https://arxiv.org//pdf/2311.15879

  • 工程主页:EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory for Open-World Comprehension

  • 代码即将开源

8.【多模态】FlowZero: Zero-Shot Text-to-Video Synthesis with LLM-Driven Dynamic Scene Syntax

  • 论文地址:https://arxiv.org//pdf/2311.15813

  • 工程主页:FlowZero: Zero-Shot Text-to-Video Synthesis with LLM-Driven Dynamic Scene Syntax

  • 开源代码(即将开源):https://github.com/aniki-ly/FlowZero

9.【多模态】GPT4Vis: What Can GPT-4 Do for Zero-shot Visual Recognition?

  • 论文地址:https://arxiv.org//pdf/2311.15732

  • 开源代码:https://github.com/whwu95/GPT4Vis

10.【多模态】Breathing Life Into Sketches Using Text-to-Video Priors

  • 论文地址:https://arxiv.org//pdf/2311.13608

  • 工程主页:Breathing Life Into Sketches Using Text-to-Video Priors

  • 开源代码(即将开源):https://github.com/yael-vinker/live_sketch

11.【数字人】Animatable Gaussians: Learning Pose-dependent Gaussian Maps for High-fidelity Human Avatar Modeling

  • 论文地址:https://arxiv.org//pdf/2311.16096

  • 工程主页:Projectpage of Animatable Gaussians

  • 开源代码(即将开源):https://github.com/lizhe00/AnimatableGaussians

12.【自动驾驶:Occupancy Prediction】OccWorld: Learning a 3D Occupancy World Model for Autonomous Driving

  • 论文地址:https://arxiv.org//pdf/2311.16038

  • 开源代码:https://github.com/wzzheng/OccWorld

13.【视频理解】Side4Video: Spatial-Temporal Side Network for Memory-Efficient Image-to-Video Transfer Learning

  • 论文地址:https://arxiv.org//pdf/2311.15769

  • 开源代码(即将开源):https://github.com/HJYao00/Side4Video

14.【视频理解】Vamos: Versatile Action Models for Video Understanding

  • 论文地址:https://arxiv.org//pdf/2311.13627

  • 工程主页:Vamos: Versatile Action Models for Video Understanding

  • 代码即将开源

15.【行人重识别】Multi-scale Semantic Correlation Mining for Visible-Infrared Person Re-Identification

  • 论文地址:https://arxiv.org//pdf/2311.14395

  • 开源代码:https://github.com/Hua-XC/MSCMNet

16.【Diffusion】Continual Learning of Diffusion Models with Generative Distillation

  • 论文地址:https://arxiv.org//pdf/2311.14028

  • 开源代码:https://github.com/Atenrev/difussion_continual_learning

17.【知识蒸馏】Knowledge From the Dark Side: Entropy-Reweighted Knowledge Distillation for Balanced Knowledge Transfer

  • 论文地址:https://arxiv.org//pdf/2311.13621

  • 开源代码:https://github.com/cpsu00/ER-KD

18.【Continual Learning】Density Distribution-based Learning Framework for Addressing Online Continual Learning Challenges

  • 论文地址:https://arxiv.org//pdf/2311.13623

  • 代码即将开源

论文已打包,下载链接​​​​​​​

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

​​​​​​​CV计算机视觉每日开源代码Paper with code速览-2023.11.27

CV计算机视觉每日开源代码Paper with code速览-2023.11.23

CV计算机视觉每日开源代码Paper with code速览-2023.11.22

CV计算机视觉每日开源代码Paper with code速览-2023.11.21

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

这篇关于CV计算机视觉每日开源代码Paper with code速览-2023.11.28的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/442073

相关文章

如何测试计算机的内存是否存在问题? 判断电脑内存故障的多种方法

《如何测试计算机的内存是否存在问题?判断电脑内存故障的多种方法》内存是电脑中非常重要的组件之一,如果内存出现故障,可能会导致电脑出现各种问题,如蓝屏、死机、程序崩溃等,如何判断内存是否出现故障呢?下... 如果你的电脑是崩溃、冻结还是不稳定,那么它的内存可能有问题。要进行检查,你可以使用Windows 11

计算机毕业设计 大学志愿填报系统 Java+SpringBoot+Vue 前后端分离 文档报告 代码讲解 安装调试

🍊作者:计算机编程-吉哥 🍊简介:专业从事JavaWeb程序开发,微信小程序开发,定制化项目、 源码、代码讲解、文档撰写、ppt制作。做自己喜欢的事,生活就是快乐的。 🍊心愿:点赞 👍 收藏 ⭐评论 📝 🍅 文末获取源码联系 👇🏻 精彩专栏推荐订阅 👇🏻 不然下次找不到哟~Java毕业设计项目~热门选题推荐《1000套》 目录 1.技术选型 2.开发工具 3.功能

SWAP作物生长模型安装教程、数据制备、敏感性分析、气候变化影响、R模型敏感性分析与贝叶斯优化、Fortran源代码分析、气候数据降尺度与变化影响分析

查看原文>>>全流程SWAP农业模型数据制备、敏感性分析及气候变化影响实践技术应用 SWAP模型是由荷兰瓦赫宁根大学开发的先进农作物模型,它综合考虑了土壤-水分-大气以及植被间的相互作用;是一种描述作物生长过程的一种机理性作物生长模型。它不但运用Richard方程,使其能够精确的模拟土壤中水分的运动,而且耦合了WOFOST作物模型使作物的生长描述更为科学。 本文让更多的科研人员和农业工作者

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟)

【每日一题】LeetCode 2181.合并零之间的节点(链表、模拟) 题目描述 给定一个链表,链表中的每个节点代表一个整数。链表中的整数由 0 分隔开,表示不同的区间。链表的开始和结束节点的值都为 0。任务是将每两个相邻的 0 之间的所有节点合并成一个节点,新节点的值为原区间内所有节点值的和。合并后,需要移除所有的 0,并返回修改后的链表头节点。 思路分析 初始化:创建一个虚拟头节点

每日一题|牛客竞赛|四舍五入|字符串+贪心+模拟

每日一题|四舍五入 四舍五入 心有猛虎,细嗅蔷薇。你好朋友,这里是锅巴的C\C++学习笔记,常言道,不积跬步无以至千里,希望有朝一日我们积累的滴水可以击穿顽石。 四舍五入 题目: 牛牛发明了一种新的四舍五入应用于整数,对个位四舍五入,规则如下 12345->12350 12399->12400 输入描述: 输入一个整数n(0<=n<=109 ) 输出描述: 输出一个整数

每日一练7:简写单词(含链接)

1.链接 简写单词_牛客题霸_牛客网 2.题目 3.代码1(错误经验) #include <iostream>#include <string>using namespace std;int main() {string s;string ret;int count = 0;while(cin >> s)for(auto a : s){if(count == 0){if( a <=

计算机视觉工程师所需的基本技能

一、编程技能 熟练掌握编程语言 Python:在计算机视觉领域广泛应用,有丰富的库如 OpenCV、TensorFlow、PyTorch 等,方便进行算法实现和模型开发。 C++:运行效率高,适用于对性能要求严格的计算机视觉应用。 数据结构与算法 掌握常见的数据结构(如数组、链表、栈、队列、树、图等)和算法(如排序、搜索、动态规划等),能够优化代码性能,提高算法效率。 二、数学基础

【每日刷题】Day113

【每日刷题】Day113 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 91. 解码方法 - 力扣(LeetCode) 2. LCR 098. 不同路径 - 力扣(LeetCode) 3. 63. 不同路径 II - 力扣(LeetCode) 1. 91. 解码方法 - 力扣(LeetCode) //思路:动态规划。 cl

java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频)

这是什么系统? 资源获取方式在最下方 java计算机毕设课设—停车管理信息系统(附源码、文章、相关截图、部署视频) 停车管理信息系统是为了提升停车场的运营效率和管理水平而设计的综合性平台。系统涵盖用户信息管理、车位管理、收费管理、违规车辆处理等多个功能模块,旨在实现对停车场资源的高效配置和实时监控。此外,系统还提供了资讯管理和统计查询功能,帮助管理者及时发布信息并进行数据分析,为停车场的科学

Debugging Lua Project created in Cocos Code IDE creates “Waiting for debugger to connect” in Win-7

转自 I Installed Cocos Code IDE and created a new Lua Project. When Debugging the Project(F11) the game window pops up and gives me the message waiting for debugger to connect and then freezes. Also a