快速删掉文件夹里重复或者相似的图片

2023-12-11 17:28

本文主要是介绍快速删掉文件夹里重复或者相似的图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

需求:快速删掉文件夹里重复或者相似的图片

一.软件推荐

1.电脑重复资源查找器

免费,简单好操作,在各种图像格式间比较内容,内置高速比较算法,灵活的扫描源:驱动器、文件夹、文件及类型,结果可复用:能保存 / 载入重复图片列表,支持所有常见图片类型(1,000 种以上)。

2.Duplicate Cleaner

Duplicate Cleaner Pro (官网:Duplicate Cleaner - Remove duplicate files)中文版是一款功能非常强大的重复文件查找工具,这个是无需注册、无需安装的单文件绿色便携版!程序可以帮助你快速的查找重复的图片、音乐等各种文件,可以根据字节、MD5、SHA等多种方式来 快速扫描!它可以同时搜索多个文件夹,支持按文件名称、大小和时间进行搜索。

3.DoubleKiller Pro

DoubleKiller Pro是一款小巧易用的多功能电脑重复文件清理软件,可以帮助你以文件名、大小、创建时间或CRC32校验值等特征快速扫描电脑中的所有重复文件,同时还能够支持搜索不同驱动器的指定类型的重复文件,并进行清除,很好解决电脑使用久了之后导致大量重复文件的堆积,占据电脑的大量内存的问题。

二.Github项目(python)实现

找相似图像:

1.FileManager

该项目支持22项功能如下:

  • 导出文件信息
  • 查找重复文件(基于大小和修改时间的判断方式, 以及基于文件 hash 值的判断方式)
  • 文件还原与备份(增量备份、文件同步、 文件还原)
  • 根据样本或者记录删除文件或者还原文件
  • 一键清空目录下所有空 文件夹
  • 搜索文件或者文件夹(可搜索隐藏文件)
  • 拷贝目录结构(导出到文件、 从文件恢复目录结构、导出目录结构到新目录下)
  • 比对文本文件内容(比对文 章、文档、代码的差异并将结果输出,可批量比对)
  • 计算文件 hash 值
  • 校 对字符串(校对两个字符串是否一致,包含忽略大小写,前后空格,以及忽略所 有空格)
  • 提取视频帧图像(可以批量快速提取指定视频的某一帧或者某一秒 的图像)
  • 查找相似图片(根据算法计算图片的相似度,并将满足相似度阈值 的图片移动到指定目录,可以有效找出不同分辨率、不同大小甚至是经过裁剪或 者加过水印的相似图片)
  • 查找相似视频(比对视频帧图像的相似度找出相似 视频并导出)
  • 以图搜图(选中图片在另一任意目录中搜索与之相似的图片)
  • 以视频搜相似视频(选中视频在另一任意目录中搜索与之相似的视频,主要 用于找出内容一样但是分辨率不同,或者内容一样只是水印有差异的视频)
  • 批量重命名
  • 合并视频(将选中的视频合并为一个视频,可以指定视频帧率)
  • 裁剪视频(集合了之前 video_cut 项目的代码)
  • 批量裁剪视频(选中多个 视频批量裁剪,用于去除视频片头片尾特别好用)
  • 提取音频和转换音频格式 (可以从视频中提取音频,也可以进行音频格式转换,可以指定音频帧率格式, 不一定支持所有音频格式)
  • 找出损坏或者不完整的视频(基于 ffmpeg)
  • 获取时间戳(时间与时间戳之间相互转换)以及修改文件的时间戳 所有的文件删除、文件更新操作进行防呆保护,最大限度保证数据安全!所 有操作都有日志,方便追溯和还原。涉及程序配置内容修改的操作会有权限验证


所有操作均可通过GUI界面进行操作,源码分享实属良心。

2.Imagededup

具体使用方法参考:https://github.com/chinalu/imagedups

安装
python setup.py install
使用方法
仅显示重复的图片:imagedups -p /path/to/image/folder1  
[+]开头的文件是保留的文件;
[-]开头的文件是可以清理的文件。
递归查找文件:imagedups -r -p /path/to/image/folder
查找并删除文件:imagedups -r -d -p /path/to/image/folder
删除文件是不进行确认:imagedups -r -d -N -p /path/to/image/folder
请做好数据备份

3.PicSniffer

主要采用Inception-v3模型对图片进行特征提取

文章首发地址: FUNNY AI

这篇关于快速删掉文件夹里重复或者相似的图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/481475

相关文章

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

苹果macOS 26 Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色

《苹果macOS26Tahoe主题功能大升级:可定制图标/高亮文本/文件夹颜色》在整体系统设计方面,macOS26采用了全新的玻璃质感视觉风格,应用于Dock栏、应用图标以及桌面小部件等多个界面... 科技媒体 MACRumors 昨日(6 月 13 日)发布博文,报道称在 macOS 26 Tahoe 中

Python pip下载包及所有依赖到指定文件夹的步骤说明

《Pythonpip下载包及所有依赖到指定文件夹的步骤说明》为了方便开发和部署,我们常常需要将Python项目所依赖的第三方包导出到本地文件夹中,:本文主要介绍Pythonpip下载包及所有依... 目录步骤说明命令格式示例参数说明离线安装方法注意事项总结要使用pip下载包及其所有依赖到指定文件夹,请按照以

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

C#如何去掉文件夹或文件名非法字符

《C#如何去掉文件夹或文件名非法字符》:本文主要介绍C#如何去掉文件夹或文件名非法字符的问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C#去掉文件夹或文件名非法字符net类库提供了非法字符的数组这里还有个小窍门总结C#去掉文件夹或文件名非法字符实现有输入字

C#之List集合去重复对象的实现方法

《C#之List集合去重复对象的实现方法》:本文主要介绍C#之List集合去重复对象的实现方法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录C# List集合去重复对象方法1、测试数据2、测试数据3、知识点补充总结C# List集合去重复对象方法1、测试数据

使用Python实现base64字符串与图片互转的详细步骤

《使用Python实现base64字符串与图片互转的详细步骤》要将一个Base64编码的字符串转换为图片文件并保存下来,可以使用Python的base64模块来实现,这一过程包括解码Base64字符串... 目录1. 图片编码为 Base64 字符串2. Base64 字符串解码为图片文件3. 示例使用注意

c/c++的opencv实现图片膨胀

《c/c++的opencv实现图片膨胀》图像膨胀是形态学操作,通过结构元素扩张亮区填充孔洞、连接断开部分、加粗物体,OpenCV的cv::dilate函数实现该操作,本文就来介绍一下opencv图片... 目录什么是图像膨胀?结构元素 (KerChina编程nel)OpenCV 中的 cv::dilate() 函