【以图搜图】Python实现根据图片批量匹配(查找)相似图片

2023-10-10 10:59

本文主要是介绍【以图搜图】Python实现根据图片批量匹配(查找)相似图片,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目的:可以解决在本地实现根据图片查找相似图片的功能

背景:由于需要查找别人代码保存的图像的命名,但由于数据集是cifa10图像又小又多,所以直接找很费眼睛,所以实现用该代码根据图像查找图像,从而得到保存图像的命名。

方法:

1、将需要查找的图像(查询图像, queryImg)放入queryImgs文件夹,以及一个存放数据库图像的文件夹datasetImgs

2、批量读取查询图像

3、根据MSE(均方误差)和SSIM(结构相似性指数)计算权重,来比较两张图像的相似程度。

其中:

MSE(均方误差):计算两张图片的每个像素值之间的平均差值,结果越小表示两张图片越相似。

SSIM(结构相似性指数):比较两张图片的结构、亮度和对比度等方面的相似程度,结果介于-1到1之间,越接近1表示两张图片越相似。

weight=MSE\times (1-SSIM)

4、以224×224的大小显示当前queryImg和bestImg(数据库图像中相似度最高的图像),title为queryImg和bestImg的文件名。

5、将bestImg移动到命名为“dstImgs”的文件夹,并保留源文件名称。

运行速度:

在1万张32×32图像中,平均检索速度:34.64s左右(不包括对数据库图像使用transform统一大小),可以为权重设置阈值提前结束检索(建议阈值为小于10)。

限制:

1、需要明确查询图像和数据库图像的大小,并手动更改对应注释的代码。

2、检索结果唯一,不能检索到多个结果(由于我知道我的datasets里只有唯一对应的图像,所以代码逻辑是只保存最相似的图像,或第一个相似度权重小于10的图像),不过可以自行修改代码实现检索多个结果。

代码:

import os
import shutil
import time
from skimage.metrics import structural_similarity as compare_ssim
from torchvision.transforms import transforms
from PIL import Image
import cv2
import numpy as npdata_transform = transforms.Resize((32, 32))  # 数据库图像和查询图像统一大小,大小为32×32
show_transform = transforms.Resize((224, 224))  # 显示图像大小为224×224def transformImg(img, transform):img = transform(Image.fromarray(img))img = np.array(img)return imgroot_path = "./queryImgs"  # 查询图像所在的文件夹
dataset_path = "./datasetImgs"  # 数据库图像所在的文件夹for query_img in os.listdir(root_path):query_img_path = os.path.join(root_path, query_img)query_img_obj = cv2.imread(query_img_path)query_img_obj = transformImg(query_img_obj, data_transform)best_mse = np.Infbest_ssim = np.Infbest_weight = np.Infbest_img_name = ""best_img_path = ""best_img_obj = Noneprint("Start search Img: ", query_img)start_time = time.time()for dataset_img in os.listdir(dataset_path):dataset_img_path = os.path.join(dataset_path, dataset_img)dataset_img_obj = cv2.imread(dataset_img_path)# # 统一数据库图像大小, 若数据库图像大小一致则可以只调整查询图像大小。# dataset_img_obj = transformImg(dataset_img_obj, data_transform)mse = ((query_img_obj - dataset_img_obj) ** 2).mean()ssim = compare_ssim(query_img_obj, dataset_img_obj, channel_axis=query_img_obj.shape[2] - 1)weight = mse * (1 - ssim)if weight < best_weight:best_mse = msebest_ssim = ssimbest_weight = weightbest_img_path = dataset_img_pathbest_img_obj = dataset_img_objbest_img_name = dataset_imgprint(query_img, "->", dataset_img, ": ")print("\tmse: ", best_mse, " ssim: ", ssim, " weight: ", weight)# 权重小于10提前结束检索if best_weight < 10:breakelapsed_time = time.time() - start_timebest_img = np.hstack([transformImg(query_img_obj, show_transform), transformImg(best_img_obj, show_transform)])cv2.imshow("left: {}   right: {}".format(query_img, best_img_name), best_img)cv2.waitKey(0)cv2.destroyAllWindows()if not os.path.exists("./dstImgs"): os.mkdir("./dstImgs")shutil.copy(best_img_path, './dstImgs/' + best_img_name)print("save as: ", './dstImgs/' + best_img_name, " time elapsed: ", elapsed_time, "\n")

结果:

这篇关于【以图搜图】Python实现根据图片批量匹配(查找)相似图片的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/179997

相关文章

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

Python的Darts库实现时间序列预测

《Python的Darts库实现时间序列预测》Darts一个集统计、机器学习与深度学习模型于一体的Python时间序列预测库,本文主要介绍了Python的Darts库实现时间序列预测,感兴趣的可以了解... 目录目录一、什么是 Darts?二、安装与基本配置安装 Darts导入基础模块三、时间序列数据结构与

Python正则表达式匹配和替换的操作指南

《Python正则表达式匹配和替换的操作指南》正则表达式是处理文本的强大工具,Python通过re模块提供了完整的正则表达式功能,本文将通过代码示例详细介绍Python中的正则匹配和替换操作,需要的朋... 目录基础语法导入re模块基本元字符常用匹配方法1. re.match() - 从字符串开头匹配2.

Python使用FastAPI实现大文件分片上传与断点续传功能

《Python使用FastAPI实现大文件分片上传与断点续传功能》大文件直传常遇到超时、网络抖动失败、失败后只能重传的问题,分片上传+断点续传可以把大文件拆成若干小块逐个上传,并在中断后从已完成分片继... 目录一、接口设计二、服务端实现(FastAPI)2.1 运行环境2.2 目录结构建议2.3 serv

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

通过Docker容器部署Python环境的全流程

《通过Docker容器部署Python环境的全流程》在现代化开发流程中,Docker因其轻量化、环境隔离和跨平台一致性的特性,已成为部署Python应用的标准工具,本文将详细演示如何通过Docker容... 目录引言一、docker与python的协同优势二、核心步骤详解三、进阶配置技巧四、生产环境最佳实践

Python一次性将指定版本所有包上传PyPI镜像解决方案

《Python一次性将指定版本所有包上传PyPI镜像解决方案》本文主要介绍了一个安全、完整、可离线部署的解决方案,用于一次性准备指定Python版本的所有包,然后导出到内网环境,感兴趣的小伙伴可以跟随... 目录为什么需要这个方案完整解决方案1. 项目目录结构2. 创建智能下载脚本3. 创建包清单生成脚本4

SpringBoot+RustFS 实现文件切片极速上传的实例代码

《SpringBoot+RustFS实现文件切片极速上传的实例代码》本文介绍利用SpringBoot和RustFS构建高性能文件切片上传系统,实现大文件秒传、断点续传和分片上传等功能,具有一定的参考... 目录一、为什么选择 RustFS + SpringBoot?二、环境准备与部署2.1 安装 RustF

Nginx部署HTTP/3的实现步骤

《Nginx部署HTTP/3的实现步骤》本文介绍了在Nginx中部署HTTP/3的详细步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录前提条件第一步:安装必要的依赖库第二步:获取并构建 BoringSSL第三步:获取 Nginx