Go语言如何判断两张图片的相似度

2025-06-10 15:50

本文主要是介绍Go语言如何判断两张图片的相似度,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下...

在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:

  • 图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个社交媒体平台的运营,每天要处理数万张图片。重复图片不仅占用存储空间,还会影响用户体验。
  • 内容审核:一些平台需要筛选相似或重复的内容,防止版权侵犯和内容垃圾。
  • 版权维 权:检测图片有无被未经授权使用的情况,比如,摄影师和设计师需要知道自己的作品是否被未经授权使用。
  • 相似图片搜索:网盘、云存储服务需要帮助用户清理重复文件。

在这些场景中,图片对比技术可以帮我们自动化处理大量图片,提高工作效率。

但是,图片对比可不像字符那样可以直接使用等于号=直接对比,那么,我们有哪些对比方式呢?

方法一:MD5指纹对比 - 精确匹配

MD5 是一种信息摘要算法,可以将任意长度的数据映射为固定长度的字符串。对于图片文件,我们可以将其计算出一个独一无二的 MD5 值,就像一个数字指纹,可以用来精确比对两个文件(不仅仅是图片)是否完全相同。

下面是使用 Go 语言计算图片 MD5 值的示例代码:

package main

import (
    "crypto/md5"
    "fmt"
    "io"
    "os"
)

// calculateMD5 计算文件的MD5值
// 为图片颁发独一无二的“身份证”
func calculateMD5(filePath string) (string, error) {
    // 打开文件
    file, err := os.Open(filhttp://www.chinasem.cnePath)
    if err != nil {
        return "", fmt.Errorf("无法打开文件:%v", err)
    }
    defer file.Close()

    // 创建MD5哈希器
    hash := md5.New()

    // 将文件内容复制到哈希器中
    if _, err := io.Copy(hash, file); err != nil {
        return "", fmt.Errorf("计算MD5时出错:%v", err)
    }

    // 返回MD5字符串
    return fmt.Sprintf("%x", hash.Sum(nil)), nil
}

func main() {
    // 比较两张图片
    md51, err := calculateMD5(www.chinasem.cn"image1.jpg")
    if err != nil {
        fmt.Println("图片1处理失败:", err)
        return
    }

    md52, err := calculateMD5("image2.jpg")
    if err != nil {
        fmt.Println("图片2处理失败:", err)
        return
    }

    // 对比结果
    if md51 == md52 {
        fmt.Println("图片完全相同")
    } else {
        fmt.Println("图片不同")
    }
}

代码解读:

  • 我们定义了一个 calculateMD5 函数,传入文件路径,返回计算出的 MD5 字符串。
  • 函数中先打开文件,创建一个 MD5 哈希器 hash
  • 通过io.Copy将文件内容写入哈希器中,计算出 MD5 值。
  • 最后将 MD5 字节数组格式化为字符串返回。
  • main 函数中,我们计算两个图片文件的 MD5 值,比对它们是否相等,输出结果。

MD5 比对的特点:

  • 速度快、计算简单
  • 精确判断两个文件是否完全相同(只要是文件,都可以通过这种方式进行判断是否一样)
  • 无法检测内容相似但不完全相同的图片
  • 图片稍有改动(如添加水印)就会导致 MD5 值完全不同

所以 MD5 比对适合用于检测完全相同的图片,如文件去重等场景。如果两张图片只是稍作修改(如调整亮度、旋转等),MD5 就无能为力了。

方法二:图像哈希对比

图像哈希(Image Hashing)是一类可以比较图片相似程度的算法。其基本原理是:将图片缩小、简化为一个哈希值,然后比较不同图片哈希值的差异度,来判断它们的相似程度。

常见的图像哈希算法有:

  • 平均哈希(Average Hash)
  • 感知哈希(Perceptual Hash)
  • 差异哈希(Difference Hash)
  • 小波哈希(Wavelet Hash)

这里我们以第三方包为例:

首先先安装这个包

go get github.com/corona10/goimagehash

然后我们来尝试实现一个图片相似度比对:

package main

import (
	"fmt"
	"image/png"
	"os"

	"github.com/corona10/goimagehash"
)

// compareImageSimilarity 比较图片相似度
func compareImageSimilarity(image1Path, image2Path string) error {
	file1, err := os.Open(image1Path)
	if err != nil {
		return fmt.Errorf("打开图片1失败:%v", err)
	}
	defer file1.Close()javascript

	file2, err := os.Open(image2Path)
	if err != nil {
		return fmt.Errorf("打开图片2失败:%v", err)
	}
	defer file2.Close()

	// 加载图片
	img1, err := png.Decode(file1)
	if err != nil {
		return fmt.Errorf("加载图片1失败:%v", err)
	}

	img2, err := png.Decode(file2)
	if err != nil {
		return fmt.Errorf("加载图片2失败:%v", err)
	}

	// 生成平均哈希
	avgHash1, err := goimagehash.AverageHash(img1)
	if err != nil {
		return fmt.Errorf("生成图片1哈希失败:%v", err)
	}

	avgHash2, err := goimagehash.AverageHash(img2)
	if err != nil {
		return fmt.Errorf("生成图片2哈希失败:%v", err)
	}

	// 计算差异哈希
	diffHash1, err := goimagehash.DifferenceHash(img1)
	if err != nil {
		return fmt.Errorf("生成图片1差异哈希失败:%v", err)
	}

	diffHash2, err := goimagehphpash.DifferenceHash(img2)
	if err != nil {
		return fmt.Errorf("生成图片2差异哈希失败:%v", err)
	}

	// 计算汉明距离
	avgDistance, err := avgHash1.Distance(avgHash2)
	if err != nil {
		return fmt.Errorf("计算平均哈希距离失败:%v", err)
	}

	diffDistance, err := diffHash1.Distance(diffHash2)
	if err != nil {
		return fmt.Errorf("计算差异哈希距离失败:%v", err)
	}

	// 打印相似度
	fmt.Printf("平均哈希距离:%d\n", avgDistance)
	fmt.Printf("差异哈希距离:%d\n", diffDistance)

	// 判断相似程度
	if avgDistance == 0 && diffDistance == 0 {
		fmt.Println("两张图一样")
	} else if avgDistance <= 5 || diffDistance <= 5 {
		fmt.Println("图片高度相似")
	} else if avgDistance <= 10 || diffDistance <= 10 {
		fmt.Println("图片相似")
	} else {
		fmt.Println("图片差异较大")
	}

	return nil
}

func main() {
	err := compareImageSimilarity("img.png", "img_1.png")
	if err != nil {
		fmt.Println("图片对比出错:", err)
	}
}

图像哈希的特点:

  • 可以比较图片内容的相似程度
  • 对图片的缩放、旋转、亮度变化等稍微鲁棒
  • 计算难度适中,可应用于相似图片搜索等场景
  • 仍无法识别完全不同但语义相似的图片(比如同一物体不同角度的照片)

它们各有特点和适用场景:

MD5指纹:简单快速,适合精确匹配完全相同的图片。 图像哈希:可以比较图片的相似程度,在相似图片搜索等场景下很有用。

当然,这只是图像相似度算法的冰山一角。在实际应用中,我们还需要考虑性能、精度、复杂度等因素,选择最适合的方案。

图像识别领域在不断发展,一些前沿技术如机器学习、深度神经网络等,China编程为图片相似度判断带来了更多的可能性,值得我们去学习和探索。

到此这篇关于Go语言如何判断两张图片的相似度的文章就介绍到这了,更多相关Go判断图片相似度内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!

这篇关于Go语言如何判断两张图片的相似度的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154992

相关文章

基于 HTML5 Canvas 实现图片旋转与下载功能(完整代码展示)

《基于HTML5Canvas实现图片旋转与下载功能(完整代码展示)》本文将深入剖析一段基于HTML5Canvas的代码,该代码实现了图片的旋转(90度和180度)以及旋转后图片的下载... 目录一、引言二、html 结构分析三、css 样式分析四、JavaScript 功能实现一、引言在 Web 开发中,

Python如何去除图片干扰代码示例

《Python如何去除图片干扰代码示例》图片降噪是一个广泛应用于图像处理的技术,可以提高图像质量和相关应用的效果,:本文主要介绍Python如何去除图片干扰的相关资料,文中通过代码介绍的非常详细,... 目录一、噪声去除1. 高斯噪声(像素值正态分布扰动)2. 椒盐噪声(随机黑白像素点)3. 复杂噪声(如伪

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

python判断文件是否存在常用的几种方式

《python判断文件是否存在常用的几种方式》在Python中我们在读写文件之前,首先要做的事情就是判断文件是否存在,否则很容易发生错误的情况,:本文主要介绍python判断文件是否存在常用的几种... 目录1. 使用 os.path.exists()2. 使用 os.path.isfile()3. 使用

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Go语言中泄漏缓冲区的问题解决

《Go语言中泄漏缓冲区的问题解决》缓冲区是一种常见的数据结构,常被用于在不同的并发单元之间传递数据,然而,若缓冲区使用不当,就可能引发泄漏缓冲区问题,本文就来介绍一下问题的解决,感兴趣的可以了解一下... 目录引言泄漏缓冲区的基本概念代码示例:泄漏缓冲区的产生项目场景:Web 服务器中的请求缓冲场景描述代码

Go语言中Recover机制的使用

《Go语言中Recover机制的使用》Go语言的recover机制通过defer函数捕获panic,实现异常恢复与程序稳定性,具有一定的参考价值,感兴趣的可以了解一下... 目录引言Recover 的基本概念基本代码示例简单的 Recover 示例嵌套函数中的 Recover项目场景中的应用Web 服务器中

使用Python实现base64字符串与图片互转的详细步骤

《使用Python实现base64字符串与图片互转的详细步骤》要将一个Base64编码的字符串转换为图片文件并保存下来,可以使用Python的base64模块来实现,这一过程包括解码Base64字符串... 目录1. 图片编码为 Base64 字符串2. Base64 字符串解码为图片文件3. 示例使用注意