基于insightface实现的人脸检测,人脸识别,insightface源码讲解。

2023-11-10 18:12

本文主要是介绍基于insightface实现的人脸检测,人脸识别,insightface源码讲解。,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1.搭建insightface需要的环境

2.下载insightface工程

3.代码工程文件讲解

        3.1 python-package

        3.2 进行测试

        3.3 examples

4. 人脸识别

5.代码理解:


1.搭建insightface需要的环境

        埋个坑,后续再写,笔者在安装过程中遇到了一些问题。

2.下载insightface工程

        直接打开github搜索insightface即可找到,或者点击下面的连接直接跳转。

        deepinsight/insightface: State-of-the-art 2D and 3D Face Analysis Project (github.com)

     

3.代码工程文件讲解

        从github上下载完成功,使用pycharm 打开,目录如下,笔者认为最终要的是在使用红框框处的两个文件夹,我们先讲解python-package。

        3.1 python-package

        我们首先要在pycharm 中的终端执行一下  python-package中的setup.py这个文件

        具体操作如下,先跳转到python-package目录下,

        然后执行: python setup.py build_ext -i

        如下图所示执行成功。

        其实笔者在这一部分是有疑惑的,这个setup.py文件的作用是什么?笔者不太懂,如果有大佬明白,希望可以指教一下。

        3.2 进行测试

        按照官方介绍,我们使用示例代码进行检测,先在python-package目录下创建 test.py文件(一定要在python-package目录下)

然后将下列代码输入,然后运行就可以得到检测图片

import cv2
import numpy as np
import insightface
from insightface.app import FaceAnalysis
from insightface.data import get_image as ins_get_imageapp = FaceAnalysis(allowed_modules=['detection'],providers=['CUDAExecutionProvider', 'CPUExecutionProvider'],download=False)
app.prepare(ctx_id=0, det_size=(640, 640))
img = ins_get_image('t1')  #不用带后缀,图片放到./insightface/python-package/insightface/data/images
faces = app.get(img)
print("faces::::", faces)
print("len:", len(faces))
rimg = app.draw_on(img, faces)
cv2.imwrite("./ldh_out put.jpg", rimg)
cv2.imshow("frame", rimg)
if cv2.waitKey(0) & 0xFF == ord('Q'):cv2.destroyAllWindows()

        第一次运行会自动下载模型,如果网速十分拉胯的话,可以选择自己去github上下载,然后把模型解压放在下方图片中红色框框中的地址。

我也把模型下载链接放在这了:buffalo_l.zip - Google 云端硬盘

        下载的模型文件,测试的使用除det_10g.onnx必须使用,其他四个模型文件根据自己所需使用。  此外github上此项目还拥有丰富的模型文件,根据自己所需下载使用(目前我还没太搞懂,如果有大佬可以,可以写篇博客介绍一下)

下面是检测后的图片

        至此项目就算是跑通了。

        3.3 examples

        exampes文件夹中也给大家提供了一些事例,大家可以自行去理解,运行,run一下。注意将这些文件放在pythoh-package目录下运行。

4. 人脸识别

        目前这一部分我还没有完全做完,先讲一下我的思路,以及现在做的一些工作。

前面进行的只是人脸检测,可以检测到图片中的人脸,并不能检测到图片中的人脸是谁。

那么思路就是,先建立一个人脸数据库,然后检测出人脸数据库中每个人的人脸特征数据(接下来我打算使用embedding 特征),存储在一个文件中,当我们需要检测人脸时,我们先将存储人脸数据特征G的文件读入内存,然后使用模型检测出需要检测的人脸的人脸特征T,然后将T特征与G特征使用一定方法对比(欧氏距离,余弦距离等),选出与之最相似的人脸。

        下列是我初始写的计算相似度的代码

import argparse  # 导入参数解析模块
import cv2  # 导入OpenCV模块
import sys  # 导入sys模块
import numpy as np  # 导入NumPy模块
import insightface  # 导入insightface模块
from insightface.app import FaceAnalysis  # 从insightface.app中导入FaceAnalysis类
from insightface.data import get_image as ins_get_image  # 从insightface.data中导入get_image函数
import time
assert insightface.__version__>='0.3'  # 断言版本不低于0.3parser = argparse.ArgumentParser(description='insightface app test')  # 创建参数解析器,设置描述为'insightface app test'
# 通用设置
parser.add_argument('--ctx', default=0, type=int, help='ctx id, <0 means using cpu')  # 添加参数'--ctx',默认值为0,类型为整数,帮助信息为'ctx id, <0 means using cpu'
parser.add_argument('--det-size', default=640, type=int, help='detection size')  # 添加参数'--det-size',默认值为640,类型为整数,帮助信息为'detection size'
args = parser.parse_args()  # 解析参数app = FaceAnalysis()  # 创建FaceAnalysis实例
app.prepare(ctx_id=args.ctx, det_size=(args.det_size,args.det_size))  # 准备分析器,设置ctx_id和det_size
t= time.time()
img = ins_get_image('t1')  # 获取图像't1'
# t= time.time()
faces = app.get(img)  # 识别图像中的人脸
e = time.time()
print("识别人脸:", e-t)
# assert len(faces)==6  # 断言人脸数量为6
rimg = app.draw_on(img, faces)  # 在图像上绘制检测到的人脸
cv2.imwrite("./t1_output.jpg", rimg)  # 将结果图像保存为"t1_output.jpg"# 然后打印两两人脸之间的相似度
feats = []  # 创建空列表feats
test = []
for face in faces:  # 遍历每个人脸feats.append(face.normed_embedding)  # 将人脸的嵌入特征加入feats列表
test.append(faces[0].normed_embedding)
test = np.array(test, dtype=np.float32)
feats = np.array(feats, dtype=np.float32)  # 将feats转换为NumPy数组,数据类型为np.float32
a = time.time()
sims = np.dot(feats, feats.T)  # 计算feats和其转置之间的点积,得到相似度矩阵
b = time.time()
print(sims)  # 输出相似度矩阵
print("用时1:", b-a)# 使用landmark_2d_106 计算相似度
land = []
for face in faces:land.append(face.landmark_2d_106)
land = np.array(land, dtype=np.float32)  # 将feats转换为NumPy数组,数据类型为np.float32
def euclidean_distance(landmarks1, landmarks2):# 计算两组特征点之间的距离distances = np.sqrt(np.sum((landmarks1 - landmarks2)**2, axis=1))# 返回平均距离作为匹配度return np.mean(distances)
dist_matrix = np.zeros((len(land), len(land)))
# 计算欧氏距禮以进行人脸比对
c = time.time()
for i in range(len(land)):for j in range(len(land)):dist_matrix[i, j] = euclidean_distance(land[i], land[j])
print("The distance matrix between the faces is:", dist_matrix)
d = time.time()
print("用时2:", d-c)

        相似度矩阵:

5.代码理解:

        我们以test.py代码为例

        前几行都是导包,直接到第七行代码:

app = FaceAnalysis(allowed_modules=['detection'],providers=['CUDAExecutionProvider', 'CPUExecutionProvider'],download=False)

        我们先不纠结这里面参数啥的,这行代码创建了一个实例,然后最大的作用就是加载读入了本地的那些模型文件。加载主要过程如下图我画红框的部分。大家可以自己debug理解一下。

        第八行代码就是设置了一些参数

app.prepare(ctx_id=0, det_size=(640, 640))

       第九行代码就是获取要检测的图片

img = ins_get_image('t1')  #不用带后缀,图片放到./insightface/python-package/insightface/data/images

        第十行就是进行检测了

faces = app.get(img)

        过程大概将就是先使用下面的人脸检测模型把人脸都检测出来。

        接着使用剩余的模型检测各种人脸特征。

        检测到了六张人脸

        一张人脸包含如下数据

        这里并没有人脸特征数据,因为第七行代码中我们设置了参数:

        allowed_modules=['detection'],删除后就可以检测人脸特征

        创作不易,求点赞,求关注,求收藏。水平有限,如有误解之处,求指正。

这篇关于基于insightface实现的人脸检测,人脸识别,insightface源码讲解。的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/384414

相关文章

Java实现视频格式转换的完整指南

《Java实现视频格式转换的完整指南》在Java中实现视频格式的转换,通常需要借助第三方工具或库,因为视频的编解码操作复杂且性能需求较高,以下是实现视频格式转换的常用方法和步骤,需要的朋友可以参考下... 目录核心思路方法一:通过调用 FFmpeg 命令步骤示例代码说明优点方法二:使用 Jaffree(FF

基于C#实现MQTT通信实战

《基于C#实现MQTT通信实战》MQTT消息队列遥测传输,在物联网领域应用的很广泛,它是基于Publish/Subscribe模式,具有简单易用,支持QoS,传输效率高的特点,下面我们就来看看C#实现... 目录1、连接主机2、订阅消息3、发布消息MQTT(Message Queueing Telemetr

Java实现图片淡入淡出效果

《Java实现图片淡入淡出效果》在现代图形用户界面和游戏开发中,**图片淡入淡出(FadeIn/Out)**是一种常见且实用的视觉过渡效果,它可以用于启动画面、场景切换、轮播图、提示框弹出等场景,通过... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细

Python实现获取带合并单元格的表格数据

《Python实现获取带合并单元格的表格数据》由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,所以本文我们就来聊聊如何使用Python实现获取带合并单元格的表格数据吧... 由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,现将将封装成类,并通过调用list_exc

使用animation.css库快速实现CSS3旋转动画效果

《使用animation.css库快速实现CSS3旋转动画效果》随着Web技术的不断发展,动画效果已经成为了网页设计中不可或缺的一部分,本文将深入探讨animation.css的工作原理,如何使用以及... 目录1. css3动画技术简介2. animation.css库介绍2.1 animation.cs

CSS引入方式和选择符的讲解和运用小结

《CSS引入方式和选择符的讲解和运用小结》CSS即层叠样式表,是一种用于描述网页文档(如HTML或XML)外观和格式的样式表语言,它主要用于将网页内容的呈现(外观)和结构(内容)分离,从而实现... 目录一、前言二、css 是什么三、CSS 引入方式1、行内样式2、内部样式表3、链入外部样式表四、CSS 选

Java进行日期解析与格式化的实现代码

《Java进行日期解析与格式化的实现代码》使用Java搭配ApacheCommonsLang3和Natty库,可以实现灵活高效的日期解析与格式化,本文将通过相关示例为大家讲讲具体的实践操作,需要的可以... 目录一、背景二、依赖介绍1. Apache Commons Lang32. Natty三、核心实现代

SpringBoot实现接口数据加解密的三种实战方案

《SpringBoot实现接口数据加解密的三种实战方案》在金融支付、用户隐私信息传输等场景中,接口数据若以明文传输,极易被中间人攻击窃取,SpringBoot提供了多种优雅的加解密实现方案,本文将从原... 目录一、为什么需要接口数据加解密?二、核心加解密算法选择1. 对称加密(AES)2. 非对称加密(R

基于Go语言实现Base62编码的三种方式以及对比分析

《基于Go语言实现Base62编码的三种方式以及对比分析》Base62编码是一种在字符编码中使用62个字符的编码方式,在计算机科学中,,Go语言是一种静态类型、编译型语言,它由Google开发并开源,... 目录一、标准库现状与解决方案1. 标准库对比表2. 解决方案完整实现代码(含边界处理)二、关键实现细

python通过curl实现访问deepseek的API

《python通过curl实现访问deepseek的API》这篇文章主要为大家详细介绍了python如何通过curl实现访问deepseek的API,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编... API申请和充值下面是deepeek的API网站https://platform.deepsee