MTCNN算法详解

2024-02-09 06:38
文章标签 算法 详解 mtcnn

本文主要是介绍MTCNN算法详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

MTCNN:基于多任务卷积神经网络的人脸检测

本文特点:

①提出结合face detection和alignment的轻量级级联网络

②online hard sample mining

 

网络结构

 

输入图像resize

minsize是指图片中需要识别的人脸的最小尺寸(单位:px);factor是指每次对边缩放的倍数,文中使用的factor是0.709 ,原因是将长和宽各缩小一半的话,面积就变为了1/4,这样的缩放幅度太大了,因此使用了0.709≈ sqrt(2)/2,这样面积就只缩小了一半。

第一阶段会多次缩放原图得到图片金字塔,目的是为了让缩放后图片中的人脸与P-NET训练时候的图片尺度(12px * 12px)接近。

先把原图等比缩放`12/minsize,再按缩放因子factor(例如0.5)用上一次的缩放结果不断缩放,直至最短边小于或等于12。minsize越大,生成的“金字塔”层数越少,resize和P-Net的计算量越小。

 

P-Net

输入:resize为12*12的图片和预训练框

输出:人脸候选框坐标,人脸的置信度和人脸5个特征点

因为这个模型是结合了人脸分类、人脸检测和人脸特征点,所以有三部分输出(上图的三个子网络都有三部分输出)

人脸框坐标对应问题

计算输入图像(就是矩阵)上一个左上角坐标(X, Y)、宽和高都是12的区域,经过P-NET的卷积和池化操作,对应于了1*1*32维矩阵上的(X/2 – 5 , Y/2 – 5)

 

R-Net

输入:P-Net计算出来的人脸候选框,还有resize中24*24大小的图片

输出:人脸候选框坐标,人脸的置信度和人脸5个特征点

 

O-Net

输入:R-Net输出的人脸候选框和resize为48*48的图片

输出:人脸候选框坐标,人脸的置信度和人脸5个特征点

 

从上面的结构图中可以看到,三种网络结构非常相似,R-Net和O-Net中都有全连接,因此这两部分不能输入任意尺寸的图片。

 

online hard sample mining

每个mini-batch,由高到低排序前向传播中计算中损失值,选取前70%的samples进行反向传播计算

 

结果

16 fps 2.60GHz CPU and 99fps on GPU (Nvidia Titan Black).

 

这篇关于MTCNN算法详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/693406

相关文章

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

Redis 的 SUBSCRIBE命令详解

《Redis的SUBSCRIBE命令详解》Redis的SUBSCRIBE命令用于订阅一个或多个频道,以便接收发送到这些频道的消息,本文给大家介绍Redis的SUBSCRIBE命令,感兴趣的朋友跟随... 目录基本语法工作原理示例消息格式相关命令python 示例Redis 的 SUBSCRIBE 命令用于订

使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解

《使用Python批量将.ncm格式的音频文件转换为.mp3格式的实战详解》本文详细介绍了如何使用Python通过ncmdump工具批量将.ncm音频转换为.mp3的步骤,包括安装、配置ffmpeg环... 目录1. 前言2. 安装 ncmdump3. 实现 .ncm 转 .mp34. 执行过程5. 执行结

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

SpringBoot日志级别与日志分组详解

《SpringBoot日志级别与日志分组详解》文章介绍了日志级别(ALL至OFF)及其作用,说明SpringBoot默认日志级别为INFO,可通过application.properties调整全局或... 目录日志级别1、级别内容2、调整日志级别调整默认日志级别调整指定类的日志级别项目开发过程中,利用日志

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MySQL8 密码强度评估与配置详解

《MySQL8密码强度评估与配置详解》MySQL8默认启用密码强度插件,实施MEDIUM策略(长度8、含数字/字母/特殊字符),支持动态调整与配置文件设置,推荐使用STRONG策略并定期更新密码以提... 目录一、mysql 8 密码强度评估机制1.核心插件:validate_password2.密码策略级

从入门到精通详解Python虚拟环境完全指南

《从入门到精通详解Python虚拟环境完全指南》Python虚拟环境是一个独立的Python运行环境,它允许你为不同的项目创建隔离的Python环境,下面小编就来和大家详细介绍一下吧... 目录什么是python虚拟环境一、使用venv创建和管理虚拟环境1.1 创建虚拟环境1.2 激活虚拟环境1.3 验证虚

详解python pycharm与cmd中制表符不一样

《详解pythonpycharm与cmd中制表符不一样》本文主要介绍了pythonpycharm与cmd中制表符不一样,这个问题通常是因为PyCharm和命令行(CMD)使用的制表符(tab)的宽... 这个问题通常是因为PyCharm和命令行(CMD)使用的制表符(tab)的宽度不同导致的。在PyChar