Joint Cascade Face Detection and Alignment(JDA)文档

2024-05-11 22:08

本文主要是介绍Joint Cascade Face Detection and Alignment(JDA)文档,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

地址:https://github.com/luoyetx/JDA

一、算法流程图:

训练过程:

检测过程:

二、类图:

从上图可以看出整个系统主要分为两大模块,数据存储模块与CART模块,两个模块集中于JDA分类器上,整个系统只实例化一个JDA分类器,存储于Config中。

三、细节实现:

  • 训练分为5个stage,每个stage训练一个cart森林,这里采用的是Real Adaboost算法:
    待补充…………
  • 在每一轮训练中,会训练K个cart树,训练每一个cart树前开始都会做hard negative mining补充负例,采用的方法如下:
    在所有的负例图片中,从第一张开始,滑窗图片上的每个区域,窗口大小固定,与原始人脸图片大小一样,对每一个区域做旋转和反转变换(共八种),然后用该区域通过当前的检测器,如果被检测为负例则丢弃,如果检测为正例,则加入训练集,直至数量达标为止,当训练未结束而负例数据已经用完时,训练会被迫中止。
  • 每一棵cart树训练开始前还会对正例和负例数据做一次排序,根据score由大到小排列,采用的排序算法是快排,注意,这里会大量用到增加内存负载的swap操作。
  • 做完hard negative mining和排序后,会计算所有数据得分的density_graph:
    这个函数并没有实际意义,主要用来辅助理解,引用作者的话
    add a function draw_density_graph to view the density distribution of scores
    + means density of positive scores
    x means density of negative scores
    * means at point both positive and negative have the same density”
    其输出的是得分的分布情况,横轴表示的是阈值区间,纵轴纵轴表示的是某阈值区间下的样本数量占该类别样本数量的比例,输出如下所示:


    从图上可以看出,正例样本分布越靠右,负例样本越靠左,其分类效果越好。
    下图是经过一段时间训练后的样本分布,可以看出其差别:
  • 所有数据权重的计算公式:


    其中fi是其score,yi是其label,取值{1(正例),-1(负例)},计算完之后会将所有正例和负例分别归一化为1。
  • 关于特征的提取:
    每一层的特征维度可以设置为不同大小,默认为1000。
    训练数据会以原尺寸,二分之一尺寸和四分之一尺寸分别存储,这么做的目的是因为提取特征时,会随机的在三种尺度中选择一种尺度的图片,论文原句如下:
    “During split test for an internal node, we extend the shape indexed pixel difference features in [4] to multi-scale. Specifically, we generate three scales of images by down sampling the input image to half and one fourth. To generate a feature, we randomly choose an image scale, pick up two random facial points in the current shape, generate two random offsets with respect to the points and take the difference of the two offsetted pixels as the feature. We found the multi-scale pixel difference feature is more robust to noises and necessary for detection learning. ”

    接下来会随机选择两个特征点,也就是人脸关键点作为提取基点,然后以这两个基点为中心,在给定的半径内(每一层的半径不同,越往后半径越小)各随机定位一个像素点,然后计算这两个像素点的差值作为特征。

    容易计算,假如特征维度为1000,数据数量为10000,那么一个cart树上每个结点的特征数量为10000*1000。

  • 关于树上每个结点是用作回归还是分类,以概率p随机选择,概率p随层熟增大而减小。p越大,分类概率越大。
  • cart划分采用gini度量指标,回归以最小像素差指标。

这篇关于Joint Cascade Face Detection and Alignment(JDA)文档的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/980785

相关文章

Python操作PDF文档的主流库使用指南

《Python操作PDF文档的主流库使用指南》PDF因其跨平台、格式固定的特性成为文档交换的标准,然而,由于其复杂的内部结构,程序化操作PDF一直是个挑战,本文主要为大家整理了Python操作PD... 目录一、 基础操作1.PyPDF2 (及其继任者 pypdf)2.PyMuPDF / fitz3.Fre

springboot自定义注解RateLimiter限流注解技术文档详解

《springboot自定义注解RateLimiter限流注解技术文档详解》文章介绍了限流技术的概念、作用及实现方式,通过SpringAOP拦截方法、缓存存储计数器,结合注解、枚举、异常类等核心组件,... 目录什么是限流系统架构核心组件详解1. 限流注解 (@RateLimiter)2. 限流类型枚举 (

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

Java docx4j高效处理Word文档的实战指南

《Javadocx4j高效处理Word文档的实战指南》对于需要在Java应用程序中生成、修改或处理Word文档的开发者来说,docx4j是一个强大而专业的选择,下面我们就来看看docx4j的具体使用... 目录引言一、环境准备与基础配置1.1 Maven依赖配置1.2 初始化测试类二、增强版文档操作示例2.

Java操作Word文档的全面指南

《Java操作Word文档的全面指南》在Java开发中,操作Word文档是常见的业务需求,广泛应用于合同生成、报表输出、通知发布、法律文书生成、病历模板填写等场景,本文将全面介绍Java操作Word文... 目录简介段落页头与页脚页码表格图片批注文本框目录图表简介Word编程最重要的类是org.apach

Python Pillow 库详解文档(最新推荐)

《PythonPillow库详解文档(最新推荐)》Pillow是Python中最流行的图像处理库,它是PythonImagingLibrary(PIL)的现代分支和继承者,本文给大家介绍Pytho... 目录python Pillow 库详解文档简介安装核心模块架构Image 模块 - 核心图像处理基本导入

C#实现将Office文档(Word/Excel/PDF/PPT)转为Markdown格式

《C#实现将Office文档(Word/Excel/PDF/PPT)转为Markdown格式》Markdown凭借简洁的语法、优良的可读性,以及对版本控制系统的高度兼容性,逐渐成为最受欢迎的文档格式... 目录为什么要将文档转换为 Markdown 格式使用工具将 Word 文档转换为 Markdown(.

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

Maven项目中集成数据库文档生成工具的操作步骤

《Maven项目中集成数据库文档生成工具的操作步骤》在Maven项目中,可以通过集成数据库文档生成工具来自动生成数据库文档,本文为大家整理了使用screw-maven-plugin(推荐)的完... 目录1. 添加插件配置到 pom.XML2. 配置数据库信息3. 执行生成命令4. 高级配置选项5. 注意事