Joint Cascade Face Detection and Alignment(JDA)文档

2024-05-11 22:08

本文主要是介绍Joint Cascade Face Detection and Alignment(JDA)文档,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

地址:https://github.com/luoyetx/JDA

一、算法流程图:

训练过程:

检测过程:

二、类图:

从上图可以看出整个系统主要分为两大模块,数据存储模块与CART模块,两个模块集中于JDA分类器上,整个系统只实例化一个JDA分类器,存储于Config中。

三、细节实现:

  • 训练分为5个stage,每个stage训练一个cart森林,这里采用的是Real Adaboost算法:
    待补充…………
  • 在每一轮训练中,会训练K个cart树,训练每一个cart树前开始都会做hard negative mining补充负例,采用的方法如下:
    在所有的负例图片中,从第一张开始,滑窗图片上的每个区域,窗口大小固定,与原始人脸图片大小一样,对每一个区域做旋转和反转变换(共八种),然后用该区域通过当前的检测器,如果被检测为负例则丢弃,如果检测为正例,则加入训练集,直至数量达标为止,当训练未结束而负例数据已经用完时,训练会被迫中止。
  • 每一棵cart树训练开始前还会对正例和负例数据做一次排序,根据score由大到小排列,采用的排序算法是快排,注意,这里会大量用到增加内存负载的swap操作。
  • 做完hard negative mining和排序后,会计算所有数据得分的density_graph:
    这个函数并没有实际意义,主要用来辅助理解,引用作者的话
    add a function draw_density_graph to view the density distribution of scores
    + means density of positive scores
    x means density of negative scores
    * means at point both positive and negative have the same density”
    其输出的是得分的分布情况,横轴表示的是阈值区间,纵轴纵轴表示的是某阈值区间下的样本数量占该类别样本数量的比例,输出如下所示:


    从图上可以看出,正例样本分布越靠右,负例样本越靠左,其分类效果越好。
    下图是经过一段时间训练后的样本分布,可以看出其差别:
  • 所有数据权重的计算公式:


    其中fi是其score,yi是其label,取值{1(正例),-1(负例)},计算完之后会将所有正例和负例分别归一化为1。
  • 关于特征的提取:
    每一层的特征维度可以设置为不同大小,默认为1000。
    训练数据会以原尺寸,二分之一尺寸和四分之一尺寸分别存储,这么做的目的是因为提取特征时,会随机的在三种尺度中选择一种尺度的图片,论文原句如下:
    “During split test for an internal node, we extend the shape indexed pixel difference features in [4] to multi-scale. Specifically, we generate three scales of images by down sampling the input image to half and one fourth. To generate a feature, we randomly choose an image scale, pick up two random facial points in the current shape, generate two random offsets with respect to the points and take the difference of the two offsetted pixels as the feature. We found the multi-scale pixel difference feature is more robust to noises and necessary for detection learning. ”

    接下来会随机选择两个特征点,也就是人脸关键点作为提取基点,然后以这两个基点为中心,在给定的半径内(每一层的半径不同,越往后半径越小)各随机定位一个像素点,然后计算这两个像素点的差值作为特征。

    容易计算,假如特征维度为1000,数据数量为10000,那么一个cart树上每个结点的特征数量为10000*1000。

  • 关于树上每个结点是用作回归还是分类,以概率p随机选择,概率p随层熟增大而减小。p越大,分类概率越大。
  • cart划分采用gini度量指标,回归以最小像素差指标。

这篇关于Joint Cascade Face Detection and Alignment(JDA)文档的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/980785

相关文章

使用EasyPoi快速导出Word文档功能的实现步骤

《使用EasyPoi快速导出Word文档功能的实现步骤》EasyPoi是一个基于ApachePOI的开源Java工具库,旨在简化Excel和Word文档的操作,本文将详细介绍如何使用EasyPoi快速... 目录一、准备工作1、引入依赖二、准备好一个word模版文件三、编写导出方法的工具类四、在Export

利用Python操作Word文档页码的实际应用

《利用Python操作Word文档页码的实际应用》在撰写长篇文档时,经常需要将文档分成多个节,每个节都需要单独的页码,下面:本文主要介绍利用Python操作Word文档页码的相关资料,文中通过代码... 目录需求:文档详情:要求:该程序的功能是:总结需求:一次性处理24个文档的页码。文档详情:1、每个

C++读写word文档(.docx)DuckX库的使用详解

《C++读写word文档(.docx)DuckX库的使用详解》DuckX是C++库,用于创建/编辑.docx文件,支持读取文档、添加段落/片段、编辑表格,解决中文乱码需更改编码方案,进阶功能含文本替换... 目录一、基本用法1. 读取文档3. 添加段落4. 添加片段3. 编辑表格二、进阶用法1. 文本替换2

Python实现自动化删除Word文档超链接的实用技巧

《Python实现自动化删除Word文档超链接的实用技巧》在日常工作中,我们经常需要处理各种Word文档,本文将深入探讨如何利用Python,特别是借助一个功能强大的库,高效移除Word文档中的超链接... 目录为什么需要移除Word文档超链接准备工作:环境搭建与库安装核心实现:使用python移除超链接的

C#实现一键批量合并PDF文档

《C#实现一键批量合并PDF文档》这篇文章主要为大家详细介绍了如何使用C#实现一键批量合并PDF文档功能,文中的示例代码简洁易懂,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言效果展示功能实现1、添加文件2、文件分组(书签)3、定义页码范围4、自定义显示5、定义页面尺寸6、PDF批量合并7、其他方法

Java实现在Word文档中添加文本水印和图片水印的操作指南

《Java实现在Word文档中添加文本水印和图片水印的操作指南》在当今数字时代,文档的自动化处理与安全防护变得尤为重要,无论是为了保护版权、推广品牌,还是为了在文档中加入特定的标识,为Word文档添加... 目录引言Spire.Doc for Java:高效Word文档处理的利器代码实战:使用Java为Wo

使用Python实现Word文档的自动化对比方案

《使用Python实现Word文档的自动化对比方案》我们经常需要比较两个Word文档的版本差异,无论是合同修订、论文修改还是代码文档更新,人工比对不仅效率低下,还容易遗漏关键改动,下面通过一个实际案例... 目录引言一、使用python-docx库解析文档结构二、使用difflib进行差异比对三、高级对比方

Python自动化处理PDF文档的操作完整指南

《Python自动化处理PDF文档的操作完整指南》在办公自动化中,PDF文档处理是一项常见需求,本文将介绍如何使用Python实现PDF文档的自动化处理,感兴趣的小伙伴可以跟随小编一起学习一下... 目录使用pymupdf读写PDF文件基本概念安装pymupdf提取文本内容提取图像添加水印使用pdfplum

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

C#高效实现Word文档内容查找与替换的6种方法

《C#高效实现Word文档内容查找与替换的6种方法》在日常文档处理工作中,尤其是面对大型Word文档时,手动查找、替换文本往往既耗时又容易出错,本文整理了C#查找与替换Word内容的6种方法,大家可以... 目录环境准备方法一:查找文本并替换为新文本方法二:使用正则表达式查找并替换文本方法三:将文本替换为图