meanshift算法学习(三):自己实现meanshift

2024-02-07 14:50
文章标签 算法 实现 学习 meanshift

本文主要是介绍meanshift算法学习(三):自己实现meanshift,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       有关meanShift的原理和数学推导,网上有大神提供了很详细的讲解文档,这里我推荐下面三篇个人认为比较好的文章。

https://wenku.baidu.com/view/5862334827d3240c8447ef40.html meanShift算法简介

http://blog.csdn.net/jinshengtao/article/details/30258833 基于meanShift的目标跟踪算法及实现

http://blog.csdn.net/anymake_ren/article/details/25484059 meanShift知识整理

       原理部分就不再重复造轮子了,这里直接把自己写的代码贴出来。代码实现的是读取一个视频序列,按下按键“p”后视频暂停,通过鼠标左键进行跟踪区域的选取,选取结束后按下按键“p”后视频继续播放同时开始跟踪。

#include "core/core.hpp"    
#include "highgui/highgui.hpp"    
#include "imgproc/imgproc.hpp"
#include "video/tracking.hpp"
#include<iostream>    
#include <numeric>
using namespace cv;    
using namespace std;    Mat image;
bool leftButtonDown = false;// 鼠标左键是否按下
bool videoPauseFlag = false;// 是否暂停视频
bool trackingFlag = false;// 是否开始meanShift跟踪
Point pt1, pt2;// 记录选择区域的左上点/右下点
Rect rect;// 跟踪区域
vector<float> dstRegionDensity;// 目标跟踪区域的核函数估计密度向量
vector<float> testRegionDensity;// 候选区域的核函数估计密度向量
vector<float> w;// meanShift公式中的权值计算
int densityNum = 4096;// 对于每一帧图像的R/G/B三通道,每个通道按照值的大小分为16个区间,所以密度向量为16*16*16=4096维
void onMouse(int event,int x,int y,int flags ,void* ustc); //鼠标回调函数  
void calcKernelDensity(Mat imageSrc, vector<float>&density, int densityNum); // 计算图像的核函数估计密度向量
void meanShiftTracking(Mat& imageSrc, int iteration, double eps, Rect& rect);// meanShift算法跟踪int main()
{// 打开视频文件VideoCapture cap("768X576.avi");if(!cap.isOpened()){cout<<"cannot open avi file"<<endl;return -1;}// 全局链表分配空间dstRegionDensity.resize(densityNum);testRegionDensity.resize(densityNum);w.resize(densityNum);double fps = cap.get(CV_CAP_PROP_FPS);// 获取图像帧率int pauseTime = (int)(1000.f/fps);namedWindow("video");setMouseCallback("video", onMouse);while(1){if(waitKey(pauseTime) == 'p'){videoPauseFlag = !videoPauseFlag;}if(videoPauseFlag)// 暂停视频时不会更新图像帧continue;else{cap>>image;if(trackingFlag){meanShiftTracking(image, 30, 0.2, rect);// meanShift跟踪int num = 0;/*for(int n = 0; n < densityNum; n++){dstRegionDensity[n] = testRegionDensity[n];}*/rectangle(image, rect, Scalar(0, 0, 0));// 绘制出计算得到的跟踪位置}}imshow("video", image);}}void onMouse(int event,int x,int y,int flags ,void* ustc)
{Mat imageROI;// 鼠标左键按下获取区域起始点if(event == CV_EVENT_LBUTTONDOWN&&!trackingFlag){leftButtonDown = true;pt1 = Point(x,y);}// 拖动选取区域并使用黑色线框显示选择区域else if(event == CV_EVENT_MOUSEMOVE && leftButtonDown){Mat image_tmp;image.copyTo(image_tmp);pt2 = Point(x,y);rectangle(image_tmp, pt1, pt2, Scalar(0, 0, 0));imshow("video", image_tmp);}// 左键松开获取区域结束点,确定目标跟踪区域else if(event == CV_EVENT_LBUTTONUP && leftButtonDown){leftButtonDown = false;pt2 = Point(x,y);image(Rect(pt1, pt2)).copyTo(imageROI);rect.x = std::min(pt1.x, pt2.x);rect.y = std::min(pt1.y, pt2.y);rect.width = pt1.x > pt2.x ? pt1.x - pt2.x : pt2.x - pt1.x;rect.height = pt1.y > pt2.y ? pt1.y - pt2.y : pt2.y - pt1.y;namedWindow("imageROI");imshow("imageROI", imageROI);// 计算目标跟踪区域的核函数估计密度向量calcKernelDensity(imageROI, dstRegionDensity, densityNum);waitKey(2000);destroyWindow("imageROI");trackingFlag = true;}}void calcKernelDensity(Mat imageSrc, vector<float>&density, int densityNum)
{/* 选取的核函数轮廓函数为k(x) = 1-x^2,其中x为图像中像素到图像中心位置的归一化距离*/int rows = imageSrc.rows;int cols = imageSrc.cols;float h = 0.25 * (rows*rows + cols*cols);// 带宽float k_sum = 0;for(int i = 0; i < densityNum; i++){density[i] = 0;}for(int i = 0; i < rows; i++){for(int j = 0; j < cols; j++){int b,g,r,index;b = imageSrc.at<cv::Vec3b>(i,j)[0];g = imageSrc.at<cv::Vec3b>(i,j)[1];r = imageSrc.at<cv::Vec3b>(i,j)[2];index = b/16*256 + g/16*16 + r/16;// 获取像素点的索引值,0-4095float dis = ((i- rows/2)*(i- rows/2) + (j- cols/2)*(j- cols/2))/h;// x = sqrt(dis)float k = 1-dis;// k(x) = 1 - x^2; density[index] += k;k_sum += k;}}for(int i = 0; i < densityNum; i++){density[i] /= k_sum;// 密度归一化}
}void meanShiftTracking(Mat& imageSrc, int iteration, double eps, Rect& rect)
{Mat imageROI;int num = 0;while(1){imageSrc(rect).copyTo(imageROI);// 获取感兴趣区域Point2f pt_d;pt_d.x = pt_d.y = 0;float weightSum = 0;float h = 0.25 * (imageROI.rows*imageROI.rows + imageROI.cols*imageROI.cols);// 带宽calcKernelDensity(imageROI, testRegionDensity, densityNum);// 计算候选区域的核函数估计密度向量for(int i = 0; i < densityNum; i++){if(testRegionDensity[i] != 0)w[i] = sqrt(dstRegionDensity[i] / testRegionDensity[i]);elsew[i] = 0;// 计算迭代公式中的权值}for(int i = 0; i < imageROI.rows; i++){for(int j = 0; j < imageROI.cols; j++){int b,g,r, index;b = imageROI.at<cv::Vec3b>(i,j)[0];g = imageROI.at<cv::Vec3b>(i,j)[1];r = imageROI.at<cv::Vec3b>(i,j)[2];index = b/16*256 + g/16*16 + r/16;float dis = ((i- imageROI.rows/2)*(i- imageROI.rows/2)+ (j- imageROI.cols/2)*(j- imageROI.cols/2))/h;float weight_g = 2*sqrt(dis);pt_d.x += w[index]*weight_g*(j - imageROI.cols/2);pt_d.y += w[index]*weight_g*(i- imageROI.rows/2);weightSum += w[index]*weight_g;}}pt_d.x/=weightSum;pt_d.y/=weightSum;// 计算meanShift增量rect.x += pt_d.x;rect.y += pt_d.y;// 更新跟踪区域rect = rect&Rect(0, 0, imageSrc.cols, imageSrc.rows);// 保证跟踪区域位于图像内,这里的处理不一定合适float e = (pt_d.x*pt_d.x + pt_d.y * pt_d.y);if(e < eps)break;// 阈值判断num++;if(num > iteration)// 迭代次数判断break;}	
}

       跟踪效果如下图所示。



       代码和视频文件可以在点击打开链接下载。

这篇关于meanshift算法学习(三):自己实现meanshift的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/688063

相关文章

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

Python实现微信自动锁定工具

《Python实现微信自动锁定工具》在数字化办公时代,微信已成为职场沟通的重要工具,但临时离开时忘记锁屏可能导致敏感信息泄露,下面我们就来看看如何使用Python打造一个微信自动锁定工具吧... 目录引言:当微信隐私遇到自动化守护效果展示核心功能全景图技术亮点深度解析1. 无操作检测引擎2. 微信路径智能获

Python中pywin32 常用窗口操作的实现

《Python中pywin32常用窗口操作的实现》本文主要介绍了Python中pywin32常用窗口操作的实现,pywin32主要的作用是供Python开发者快速调用WindowsAPI的一个... 目录获取窗口句柄获取最前端窗口句柄获取指定坐标处的窗口根据窗口的完整标题匹配获取句柄根据窗口的类别匹配获取句

在 Spring Boot 中实现异常处理最佳实践

《在SpringBoot中实现异常处理最佳实践》本文介绍如何在SpringBoot中实现异常处理,涵盖核心概念、实现方法、与先前查询的集成、性能分析、常见问题和最佳实践,感兴趣的朋友一起看看吧... 目录一、Spring Boot 异常处理的背景与核心概念1.1 为什么需要异常处理?1.2 Spring B

Python位移操作和位运算的实现示例

《Python位移操作和位运算的实现示例》本文主要介绍了Python位移操作和位运算的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录1. 位移操作1.1 左移操作 (<<)1.2 右移操作 (>>)注意事项:2. 位运算2.1

如何在 Spring Boot 中实现 FreeMarker 模板

《如何在SpringBoot中实现FreeMarker模板》FreeMarker是一种功能强大、轻量级的模板引擎,用于在Java应用中生成动态文本输出(如HTML、XML、邮件内容等),本文... 目录什么是 FreeMarker 模板?在 Spring Boot 中实现 FreeMarker 模板1. 环

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

SpringMVC 通过ajax 前后端数据交互的实现方法

《SpringMVC通过ajax前后端数据交互的实现方法》:本文主要介绍SpringMVC通过ajax前后端数据交互的实现方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价... 在前端的开发过程中,经常在html页面通过AJAX进行前后端数据的交互,SpringMVC的controll

Spring Security自定义身份认证的实现方法

《SpringSecurity自定义身份认证的实现方法》:本文主要介绍SpringSecurity自定义身份认证的实现方法,下面对SpringSecurity的这三种自定义身份认证进行详细讲解,... 目录1.内存身份认证(1)创建配置类(2)验证内存身份认证2.JDBC身份认证(1)数据准备 (2)配置依

利用python实现对excel文件进行加密

《利用python实现对excel文件进行加密》由于文件内容的私密性,需要对Excel文件进行加密,保护文件以免给第三方看到,本文将以Python语言为例,和大家讲讲如何对Excel文件进行加密,感兴... 目录前言方法一:使用pywin32库(仅限Windows)方法二:使用msoffcrypto-too