meanshift算法学习(三):自己实现meanshift

2024-02-07 14:50
文章标签 算法 实现 学习 meanshift

本文主要是介绍meanshift算法学习(三):自己实现meanshift,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

       有关meanShift的原理和数学推导,网上有大神提供了很详细的讲解文档,这里我推荐下面三篇个人认为比较好的文章。

https://wenku.baidu.com/view/5862334827d3240c8447ef40.html meanShift算法简介

http://blog.csdn.net/jinshengtao/article/details/30258833 基于meanShift的目标跟踪算法及实现

http://blog.csdn.net/anymake_ren/article/details/25484059 meanShift知识整理

       原理部分就不再重复造轮子了,这里直接把自己写的代码贴出来。代码实现的是读取一个视频序列,按下按键“p”后视频暂停,通过鼠标左键进行跟踪区域的选取,选取结束后按下按键“p”后视频继续播放同时开始跟踪。

#include "core/core.hpp"    
#include "highgui/highgui.hpp"    
#include "imgproc/imgproc.hpp"
#include "video/tracking.hpp"
#include<iostream>    
#include <numeric>
using namespace cv;    
using namespace std;    Mat image;
bool leftButtonDown = false;// 鼠标左键是否按下
bool videoPauseFlag = false;// 是否暂停视频
bool trackingFlag = false;// 是否开始meanShift跟踪
Point pt1, pt2;// 记录选择区域的左上点/右下点
Rect rect;// 跟踪区域
vector<float> dstRegionDensity;// 目标跟踪区域的核函数估计密度向量
vector<float> testRegionDensity;// 候选区域的核函数估计密度向量
vector<float> w;// meanShift公式中的权值计算
int densityNum = 4096;// 对于每一帧图像的R/G/B三通道,每个通道按照值的大小分为16个区间,所以密度向量为16*16*16=4096维
void onMouse(int event,int x,int y,int flags ,void* ustc); //鼠标回调函数  
void calcKernelDensity(Mat imageSrc, vector<float>&density, int densityNum); // 计算图像的核函数估计密度向量
void meanShiftTracking(Mat& imageSrc, int iteration, double eps, Rect& rect);// meanShift算法跟踪int main()
{// 打开视频文件VideoCapture cap("768X576.avi");if(!cap.isOpened()){cout<<"cannot open avi file"<<endl;return -1;}// 全局链表分配空间dstRegionDensity.resize(densityNum);testRegionDensity.resize(densityNum);w.resize(densityNum);double fps = cap.get(CV_CAP_PROP_FPS);// 获取图像帧率int pauseTime = (int)(1000.f/fps);namedWindow("video");setMouseCallback("video", onMouse);while(1){if(waitKey(pauseTime) == 'p'){videoPauseFlag = !videoPauseFlag;}if(videoPauseFlag)// 暂停视频时不会更新图像帧continue;else{cap>>image;if(trackingFlag){meanShiftTracking(image, 30, 0.2, rect);// meanShift跟踪int num = 0;/*for(int n = 0; n < densityNum; n++){dstRegionDensity[n] = testRegionDensity[n];}*/rectangle(image, rect, Scalar(0, 0, 0));// 绘制出计算得到的跟踪位置}}imshow("video", image);}}void onMouse(int event,int x,int y,int flags ,void* ustc)
{Mat imageROI;// 鼠标左键按下获取区域起始点if(event == CV_EVENT_LBUTTONDOWN&&!trackingFlag){leftButtonDown = true;pt1 = Point(x,y);}// 拖动选取区域并使用黑色线框显示选择区域else if(event == CV_EVENT_MOUSEMOVE && leftButtonDown){Mat image_tmp;image.copyTo(image_tmp);pt2 = Point(x,y);rectangle(image_tmp, pt1, pt2, Scalar(0, 0, 0));imshow("video", image_tmp);}// 左键松开获取区域结束点,确定目标跟踪区域else if(event == CV_EVENT_LBUTTONUP && leftButtonDown){leftButtonDown = false;pt2 = Point(x,y);image(Rect(pt1, pt2)).copyTo(imageROI);rect.x = std::min(pt1.x, pt2.x);rect.y = std::min(pt1.y, pt2.y);rect.width = pt1.x > pt2.x ? pt1.x - pt2.x : pt2.x - pt1.x;rect.height = pt1.y > pt2.y ? pt1.y - pt2.y : pt2.y - pt1.y;namedWindow("imageROI");imshow("imageROI", imageROI);// 计算目标跟踪区域的核函数估计密度向量calcKernelDensity(imageROI, dstRegionDensity, densityNum);waitKey(2000);destroyWindow("imageROI");trackingFlag = true;}}void calcKernelDensity(Mat imageSrc, vector<float>&density, int densityNum)
{/* 选取的核函数轮廓函数为k(x) = 1-x^2,其中x为图像中像素到图像中心位置的归一化距离*/int rows = imageSrc.rows;int cols = imageSrc.cols;float h = 0.25 * (rows*rows + cols*cols);// 带宽float k_sum = 0;for(int i = 0; i < densityNum; i++){density[i] = 0;}for(int i = 0; i < rows; i++){for(int j = 0; j < cols; j++){int b,g,r,index;b = imageSrc.at<cv::Vec3b>(i,j)[0];g = imageSrc.at<cv::Vec3b>(i,j)[1];r = imageSrc.at<cv::Vec3b>(i,j)[2];index = b/16*256 + g/16*16 + r/16;// 获取像素点的索引值,0-4095float dis = ((i- rows/2)*(i- rows/2) + (j- cols/2)*(j- cols/2))/h;// x = sqrt(dis)float k = 1-dis;// k(x) = 1 - x^2; density[index] += k;k_sum += k;}}for(int i = 0; i < densityNum; i++){density[i] /= k_sum;// 密度归一化}
}void meanShiftTracking(Mat& imageSrc, int iteration, double eps, Rect& rect)
{Mat imageROI;int num = 0;while(1){imageSrc(rect).copyTo(imageROI);// 获取感兴趣区域Point2f pt_d;pt_d.x = pt_d.y = 0;float weightSum = 0;float h = 0.25 * (imageROI.rows*imageROI.rows + imageROI.cols*imageROI.cols);// 带宽calcKernelDensity(imageROI, testRegionDensity, densityNum);// 计算候选区域的核函数估计密度向量for(int i = 0; i < densityNum; i++){if(testRegionDensity[i] != 0)w[i] = sqrt(dstRegionDensity[i] / testRegionDensity[i]);elsew[i] = 0;// 计算迭代公式中的权值}for(int i = 0; i < imageROI.rows; i++){for(int j = 0; j < imageROI.cols; j++){int b,g,r, index;b = imageROI.at<cv::Vec3b>(i,j)[0];g = imageROI.at<cv::Vec3b>(i,j)[1];r = imageROI.at<cv::Vec3b>(i,j)[2];index = b/16*256 + g/16*16 + r/16;float dis = ((i- imageROI.rows/2)*(i- imageROI.rows/2)+ (j- imageROI.cols/2)*(j- imageROI.cols/2))/h;float weight_g = 2*sqrt(dis);pt_d.x += w[index]*weight_g*(j - imageROI.cols/2);pt_d.y += w[index]*weight_g*(i- imageROI.rows/2);weightSum += w[index]*weight_g;}}pt_d.x/=weightSum;pt_d.y/=weightSum;// 计算meanShift增量rect.x += pt_d.x;rect.y += pt_d.y;// 更新跟踪区域rect = rect&Rect(0, 0, imageSrc.cols, imageSrc.rows);// 保证跟踪区域位于图像内,这里的处理不一定合适float e = (pt_d.x*pt_d.x + pt_d.y * pt_d.y);if(e < eps)break;// 阈值判断num++;if(num > iteration)// 迭代次数判断break;}	
}

       跟踪效果如下图所示。



       代码和视频文件可以在点击打开链接下载。

这篇关于meanshift算法学习(三):自己实现meanshift的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/688063

相关文章

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Java使用Thumbnailator库实现图片处理与压缩功能

《Java使用Thumbnailator库实现图片处理与压缩功能》Thumbnailator是高性能Java图像处理库,支持缩放、旋转、水印添加、裁剪及格式转换,提供易用API和性能优化,适合Web应... 目录1. 图片处理库Thumbnailator介绍2. 基本和指定大小图片缩放功能2.1 图片缩放的

Python使用Tenacity一行代码实现自动重试详解

《Python使用Tenacity一行代码实现自动重试详解》tenacity是一个专为Python设计的通用重试库,它的核心理念就是用简单、清晰的方式,为任何可能失败的操作添加重试能力,下面我们就来看... 目录一切始于一个简单的 API 调用Tenacity 入门:一行代码实现优雅重试精细控制:让重试按我

Redis客户端连接机制的实现方案

《Redis客户端连接机制的实现方案》本文主要介绍了Redis客户端连接机制的实现方案,包括事件驱动模型、非阻塞I/O处理、连接池应用及配置优化,具有一定的参考价值,感兴趣的可以了解一下... 目录1. Redis连接模型概述2. 连接建立过程详解2.1 连php接初始化流程2.2 关键配置参数3. 最大连

Python实现网格交易策略的过程

《Python实现网格交易策略的过程》本文讲解Python网格交易策略,利用ccxt获取加密货币数据及backtrader回测,通过设定网格节点,低买高卖获利,适合震荡行情,下面跟我一起看看我们的第一... 网格交易是一种经典的量化交易策略,其核心思想是在价格上下预设多个“网格”,当价格触发特定网格时执行买

python设置环境变量路径实现过程

《python设置环境变量路径实现过程》本文介绍设置Python路径的多种方法:临时设置(Windows用`set`,Linux/macOS用`export`)、永久设置(系统属性或shell配置文件... 目录设置python路径的方法临时设置环境变量(适用于当前会话)永久设置环境变量(Windows系统

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

PyCharm中配置PyQt的实现步骤

《PyCharm中配置PyQt的实现步骤》PyCharm是JetBrains推出的一款强大的PythonIDE,结合PyQt可以进行pythion高效开发桌面GUI应用程序,本文就来介绍一下PyCha... 目录1. 安装China编程PyQt1.PyQt 核心组件2. 基础 PyQt 应用程序结构3. 使用 Q

Python实现批量提取BLF文件时间戳

《Python实现批量提取BLF文件时间戳》BLF(BinaryLoggingFormat)作为Vector公司推出的CAN总线数据记录格式,被广泛用于存储车辆通信数据,本文将使用Python轻松提取... 目录一、为什么需要批量处理 BLF 文件二、核心代码解析:从文件遍历到数据导出1. 环境准备与依赖库