OpenMV 图片对象(目标识别基础)

2023-10-08 05:10

本文主要是介绍OpenMV 图片对象(目标识别基础),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

背景介绍:

Sugar 在《图像处理基础》一文中说过:“OpenMV 在图像里做目标识别的过程就是:不停地取出画面里的每一帧图像,在图像里的每一帧画面上找目标的过程。”

本篇就说一说 OpenMV 怎样在一帧画面上识别目标的。

image 模块

上一篇《从 hello world 读懂 OpenMV 怎样玩》中说到 OpenMV 通过 sensor.snapshot() 从摄像头获取一帧图像,也就是一张当时的图片。得到这个图片后,就可以通过 image 模块里的方法处理图片了,原因是:

通过官方文档可知:sensor.snapshot() 返回一个 image 类的对象。要使用 image 模块提供的方法,按 Python 的规矩就要:

import image

image 可以在当前的图像帧上做各种各样的操作,下面先说一说要进行这些操作需要的基础知识。

像素坐标

OpenMV 的像素坐标系如下:

与其他(OpenCV 等)图像处理系统一样,像素坐标系的原点在图像的“左上角”,x、y 轴的正方向如上图。

image 模块方法示例:打标记

一、 API 介绍

1、image.clear() 清除图像帧上的所有像素点;

2、image.draw_rectangle(x, y, w, h) 以 (x, y) 为起点,画宽 w 高 h 的方形。

二、代码及现象

通过这个示例,非常直观地感受到了 image.clear() 的作用:消除了整个图像帧的像素,把图像变黑了。如果我们想保留图片,在拍摄到的视频画面上画这个方块,那么应该这么写代码:

每获取一帧图像画一个方块,不用擦除之前画的方块,因为每次 sensor.snapshot() 的时候图像帧一更新就把上一次画的方块冲掉了(这里要细细体会一下搞明白哦)。

三、再说两个画画 API 接下来的例子用:

(1) image.draw_cross(x,y) 以像素坐标 (x, y) 为中心画个十字。

(2) img.draw_circle(x, y, diameter) 以像素坐标 (x, y) 为圆心,diameter 为直径画一个圆。

只要了解 Python 的基本知识,对 OpenMV 编程就非常简单,专注点在视觉及图像内容上而非 Python 语法上就对了。如果对 Python 语法还不熟悉的话可以看 Sugar 的 Python 入门系列推文。这里要说明的一点是:就算 Python 语法非常简单,作为一种编程语言,学习其语法也会有一段枯燥的时间。这一点从 Sugar 写 Python 入门系列推文的时候阅读量不大就能看得出来。Python 相对于其他语言来讲算是入门阶段相当短的了,只要熬过那么一小段时间,收获将是其乐无穷的。

image 模块方法示例:找色块

一、API 介绍

1、image.find_blobs(Lab色彩空间下的阀值元组)用于寻找当前图像帧里的目标色块,官方 API 是这样写的:

2、sensor.set_auto_whitebal(False) 关闭自动白平衡。

这是个 sensor 模块的设置,之所以放在这里说是因为这个设置与寻找色块相关,官方文档里是这么说的:

Sugar 对艺术略知一二并不精通,如果问“自动白平衡”是什么,还是下面这两位大佬解释得好:

艺术大佬一,来自知乎,请手动搜索下图中的标题:

艺术大佬二,直接点这个题目《咳咳咳!你真的搞懂白平衡了吗?》

Sugar 的做法是:官方文档让关咱就关了,不多问。哈哈,别学 Sugar 这样不求甚解啊,多了解是好的。

二、image.blob 类介绍

上面的 image.find_blobs() 返回一个 image.blob 对象,下面就来看一下这个对象里都包含哪些信息。

信息含意
corners从左上角开始顺时针方向,色块 4 个角的 (x,y) 像素坐标
min_conrners这个目前没搞明白先不解释
rect以 (x,y,w,h) 形式返回色块的边界框信息
x色块边界框的 x 像素坐标
y色块边界框的 y 像素坐标
w色块边界框宽的像素个数
h色块边界框高的像素个数
pixels色块里包含的像素点个数
cx色块中心的 x 像素坐标(整型)
cxf色块中心的 x 像素坐标(浮点型)
cy色块中心的 y 像素坐标(整型)
cyf色块中心的 y 像素坐标(浮点型)
rotation长条形色块的旋转角度,0~PI 弧度,对圆形色块无用
rotation_deg以“度”为单位返回长条形色块的旋转角度
rotation_rad同 rotation,加了 rad 更易识别单位
codemerge=True 时才有效,这个目前没搞明白先不解释
countmerge=True 时才有效,这个目前没搞明白先不解释
perimeter色块周长上的像素个数
roundness色块的圆度,0~1 之间,圆是 1
elongation色块的线条度,0~1 之间,线是 1
area色块的面积,即:w*h
density色块边框区域内像素点的数量,0~1之间,较低说明对象锁定不太好
extent同 density,就是换个名字而已
compactness类似 density,区别是使用色块周长来衡量对象的密度,也是 0~1 之间
solidity类似 density,区别是使用最小面积旋转的矩形相对于边界矩形来测量密度,也是 0~1 之间
convexity色块的方度,0~1 之间,正方形是 1
x_hist_bins色块中所有列的 x 轴直方图,Bin 值在 0 和 1 之间缩放
y_hist_bins色块中所有行的 y 轴直方图,Bin 值在 0 和 1 之间缩放
major_axis_line色块主轴像素点的元组,贯穿最小面积矩形最长边,可以用 image.draw_line() 绘制
minor_axis_line色块次轴像素点的元组,贯穿最小面积矩形最短边,可以用 image.draw_line() 绘制
enclosing_circle包围色块最小面积矩形的圆的像素点元组,可以用 image.draw_circle() 绘制
enclosed_ellipse包围色块最小面积矩形的椭圆的像素点元组,可以用 image.draw_ellipse() 绘制

三、代码及现象

图上的代码不长,一张图片看得全就不把代码单摘出来了,相信愿意实践的读者可以照着打出来。这里点一处考察 Python 能力的地方:如果去掉代码里 if len(blobs) > 0: 这个条件,则运行会在某个时候报错。问题有三个:

1、会在什么时候报错?

2、报什么错,为什么报这个错?

3、可否用 if blobs: 代替 if len(blobs) > 0:

如果答不上来或答不全,请到 Sugar 写的 Python 入门系列推文里巩固一下 Python 基础。

PS

颜色阀值的提取使用的是 OpenMV IDE 的一个工具,如下图:

用法不细说了,网上搜一搜或者用鼠标在弹出窗口上拉一拉就知道。

关注作者

欢迎扫码关注我的公众号MultiMCU EDU

提示:在公众号“关于我”页面可加作者微信好友。

喜欢本文求点赞,有打赏我会更有动力。

这篇关于OpenMV 图片对象(目标识别基础)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/162904

相关文章

基于Python实现一个图片拆分工具

《基于Python实现一个图片拆分工具》这篇文章主要为大家详细介绍了如何基于Python实现一个图片拆分工具,可以根据需要的行数和列数进行拆分,感兴趣的小伙伴可以跟随小编一起学习一下... 简单介绍先自己选择输入的图片,默认是输出到项目文件夹中,可以自己选择其他的文件夹,选择需要拆分的行数和列数,可以通过

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

利用Python脚本实现批量将图片转换为WebP格式

《利用Python脚本实现批量将图片转换为WebP格式》Python语言的简洁语法和库支持使其成为图像处理的理想选择,本文将介绍如何利用Python实现批量将图片转换为WebP格式的脚本,WebP作为... 目录简介1. python在图像处理中的应用2. WebP格式的原理和优势2.1 WebP格式与传统

基于 HTML5 Canvas 实现图片旋转与下载功能(完整代码展示)

《基于HTML5Canvas实现图片旋转与下载功能(完整代码展示)》本文将深入剖析一段基于HTML5Canvas的代码,该代码实现了图片的旋转(90度和180度)以及旋转后图片的下载... 目录一、引言二、html 结构分析三、css 样式分析四、JavaScript 功能实现一、引言在 Web 开发中,

Python如何去除图片干扰代码示例

《Python如何去除图片干扰代码示例》图片降噪是一个广泛应用于图像处理的技术,可以提高图像质量和相关应用的效果,:本文主要介绍Python如何去除图片干扰的相关资料,文中通过代码介绍的非常详细,... 目录一、噪声去除1. 高斯噪声(像素值正态分布扰动)2. 椒盐噪声(随机黑白像素点)3. 复杂噪声(如伪

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

SpringMVC高效获取JavaBean对象指南

《SpringMVC高效获取JavaBean对象指南》SpringMVC通过数据绑定自动将请求参数映射到JavaBean,支持表单、URL及JSON数据,需用@ModelAttribute、@Requ... 目录Spring MVC 获取 JavaBean 对象指南核心机制:数据绑定实现步骤1. 定义 Ja

Python打印对象所有属性和值的方法小结

《Python打印对象所有属性和值的方法小结》在Python开发过程中,调试代码时经常需要查看对象的当前状态,也就是对象的所有属性和对应的值,然而,Python并没有像PHP的print_r那样直接提... 目录python中打印对象所有属性和值的方法实现步骤1. 使用vars()和pprint()2. 使

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据