图片识别为什么大部分都将彩色图像灰度化

2024-06-19 09:38

本文主要是介绍图片识别为什么大部分都将彩色图像灰度化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

对于图片识别灰度化的原因这里根据自己的理解和网上看到的一些自己觉得合理的解释这里做个大概总结,如有错误欢迎大神们打脸指正


最直接的原因:减少计算量

包含色彩的图片,特征量,计算量会成指数倍数增加
比如一个点,灰度的话,就256个维度而已,但是如果算上RGB色彩的话,那就是1600万以上维度。然后再相互组合,或者说找梯度,可以想象看计算量有多大

但是好在就算是全色盲也可以分辨物体,对于一般的物体识别灰度图就够了,于是就先降维(灰度)来计算

不过一直觉得不是每个应用都需要把彩色变成灰度,毕竟颜色是一个比较有用的特征

首先 灰度化之后失去了什么,又得到了什么

  • 灰度化之后颜色信息丢失,所以一般基于color-based算法就不能灰度化
  • 但是很多简单的识别算法对于颜色的依赖性不强,hand-craft特征更多关注边缘梯度信息
    灰度化之后矩阵维数下降,运算速度大幅度提高,并且梯度信息仍然保留
  • 工程中很多应用加上color信息之后鲁棒性会下降

怎么选择就是在performance和efficiency之间做一个权衡罢了


是否选择灰度图主要需要权衡以下几点:

1. 梯度

我们识别物体,最关键的因素是梯度(现在很多的特征提取HOG,LBP,SIFT等等本质都是梯度的统计信息),梯度意味着边缘,这是最本质的部分,而计算梯度,最常用就是灰度图。颜色本身,非常容易受到光照等因素的影响,同类的物体颜色有很多变化,所以颜色本身难以提供关键信息

2.计算量

灰度化其实就是将图片降维,这样就能大大降低计算量

对于设备的计算能力和识别速度的需求是你取舍的一个关键点

有时候灰度图还是过大,再次降维使用二值化图像

3.颜色信息

现在大部分的彩色图像都是采用RGB颜色模式,处理图像的时候,要分别知对RGB三种分量进行处理,实际上RGB并不能反映图像的形态特征,只是从光学的原理上进行颜色的调配

对于一些场景,颜色所能提供的信息并不多
比如大多数的医学图像RGB提供的信息量很少(几乎没有),所以可以直接灰度图来进行后续计算

但是也并不绝对,颜色有时候提供的信息也很重要
比如分辨红绿灯的话,是绝对不能直接只用灰度图的

这篇关于图片识别为什么大部分都将彩色图像灰度化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1074669

相关文章

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

Go语言如何判断两张图片的相似度

《Go语言如何判断两张图片的相似度》这篇文章主要为大家详细介绍了Go语言如何中实现判断两张图片的相似度的两种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 在介绍技术细节前,我们先来看看图片对比在哪些场景下可以用得到:图片去重:自动删除重复图片,为存储空间"瘦身"。想象你是一个

使用Python实现base64字符串与图片互转的详细步骤

《使用Python实现base64字符串与图片互转的详细步骤》要将一个Base64编码的字符串转换为图片文件并保存下来,可以使用Python的base64模块来实现,这一过程包括解码Base64字符串... 目录1. 图片编码为 Base64 字符串2. Base64 字符串解码为图片文件3. 示例使用注意

Python验证码识别方式(使用pytesseract库)

《Python验证码识别方式(使用pytesseract库)》:本文主要介绍Python验证码识别方式(使用pytesseract库),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1、安装Tesseract-OCR2、在python中使用3、本地图片识别4、结合playwrigh

c/c++的opencv实现图片膨胀

《c/c++的opencv实现图片膨胀》图像膨胀是形态学操作,通过结构元素扩张亮区填充孔洞、连接断开部分、加粗物体,OpenCV的cv::dilate函数实现该操作,本文就来介绍一下opencv图片... 目录什么是图像膨胀?结构元素 (KerChina编程nel)OpenCV 中的 cv::dilate() 函

使用Python实现调用API获取图片存储到本地的方法

《使用Python实现调用API获取图片存储到本地的方法》开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接... 目录使用python实现调用API获取图片存储到本地1、项目概述2、核心功能3、环境准备4、代码实现

Java实现图片淡入淡出效果

《Java实现图片淡入淡出效果》在现代图形用户界面和游戏开发中,**图片淡入淡出(FadeIn/Out)**是一种常见且实用的视觉过渡效果,它可以用于启动画面、场景切换、轮播图、提示框弹出等场景,通过... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细

Java如何根据文件名前缀自动分组图片文件

《Java如何根据文件名前缀自动分组图片文件》一大堆文件(比如图片)堆在一个目录下,它们的命名规则遵循一定的格式,混在一起很难管理,所以本文小编就和大家介绍一下如何使用Java根据文件名前缀自动分组图... 目录需求背景分析思路实现代码输出结果知识扩展需求一大堆文件(比如图片)堆在一个目录下,它们的命名规

将图片导入Python的turtle库的详细过程

《将图片导入Python的turtle库的详细过程》在Python编程的世界里,turtle库以其简单易用、图形化交互的特点,深受初学者喜爱,随着项目的复杂度增加,仅仅依靠线条和颜色来绘制图形可能已经... 目录开篇引言正文剖析1. 理解基础:Turtle库的工作原理2. 图片格式与支持3. 实现步骤详解第