【图像识别】心得小结(育儿手册)

2023-11-01 02:21

本文主要是介绍【图像识别】心得小结(育儿手册),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近又来了很多师弟都在埋头搞图像,但都理不清头绪,迫于导师交待的任务纷纷求教。这里我总结了点经验,或者说育儿手册吐舌笑脸

A、图像识别就像在教小孩辩物,要向他解释目标的主要特征;

   (尽量用他知道的特征,否则还需要解释每个特征的定义)

例如识别矩形,那么可以告诉他 矩形由4条直线段组成(因为他学过hough变换),相交的线段彼此垂直(斜率互为负倒数)……

X20ABVWBAY%1[8PCASE~HL6


B、有时感觉特征太多则退而求其次,解释目标与视野中其他对象的区别就好;

例如识别车辆,你需要教他什么是车。

如果场景中只有车辆在动,那么只要告诉他“会动的就是车辆”,这样子只要解释什么是“动”这个特征,或者什么是“不动”也就是“静止”或者“没有变化”(考虑给他借本“帧差法”教材,或者进阶的“光流法”)他就懂了,至少在当前场景下正确……

 

未标题-3


C、另外这个小孩目前数学(客观)学的好,语文(主观)特别差,为了让他学习得更有效率,最好用数学去描述,免得还要先给他补习语文;

还是车辆识别,如果场景非常单调,只有一色的地面跟车,那么你会说“那就是车”。

“那”这个词解释非常麻烦,还需要配合指定方向。你可以换个说法,就是“他看到的物体就是车”,这样你只要解释什么是“物体”,比如物体有“形状”也就是有“轮廓”(边缘检测的话他会很多方法sobel、canny不要太基础)。

未标题-2


D、他会非常听话,但也非常较真,或者特别敏感;

例如,你觉得视野里只有地面跟车,但他能发现很多细小的“物体”,比如地上的小石头、车的阴影。你可以让他不敏感(模糊或者说滤波,eg. 均值、中值、高斯,并规定亮度的阈值);再保险一些,你还可能告诉它只有“大”的物体才是车。“大”这个词比较模糊,所幸补习起来不太难——因为“大”是相对的,如果不想再解释什么是“小石头”的话,你最好给他一个已知的参照物,比如他的“视野范围”,最后你跟他说“占了你视野1/3的那个物体就是车”……

 

u=72227056,216711126&fm=21&gp=0


E、他可以有一些基础,但多数情况是在某个领域\场景下我们必须从零教起;

因此我们需要耐心与信任,因为他是个天才;也因为他是个天才,如果他做错了,唯一的可能就是我们教的不对,幸运的是我们可以一次次重来。

 

u=2605296290,461568325&fm=21&gp=0


F、其实不止是图像识别,机器学习甚至人工智能,我们都可以把电脑看成一个乖孩子……

你可以通过一些描述/特征去教他,也可以利用训练让他自己摸索——告诉他的越多,他所认识到的越接近真相(但这样我们往往很难知道他对真相的认知/解释是否真的跟我们完全一样,甚至他可能从另一个角度给出一个当前足够自洽的真相)。

 

 

Y]0862%10$Y8_2F[%0D292H

转载于:https://www.cnblogs.com/KC-Mei/p/4582263.html

这篇关于【图像识别】心得小结(育儿手册)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/dianwu9730/article/details/102080541
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/319811

相关文章

C++中NULL与nullptr的区别小结

《C++中NULL与nullptr的区别小结》本文介绍了C++编程中NULL与nullptr的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编... 目录C++98空值——NULLC++11空值——nullptr区别对比示例 C++98空值——NUL

C++ Log4cpp跨平台日志库的使用小结

《C++Log4cpp跨平台日志库的使用小结》Log4cpp是c++类库,本文详细介绍了C++日志库log4cpp的使用方法,及设置日志输出格式和优先级,具有一定的参考价值,感兴趣的可以了解一下... 目录一、介绍1. log4cpp的日志方式2.设置日志输出的格式3. 设置日志的输出优先级二、Window

Python中反转字符串的常见方法小结

《Python中反转字符串的常见方法小结》在Python中,字符串对象没有内置的反转方法,然而,在实际开发中,我们经常会遇到需要反转字符串的场景,比如处理回文字符串、文本加密等,因此,掌握如何在Pyt... 目录python中反转字符串的方法技术背景实现步骤1. 使用切片2. 使用 reversed() 函

C#中Guid类使用小结

《C#中Guid类使用小结》本文主要介绍了C#中Guid类用于生成和操作128位的唯一标识符,用于数据库主键及分布式系统,支持通过NewGuid、Parse等方法生成,感兴趣的可以了解一下... 目录前言一、什么是 Guid二、生成 Guid1. 使用 Guid.NewGuid() 方法2. 从字符串创建

Redis分片集群、数据读写规则问题小结

《Redis分片集群、数据读写规则问题小结》本文介绍了Redis分片集群的原理,通过数据分片和哈希槽机制解决单机内存限制与写瓶颈问题,实现分布式存储和高并发处理,但存在通信开销大、维护复杂及对事务支持... 目录一、分片集群解android决的问题二、分片集群图解 分片集群特征如何解决的上述问题?(与哨兵模

SpringBoot中使用Flux实现流式返回的方法小结

《SpringBoot中使用Flux实现流式返回的方法小结》文章介绍流式返回(StreamingResponse)在SpringBoot中通过Flux实现,优势包括提升用户体验、降低内存消耗、支持长连... 目录背景流式返回的核心概念与优势1. 提升用户体验2. 降低内存消耗3. 支持长连接与实时通信在Sp

Python打印对象所有属性和值的方法小结

《Python打印对象所有属性和值的方法小结》在Python开发过程中,调试代码时经常需要查看对象的当前状态,也就是对象的所有属性和对应的值,然而,Python并没有像PHP的print_r那样直接提... 目录python中打印对象所有属性和值的方法实现步骤1. 使用vars()和pprint()2. 使

HTML5 getUserMedia API网页录音实现指南示例小结

《HTML5getUserMediaAPI网页录音实现指南示例小结》本教程将指导你如何利用这一API,结合WebAudioAPI,实现网页录音功能,从获取音频流到处理和保存录音,整个过程将逐步... 目录1. html5 getUserMedia API简介1.1 API概念与历史1.2 功能与优势1.3

Java对异常的认识与异常的处理小结

《Java对异常的认识与异常的处理小结》Java程序在运行时可能出现的错误或非正常情况称为异常,下面给大家介绍Java对异常的认识与异常的处理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参... 目录一、认识异常与异常类型。二、异常的处理三、总结 一、认识异常与异常类型。(1)简单定义-什么是

Python函数返回多个值的多种方法小结

《Python函数返回多个值的多种方法小结》在Python中,函数通常用于封装一段代码,使其可以重复调用,有时,我们希望一个函数能够返回多个值,Python提供了几种不同的方法来实现这一点,需要的朋友... 目录一、使用元组(Tuple):二、使用列表(list)三、使用字典(Dictionary)四、 使