计算机视觉的巨大应用

2024-05-05 02:08
文章标签 应用 计算机 视觉 巨大

本文主要是介绍计算机视觉的巨大应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

转自:http://blog.csdn.net/cy513/article/details/4639640

先来提出一些问题,1、我们是否能够从图像中获取某些有用的信息,比如图像中有一个人,我想知道这人的身高,距离拍摄位置有多远,以及拍摄该图像的相机镜 头的方向等等,这些信息对于刑侦还有安全部门的人员是十分有用的。2、看过《变形金刚2》的人都会被人类和变形金刚交互的逼真场面,还有狂派机器人攀爬到 金字塔顶疯狂破坏金字塔的场景所震撼,那么这些虚构的景物是如何融入到真实场面的呢?3、Google street view可以让我们足不出户而到世界各地观光,而且这种观光是可以按照你的意愿选择路线还有观察角度,这就让人有“身临其境”的感觉了,当然目前的限制还 很多,但我们希望有一天能够更自由的“置身”于街景中,从全景到局部细节都能清晰的欣赏到。

      所有的这一切都是通过“计算机视觉”这门理论和技术去完成的,计算机视觉的数学基础是射影几何还有矩阵代数,不过在这里不讨论高深的数学表达式,而是用通俗的语言去阐述这门学科的一些机理及其巨大的用途。

       我 们知道,现实世界中三维场景通过相机的透镜成像在二维图像中,我们可以对三维场景和镜头分别建立各自的坐标系,之所以要分别建立坐标系是出于方便处理分析 考虑的,当然它们公用一个坐标系也可以,在某些时候也是这样简化分析的。于是两套坐标系之间的点就有了相互转换的公式了,通常把世界坐标转换到相机坐标, 然后该点的光线通过透镜光心与成像屏幕相交而成像,当然这是小孔成像模型,实际上透镜是汇集光线后成像的,这样得到的像才足够清晰。我们都知道调节相机的 焦距可以把成像放大或者缩小,于是三维坐标经过相机内部的转换(除了焦距还有其他一些参数决定)之后变成了二维图像以像素为单位的坐标,物体发出的光线的 色彩亮度决定了它成像后的像素色彩值,于是整个成像的主要过程就大概可以这样简化了,当然还有一些细节这里就不讨论了。于是可以说,只要给出了相机的和世 界的坐标系,还有相机的参数,我们就能够计算出世界坐标系中一点也就是物体上一点成像后在图像中的坐标,而无需实际测量一下图像中的对应点。

      现在我们可以解释开篇提出的第2个问题了,不妨把世界坐标和相机坐标系合并成一个,只要以摄像机的光心为原点,平行于地面过光心的屏幕为xoy平面建立一 个坐标系,人和真实的景物在这个3D场景中通过摄像机成像,而虚构的变形金刚由专业设计师事先建立好3D模型,点线面以及色彩渲染,然后把这个模型“放入 ”场景中该虚拟物体应该处在的位置,当然这个“放入”是在计算机中完成的,使用上面提到的三维点到图像的转换就能够让虚拟的景物和真实的场景出现在同一张 画面中。

      那 么第1个问题怎么解决呢?通过前面的讨论我们知道成像是从三维到二维的过程,那么要把三维的信息投影到二维平面上,我们都可以想象信息会丢失,除非图像中 有某些景物可以提供更多的信息,基于这些信息我们根据计算机视觉的基础——射影几何可以计算推导出想要的结果。比如图像中有一个盘子,根据经验我们知道它 的边缘是圆形的;比如图像中有扇门,它是某某牌子的,正好我家也是这个牌子的门,那么根据经验我知道这扇门是矩形的,并且它的长度和宽度我也知道,如果图 像中正好有个人他在这扇门的旁边,那我据此可以推算出这个人的身高;又比如图像中有幢大楼,据经验知道它是长方体,然后可以通过摄影几何中的消隐点方法推 算出拍摄此图像的相机镜头与大楼所成的方向角等信息。

      但是如果图像中没有这些事先可以知道的信息又该怎么办?这就需要用到计算机视觉中的重构理论了,通过不少于两幅从不同角度拍摄同一个场景,如果我们又知道 相机的参数以及拍摄这些照片时候的位置和角度,那么只把同一场景在各图像上成像的对应点找到,就可以根据计算机视觉的重构理论把景物的世界三维坐标计算出 来,那么一切关于景物的数量关系都可以得到了。但问题又来了,相机的参数怎么知道呢?计算机视觉的定标理论可以解决。对应点通过人工去找必然会很累,所以 通过诸如SIFT、YAPE等关键点查找并匹配算法可以自动实现匹配,这些都是近年来发展出来的算法,但这样也只能够获得为数不多的关键匹配点,重构出来 的模型的点数不多,通过密集光流等运动获取结构算法可以在一定程度解决。还有一个问题,那就是如果两幅拍摄同一物体的图像的相机参数都不知道还有可能重构 吗?通过计算机视觉的对极几何知识我们可以得到一个很有用的结果,那就是通过匹配好的点可以计算出一个称为基础矩阵的东西,通过它可以建立两幅图像的点到 直线的对应关系,基础矩阵包含了相机参数还有两个相机镜头的相对位置关系,通过它可以建立射影意义下的重构,当然我们更关心的是欧几里得空间下的重构。

      第3个问题跟上面的讨论密切相关,我们至少应该知道全景图这个东西,我们希望把多幅有重叠部分的图像合成在一起形成更广阔的视野,所以关键的技术在于怎么 把相同的部分匹配并且融合到一起,通过SIFT算法可以自动找到匹配点,如果使用透视投影把它们连接在一起,那么把单映矩阵计算出来就可以了,但这样的融 合似乎不太完美,于是有人想到把图像投影到圆柱或者球面上再进行连接,这样效果会更好,事实也证明了这点。要进行柱面或球面投影,需要知道各个相机的参数 (所谓的内参)还有位置角度(所谓的外参),这些正是前面讨论过的。



这篇关于计算机视觉的巨大应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/960598

相关文章

PHP应用中处理限流和API节流的最佳实践

《PHP应用中处理限流和API节流的最佳实践》限流和API节流对于确保Web应用程序的可靠性、安全性和可扩展性至关重要,本文将详细介绍PHP应用中处理限流和API节流的最佳实践,下面就来和小编一起学习... 目录限流的重要性在 php 中实施限流的最佳实践使用集中式存储进行状态管理(如 Redis)采用滑动

深入浅出Spring中的@Autowired自动注入的工作原理及实践应用

《深入浅出Spring中的@Autowired自动注入的工作原理及实践应用》在Spring框架的学习旅程中,@Autowired无疑是一个高频出现却又让初学者头疼的注解,它看似简单,却蕴含着Sprin... 目录深入浅出Spring中的@Autowired:自动注入的奥秘什么是依赖注入?@Autowired

PostgreSQL简介及实战应用

《PostgreSQL简介及实战应用》PostgreSQL是一种功能强大的开源关系型数据库管理系统,以其稳定性、高性能、扩展性和复杂查询能力在众多项目中得到广泛应用,本文将从基础概念讲起,逐步深入到高... 目录前言1. PostgreSQL基础1.1 PostgreSQL简介1.2 基础语法1.3 数据库

Python中的filter() 函数的工作原理及应用技巧

《Python中的filter()函数的工作原理及应用技巧》Python的filter()函数用于筛选序列元素,返回迭代器,适合函数式编程,相比列表推导式,内存更优,尤其适用于大数据集,结合lamb... 目录前言一、基本概念基本语法二、使用方式1. 使用 lambda 函数2. 使用普通函数3. 使用 N

Python中yield的用法和实际应用示例

《Python中yield的用法和实际应用示例》在Python中,yield关键字主要用于生成器函数(generatorfunctions)中,其目的是使函数能够像迭代器一样工作,即可以被遍历,但不会... 目录python中yield的用法详解一、引言二、yield的基本用法1、yield与生成器2、yi

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

从基础到高阶详解Python多态实战应用指南

《从基础到高阶详解Python多态实战应用指南》这篇文章主要从基础到高阶为大家详细介绍Python中多态的相关应用与技巧,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、多态的本质:python的“鸭子类型”哲学二、多态的三大实战场景场景1:数据处理管道——统一处理不同数据格式

Java Stream 的 Collectors.toMap高级应用与最佳实践

《JavaStream的Collectors.toMap高级应用与最佳实践》文章讲解JavaStreamAPI中Collectors.toMap的使用,涵盖基础语法、键冲突处理、自定义Map... 目录一、基础用法回顾二、处理键冲突三、自定义 Map 实现类型四、处理 null 值五、复杂值类型转换六、处理

分布式锁在Spring Boot应用中的实现过程

《分布式锁在SpringBoot应用中的实现过程》文章介绍在SpringBoot中通过自定义Lock注解、LockAspect切面和RedisLockUtils工具类实现分布式锁,确保多实例并发操作... 目录Lock注解LockASPect切面RedisLockUtils工具类总结在现代微服务架构中,分布

Python标准库之数据压缩和存档的应用详解

《Python标准库之数据压缩和存档的应用详解》在数据处理与存储领域,压缩和存档是提升效率的关键技术,Python标准库提供了一套完整的工具链,下面小编就来和大家简单介绍一下吧... 目录一、核心模块架构与设计哲学二、关键模块深度解析1.tarfile:专业级归档工具2.zipfile:跨平台归档首选3.