教程:批量将 .tif 文件转换为 .mat 文件

2024-08-26 19:20
文章标签 教程 转换 批量 tif mat

本文主要是介绍教程:批量将 .tif 文件转换为 .mat 文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

教程:批量将 .tif 文件转换为 .mat 文件

引言

在遥感图像处理、地理信息系统(GIS)等领域,.tif(Tagged Image File Format)是一种常用的文件格式,尤其适用于存储栅格数据。栅格数据是一种用来表示空间信息的方式,常用于遥感图像、地形模型等数据。

相比之下,在数据科学和机器学习领域,.mat(MATLAB 文件格式)则是一种非常流行的数据存储格式,特别适用于存储多维数组、矩阵等数据类型。

问题描述

你可能有一批 .tif 文件,这些文件可能包含卫星图像、地理信息数据或其他需要处理的栅格数据,但为了在 MATLAB 或 Python 中使用这些数据,你需要将它们转换为 .mat 格式。手动转换大量文件既费时又容易出错,因此我们需要编写一个 Python 脚本来自动完成这一任务。

解决方案

通过编写一个简单的 Python 脚本,我们可以自动将指定文件夹中的所有 .tif 文件转换为 .mat 文件。接下来我们会一步步解释这段代码的工作原理和实现方法。

提示: 完整代码文件请在公众号Python与遥感后台回复关键词“tifmat”自动获取。

所需的工具和库

在开始之前,你需要安装以下 Python 库:

  • os: 这是 Python 的标准库之一,用于处理文件和目录。
  • gdal: 用于读取和处理栅格地理数据。
  • numpy: 一个强大的科学计算库,用于处理多维数组。
  • scipy.io: 其中的 savemat 函数可以将数据保存为 .mat 格式。

如果你还没有安装这些库,可以使用以下命令进行安装:

pip install numpy scipy gdal

代码讲解

1. 导入必要的库

import os
from osgeo import gdal
import numpy as np
import scipy.io as sio
  • os: 用于处理文件路径和目录。
  • gdal: 用于打开和读取 .tif 文件,GDAL 是一个强大的地理空间数据处理库。
  • numpy: 用于数组操作,是科学计算的基础库。
  • scipy.io: 用于将数据保存为 .mat 文件,MATLAB 用户最熟悉的格式。

2. get_img 函数

def get_img(dataset_img):width = dataset_img.RasterXSize  # 获取图像的列数height = dataset_img.RasterYSize  # 获取图像的行数bands = dataset_img.RasterCount  # 获取图像的波段数print("行数为:", height)print("列数为:", width)print("波段数为:", bands)# 将图像数据读取为一个 numpy 数组img = dataset_img.ReadAsArray(0, 0, width, height)# 转置数组,使得数据的顺序符合我们通常的格式(行,列,波段)new_img = np.transpose(img, (1, 2, 0))return new_img
  • RasterXSizeRasterYSize 分别获取图像的列数和行数。
  • RasterCount 获取图像的波段数,例如 RGB 图像通常有 3 个波段,而高光谱图像可能有几十甚至上百个波段。
  • ReadAsArray 将图像数据读取为一个 NumPy 数组。
  • np.transpose 函数用于调整数组的维度顺序,使其符合我们常用的格式(行、列、波段),这对于后续的处理非常重要。

3. tiftomat 函数

def tiftomat(input_folder, output_folder, name):# 确保输出文件夹存在,不存在则创建if not os.path.exists(output_folder):os.makedirs(output_folder)# 遍历输入文件夹中的所有文件for file_name in os.listdir(input_folder):if file_name.endswith('.tif'):  # 检查文件是否是 .tif 格式# 构建完整的输入文件路径input_file = os.path.join(input_folder, file_name)# 使用 get_img 函数读取图像数据image = get_img(gdal.Open(input_file))# 构建输出文件的路径,将 .tif 后缀替换为 .matoutput_file = os.path.join(output_folder, file_name.replace('.tif', '.mat'))# 将图像数据保存为 .mat 文件sio.savemat(output_file, {name: image})
  • tiftomat 函数用于遍历指定文件夹中的所有 .tif 文件,并将它们逐一转换为 .mat 文件。
  • os.listdir(input_folder) 返回文件夹中所有文件的列表。通过 if file_name.endswith('.tif') 检查文件是否为 .tif 格式。
  • 使用 os.path.join 构建输入和输出文件的完整路径。
  • sio.savemat 函数将图像数据保存为 .mat 文件。name 参数指定了保存到 .mat 文件中的变量名。

注意: name 是保存到 .mat 文件中的变量名。MATLAB 用户在加载 .mat 文件时会看到这个名字。如果你的 .mat 文件中有多个变量,这个名字能帮助你识别存储的内容。

4. 主程序

if __name__ == '__main__':root = r'F:\datasets\TEST\540'  # 数据文件夹的根路径x_path = root + '\X'  # .tif 文件所在的文件夹out_x = root + '\X_mat'  # .mat 文件输出的文件夹tiftomat(x_path, out_x, name='hrhsi')  # 执行转换
  • if __name__ == '__main__': 是 Python 的标准写法,确保代码仅在直接运行脚本时才会执行,而不是被其他模块导入时。
  • root 是数据文件夹的根路径,你可以根据自己的文件存储位置进行修改。
  • x_path 是存放 .tif 文件的文件夹路径。
  • out_x 是用于保存 .mat 文件的输出文件夹路径。
  • tiftomat 函数会遍历 x_path 文件夹中的所有 .tif 文件,并将它们转换为 .mat 文件,保存到 out_x 文件夹中。

运行脚本

保存代码为 tif_to_mat.py 文件,然后在命令行中运行该脚本:

python tif_to_mat.py

运行后,脚本将自动遍历指定文件夹中的所有 .tif 文件,并将它们转换为 .mat 文件,保存在输出文件夹中。

如何读取 .mat 文件

如果你想在 MATLAB 或 Python 中读取转换后的 .mat 文件,可以参考以下方法。

在 MATLAB 中读取

data = load('文件路径.mat');
disp(data.hrhsi);  % 显示变量 'hrhsi' 的内容

在 Python 中读取

import scipy.io as siomat_data = sio.loadmat('文件路径.mat')
print(mat_data['hrhsi'])  # 打印变量 'hrhsi' 的内容

总结

通过这篇教程,你学习了如何使用 Python 编写一个脚本,将 .tif 文件批量转换为 .mat 文件。这种自动化方法不仅节省了大量时间,还可以避免手动转换可能带来的错误。此外,我们还解释了 .tif 和 .mat 文件格式的基本知识,并提供了如何在 MATLAB 和 Python 中读取 .mat 文件的示例。希望你在学习的过程中有所收获,如果有任何问题,欢迎在评论区交流!

这篇关于教程:批量将 .tif 文件转换为 .mat 文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109457

相关文章

Java controller接口出入参时间序列化转换操作方法(两种)

《Javacontroller接口出入参时间序列化转换操作方法(两种)》:本文主要介绍Javacontroller接口出入参时间序列化转换操作方法,本文给大家列举两种简单方法,感兴趣的朋友一起看... 目录方式一、使用注解方式二、统一配置场景:在controller编写的接口,在前后端交互过程中一般都会涉及

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删

SpringBoot整合mybatisPlus实现批量插入并获取ID详解

《SpringBoot整合mybatisPlus实现批量插入并获取ID详解》这篇文章主要为大家详细介绍了SpringBoot如何整合mybatisPlus实现批量插入并获取ID,文中的示例代码讲解详细... 目录【1】saveBATch(一万条数据总耗时:2478ms)【2】集合方式foreach(一万条数

Java对象转换的实现方式汇总

《Java对象转换的实现方式汇总》:本文主要介绍Java对象转换的多种实现方式,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Java对象转换的多种实现方式1. 手动映射(Manual Mapping)2. Builder模式3. 工具类辅助映

如何为Yarn配置国内源的详细教程

《如何为Yarn配置国内源的详细教程》在使用Yarn进行项目开发时,由于网络原因,直接使用官方源可能会导致下载速度慢或连接失败,配置国内源可以显著提高包的下载速度和稳定性,本文将详细介绍如何为Yarn... 目录一、查询当前使用的镜像源二、设置国内源1. 设置为淘宝镜像源2. 设置为其他国内源三、还原为官方

python实现svg图片转换为png和gif

《python实现svg图片转换为png和gif》这篇文章主要为大家详细介绍了python如何实现将svg图片格式转换为png和gif,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录python实现svg图片转换为png和gifpython实现图片格式之间的相互转换延展:基于Py

Maven的使用和配置国内源的保姆级教程

《Maven的使用和配置国内源的保姆级教程》Maven是⼀个项目管理工具,基于POM(ProjectObjectModel,项目对象模型)的概念,Maven可以通过一小段描述信息来管理项目的构建,报告... 目录1. 什么是Maven?2.创建⼀个Maven项目3.Maven 核心功能4.使用Maven H

C#实现将Excel表格转换为图片(JPG/ PNG)

《C#实现将Excel表格转换为图片(JPG/PNG)》Excel表格可能会因为不同设备或字体缺失等问题,导致格式错乱或数据显示异常,转换为图片后,能确保数据的排版等保持一致,下面我们看看如何使用C... 目录通过C# 转换Excel工作表到图片通过C# 转换指定单元格区域到图片知识扩展C# 将 Excel

IDEA自动生成注释模板的配置教程

《IDEA自动生成注释模板的配置教程》本文介绍了如何在IntelliJIDEA中配置类和方法的注释模板,包括自动生成项目名称、包名、日期和时间等内容,以及如何定制参数和返回值的注释格式,需要的朋友可以... 目录项目场景配置方法类注释模板定义类开头的注释步骤类注释效果方法注释模板定义方法开头的注释步骤方法注

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指