教程:批量将 .tif 文件转换为 .mat 文件

2024-08-26 19:20
文章标签 教程 转换 批量 tif mat

本文主要是介绍教程:批量将 .tif 文件转换为 .mat 文件,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

教程:批量将 .tif 文件转换为 .mat 文件

引言

在遥感图像处理、地理信息系统(GIS)等领域,.tif(Tagged Image File Format)是一种常用的文件格式,尤其适用于存储栅格数据。栅格数据是一种用来表示空间信息的方式,常用于遥感图像、地形模型等数据。

相比之下,在数据科学和机器学习领域,.mat(MATLAB 文件格式)则是一种非常流行的数据存储格式,特别适用于存储多维数组、矩阵等数据类型。

问题描述

你可能有一批 .tif 文件,这些文件可能包含卫星图像、地理信息数据或其他需要处理的栅格数据,但为了在 MATLAB 或 Python 中使用这些数据,你需要将它们转换为 .mat 格式。手动转换大量文件既费时又容易出错,因此我们需要编写一个 Python 脚本来自动完成这一任务。

解决方案

通过编写一个简单的 Python 脚本,我们可以自动将指定文件夹中的所有 .tif 文件转换为 .mat 文件。接下来我们会一步步解释这段代码的工作原理和实现方法。

提示: 完整代码文件请在公众号Python与遥感后台回复关键词“tifmat”自动获取。

所需的工具和库

在开始之前,你需要安装以下 Python 库:

  • os: 这是 Python 的标准库之一,用于处理文件和目录。
  • gdal: 用于读取和处理栅格地理数据。
  • numpy: 一个强大的科学计算库,用于处理多维数组。
  • scipy.io: 其中的 savemat 函数可以将数据保存为 .mat 格式。

如果你还没有安装这些库,可以使用以下命令进行安装:

pip install numpy scipy gdal

代码讲解

1. 导入必要的库

import os
from osgeo import gdal
import numpy as np
import scipy.io as sio
  • os: 用于处理文件路径和目录。
  • gdal: 用于打开和读取 .tif 文件,GDAL 是一个强大的地理空间数据处理库。
  • numpy: 用于数组操作,是科学计算的基础库。
  • scipy.io: 用于将数据保存为 .mat 文件,MATLAB 用户最熟悉的格式。

2. get_img 函数

def get_img(dataset_img):width = dataset_img.RasterXSize  # 获取图像的列数height = dataset_img.RasterYSize  # 获取图像的行数bands = dataset_img.RasterCount  # 获取图像的波段数print("行数为:", height)print("列数为:", width)print("波段数为:", bands)# 将图像数据读取为一个 numpy 数组img = dataset_img.ReadAsArray(0, 0, width, height)# 转置数组,使得数据的顺序符合我们通常的格式(行,列,波段)new_img = np.transpose(img, (1, 2, 0))return new_img
  • RasterXSizeRasterYSize 分别获取图像的列数和行数。
  • RasterCount 获取图像的波段数,例如 RGB 图像通常有 3 个波段,而高光谱图像可能有几十甚至上百个波段。
  • ReadAsArray 将图像数据读取为一个 NumPy 数组。
  • np.transpose 函数用于调整数组的维度顺序,使其符合我们常用的格式(行、列、波段),这对于后续的处理非常重要。

3. tiftomat 函数

def tiftomat(input_folder, output_folder, name):# 确保输出文件夹存在,不存在则创建if not os.path.exists(output_folder):os.makedirs(output_folder)# 遍历输入文件夹中的所有文件for file_name in os.listdir(input_folder):if file_name.endswith('.tif'):  # 检查文件是否是 .tif 格式# 构建完整的输入文件路径input_file = os.path.join(input_folder, file_name)# 使用 get_img 函数读取图像数据image = get_img(gdal.Open(input_file))# 构建输出文件的路径,将 .tif 后缀替换为 .matoutput_file = os.path.join(output_folder, file_name.replace('.tif', '.mat'))# 将图像数据保存为 .mat 文件sio.savemat(output_file, {name: image})
  • tiftomat 函数用于遍历指定文件夹中的所有 .tif 文件,并将它们逐一转换为 .mat 文件。
  • os.listdir(input_folder) 返回文件夹中所有文件的列表。通过 if file_name.endswith('.tif') 检查文件是否为 .tif 格式。
  • 使用 os.path.join 构建输入和输出文件的完整路径。
  • sio.savemat 函数将图像数据保存为 .mat 文件。name 参数指定了保存到 .mat 文件中的变量名。

注意: name 是保存到 .mat 文件中的变量名。MATLAB 用户在加载 .mat 文件时会看到这个名字。如果你的 .mat 文件中有多个变量,这个名字能帮助你识别存储的内容。

4. 主程序

if __name__ == '__main__':root = r'F:\datasets\TEST\540'  # 数据文件夹的根路径x_path = root + '\X'  # .tif 文件所在的文件夹out_x = root + '\X_mat'  # .mat 文件输出的文件夹tiftomat(x_path, out_x, name='hrhsi')  # 执行转换
  • if __name__ == '__main__': 是 Python 的标准写法,确保代码仅在直接运行脚本时才会执行,而不是被其他模块导入时。
  • root 是数据文件夹的根路径,你可以根据自己的文件存储位置进行修改。
  • x_path 是存放 .tif 文件的文件夹路径。
  • out_x 是用于保存 .mat 文件的输出文件夹路径。
  • tiftomat 函数会遍历 x_path 文件夹中的所有 .tif 文件,并将它们转换为 .mat 文件,保存到 out_x 文件夹中。

运行脚本

保存代码为 tif_to_mat.py 文件,然后在命令行中运行该脚本:

python tif_to_mat.py

运行后,脚本将自动遍历指定文件夹中的所有 .tif 文件,并将它们转换为 .mat 文件,保存在输出文件夹中。

如何读取 .mat 文件

如果你想在 MATLAB 或 Python 中读取转换后的 .mat 文件,可以参考以下方法。

在 MATLAB 中读取

data = load('文件路径.mat');
disp(data.hrhsi);  % 显示变量 'hrhsi' 的内容

在 Python 中读取

import scipy.io as siomat_data = sio.loadmat('文件路径.mat')
print(mat_data['hrhsi'])  # 打印变量 'hrhsi' 的内容

总结

通过这篇教程,你学习了如何使用 Python 编写一个脚本,将 .tif 文件批量转换为 .mat 文件。这种自动化方法不仅节省了大量时间,还可以避免手动转换可能带来的错误。此外,我们还解释了 .tif 和 .mat 文件格式的基本知识,并提供了如何在 MATLAB 和 Python 中读取 .mat 文件的示例。希望你在学习的过程中有所收获,如果有任何问题,欢迎在评论区交流!

这篇关于教程:批量将 .tif 文件转换为 .mat 文件的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1109457

相关文章

全网最全Tomcat完全卸载重装教程小结

《全网最全Tomcat完全卸载重装教程小结》windows系统卸载Tomcat重新通过ZIP方式安装Tomcat,优点是灵活可控,适合开发者自定义配置,手动配置环境变量后,可通过命令行快速启动和管理... 目录一、完全卸载Tomcat1. 停止Tomcat服务2. 通过控制面板卸载3. 手动删除残留文件4.

Python的pandas库基础知识超详细教程

《Python的pandas库基础知识超详细教程》Pandas是Python数据处理核心库,提供Series和DataFrame结构,支持CSV/Excel/SQL等数据源导入及清洗、合并、统计等功能... 目录一、配置环境二、序列和数据表2.1 初始化2.2  获取数值2.3 获取索引2.4 索引取内容2

python依赖管理工具UV的安装和使用教程

《python依赖管理工具UV的安装和使用教程》UV是一个用Rust编写的Python包安装和依赖管理工具,比传统工具(如pip)有着更快、更高效的体验,:本文主要介绍python依赖管理工具UV... 目录前言一、命令安装uv二、手动编译安装2.1在archlinux安装uv的依赖工具2.2从github

Ubuntu向多台主机批量传输文件的流程步骤

《Ubuntu向多台主机批量传输文件的流程步骤》:本文主要介绍在Ubuntu中批量传输文件到多台主机的方法,需确保主机互通、用户名密码统一及端口开放,通过安装sshpass工具,准备包含目标主机信... 目录Ubuntu 向多台主机批量传输文件1.安装 sshpass2.准备主机列表文件3.创建一个批处理脚

Java轻松实现PDF转换为PDF/A的示例代码

《Java轻松实现PDF转换为PDF/A的示例代码》本文将深入探讨Java环境下,如何利用专业工具将PDF转换为PDF/A格式,为数字文档的永续保存提供可靠方案,文中的示例代码讲解详细,感兴趣的小伙伴... 目录为什么需要将PDF转换为PDF/A使用Spire.PDF for Java进行转换前的准备通过

C#实现SHP文件读取与地图显示的完整教程

《C#实现SHP文件读取与地图显示的完整教程》在地理信息系统(GIS)开发中,SHP文件是一种常见的矢量数据格式,本文将详细介绍如何使用C#读取SHP文件并实现地图显示功能,包括坐标转换、图形渲染、平... 目录概述功能特点核心代码解析1. 文件读取与初始化2. 坐标转换3. 图形绘制4. 地图交互功能缩放

MySQL批量替换数据库字符集的实用方法(附详细代码)

《MySQL批量替换数据库字符集的实用方法(附详细代码)》当需要修改数据库编码和字符集时,通常需要对其下属的所有表及表中所有字段进行修改,下面:本文主要介绍MySQL批量替换数据库字符集的实用方法... 目录前言为什么要批量修改字符集?整体脚本脚本逻辑解析1. 设置目标参数2. 生成修改表默认字符集的语句3

SpringBoot集成redisson实现延时队列教程

《SpringBoot集成redisson实现延时队列教程》文章介绍了使用Redisson实现延迟队列的完整步骤,包括依赖导入、Redis配置、工具类封装、业务枚举定义、执行器实现、Bean创建、消费... 目录1、先给项目导入Redisson依赖2、配置redis3、创建 RedissonConfig 配

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函