【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png

本文主要是介绍【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

【Segment Anything Model】做分割的专栏链接,欢迎来学习。
【博主微信】cvxiaoyixiao
本专栏为公开数据集的介绍和预处理,持续更新中。

文章目录

  • 1️⃣ ACDC数据集介绍
  • 2️⃣ ACDC数据集样例
  • 3️⃣ 预处理ACDC目标
  • 4️⃣ 处理结果样图
  • 5️⃣ 代码
  • 6️⃣ 划分测试集和训练集

1️⃣ ACDC数据集介绍

他是一个多类别的心脏3D MRI影像数据集`,2017年ACDC挑战赛(Automated Cardiac Diagnosis
Challenge)。

原数据集获取,网盘永久有效:
链接:https://pan.baidu.com/s/1F4Xq1crtUSmFcSKxwO4Eaw?pwd=ejfa 提取码:ejfa
–来自百度网盘超级会员V6的分享

2️⃣ ACDC数据集样例

首先夸夸👍 ,ACDC数据集存放格式非常规律👍 ,数据质量非常高👍 清晰了分为3类别。
在这里插入图片描述
training里有100例患者,testing里有50例患者。每个nii的切片个数不同根据勾画的肿瘤。
在这里插入图片描述

Info是媒体信息
patient001_4d.nii.gz是全部的切片,我也不知道从医学上怎么描述,就是这个患者的立体影像,包括没有肿瘤的部分
patient001_frame01.nii.gz是一个时期nii影响的压缩包
patient001_frame01_gt.nii.gz对应patient001_frame01.nii.gz的肿瘤勾画的label的压缩包。用四种像素对应了四个类别包括背景。
patient001_frame12.nii.gz是统一患者另一时期的影像
patient001_frame12_gt.nii.gz是对应的label

总之每个患者都有一个整体影像,还有两个不同成像和对应label。以下是打开之后的影像图。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

3️⃣ 预处理ACDC目标

目标:处理ACDC的nii.gz数据集到VOC格式的2d的png图片
VOC格式 这篇文章有讲直达
在这里插入图片描述

例如:将patient001_frame01.nii.gz处理成几张png作为网络image的输入。将patient001_frame01_gt.nii.gz处理成几张png作为label。只处理了training的100例患者,把training当成了整个集合划分了训练测试。并且只关心了frame01第一阶段,第二个阶段的未关心。只关心了留下的部分。够了。
在这里插入图片描述

4️⃣ 处理结果样图

处理结果样图:
img转为jpg label转为png 并且像素为0-3. 0代表背景,1-3代表分类。label图像素太小,这里看不出来,可以看第三张数组图
在这里插入图片描述在这里插入图片描述
在这里插入图片描述

5️⃣ 代码

事先准备好VOC文件夹在这里插入图片描述

"""
处理官网下载的ACDC到网络要求的VOC格式,按需调用
author: cvxiayixiao
Wechat: cvxiayixiao
"""
import os
from os.path import join
import nibabel as nib
import gzip
import shutil
import matplotlib.pyplot as plt
import numpy as npori_ACDC_train_path = './ACDC_challenge_20170617/training'def niigz2nii():"""解压每个患者的01阶段的nii.gz 和 gt.nii.gz 到输入文件夹"ACDC_nii""""input_path = ori_ACDC_train_path# 处理image# target='frame01.nii'# output_path = 'ACDC_nii/images'# 处理gttarget = 'frame01_gt.nii'output_path = 'ACDC_nii/labels'for patient in os.listdir(input_path):# ACDC_challenge_20170617/training/patient001patient_path = join(input_path, patient)for niigz in os.listdir(patient_path):if target in niigz:niigzpath = join(patient_path, niigz)new_nii_path = join(output_path, niigz)shutil.copy(niigzpath, new_nii_path)# niigz2nii()
def convert_nii_to_jpg():'''将ACDC_nii/images中的nii转到VOCjpg中:return:'''image_num = 0nii_path = "./ACDC_nii/images"output_dir = "./VOCdevkit/VOC2007/JPEGImages"for patient in os.listdir(nii_path):patient_path = join(nii_path, patient)for one in os.listdir(patient_path):one_patient_nii_path = join(patient_path, one)# 加载 .nii 文件nii_img = nib.load(one_patient_nii_path)data = nii_img.get_fdata()# 遍历数据的每个切片,并保存为 .png 文件for i in range(data.shape[2]):image_num += 1# 获取当前切片数据slice_data = data[:, :, i]# 创建输出文件路径num = f"{image_num}".zfill(6)output_path = os.path.join(output_dir, f'{patient}_{num}.jpg')# 以灰度图像格式保存切片数据为 .png 文件plt.imsave(output_path, slice_data, cmap='gray')# convert_nii_to_jpg()def convert_nii_to_png():'''将ACDC_nii/labels中的nii转到ACDC_nii/tmp_png_label中此时的像素是原label 中的像素,不是网络中的分类像素,还需要一部转换:return:'''image_num = 0nii_path = "./ACDC_nii/labels"output_dir = "./tmp"for patient in os.listdir(nii_path):patient_path = join(nii_path, patient)for one in os.listdir(patient_path):one_patient_nii_path = join(patient_path, one)# 加载 .nii 文件nii_img = nib.load(one_patient_nii_path)data = nii_img.get_fdata()# 遍历数据的每个切片,并保存为 .png 文件for i in range(data.shape[2]):image_num += 1# 获取当前切片数据slice_data = data[:, :, i]# 创建输出文件路径num = f"{image_num}".zfill(6)output_path = os.path.join(output_dir, f'{patient}_{num}.png')# 以灰度图像格式保存切片数据为 .png 文件plt.imsave(output_path, slice_data, cmap='gray')from PIL import Imagedef turnto255():from PIL import Imagefrom PIL import Imagefor i in os.listdir("tmp"):output_path = os.path.join("./tmp1", i)png_path = join("tmp", i)# 读取图像image = plt.imread(png_path)# 取三个通道的平均值im_gray = np.mean(image, axis=2)im_gray = Image.fromarray((im_gray * 255).astype(np.uint8)).convert("L")# 保存输出图像im_gray.save(output_path)def rename():"""处理好的VOC2007 train和test名称不同,名称不对应不能训练转为对应的,之前的留作副本可以对应原图:return:"""root = "VOCdevkit/VOC2007/SegmentationClass"for i in os.listdir(root):img_old_path = join(root, i)new_png_path = join(root, i[-10:])shutil.copy(img_old_path, new_png_path)# rename()0-255转为0-3类代码,加微信cvxiayixiao

6️⃣ 划分测试集和训练集

import os
import randomimport numpy as np
from PIL import Image
from tqdm import tqdm#   修改train_percent用于改变验证集的比例 9:1
trainval_percent    = 1
train_percent       = 0.9
VOCdevkit_path      = 'VOCdevkit'if __name__ == "__main__":random.seed(0)print("Generate txt in ImageSets.")segfilepath     = os.path.join(VOCdevkit_path, 'VOC2007/SegmentationClass')saveBasePath    = os.path.join(VOCdevkit_path, 'VOC2007/ImageSets/Segmentation')temp_seg = os.listdir(segfilepath)total_seg = []for seg in temp_seg:if seg.endswith(".png"):total_seg.append(seg)num     = len(total_seg)  list    = range(num)  tv      = int(num*trainval_percent)  tr      = int(tv*train_percent)  trainval= random.sample(list,tv)  train   = random.sample(trainval,tr)  print("train and val size",tv)print("traub suze",tr)ftrainval   = open(os.path.join(saveBasePath,'trainval.txt'), 'w')  ftest       = open(os.path.join(saveBasePath,'test.txt'), 'w')  ftrain      = open(os.path.join(saveBasePath,'train.txt'), 'w')  fval        = open(os.path.join(saveBasePath,'val.txt'), 'w')  for i in list:  name = total_seg[i][:-4]+'\n'  if i in trainval:  ftrainval.write(name)  if i in train:  ftrain.write(name)  else:  fval.write(name)  else:  ftest.write(name)  ftrainval.close()  ftrain.close()  fval.close()  ftest.close()

成功划分
在这里插入图片描述

这篇关于【ACDC数据集】:预处理ACDC心脏3D MRI影像数据集到VOC数据集格式,nii转为jpg,label转为png的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/280668

相关文章

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

C#代码实现解析WTGPS和BD数据

《C#代码实现解析WTGPS和BD数据》在现代的导航与定位应用中,准确解析GPS和北斗(BD)等卫星定位数据至关重要,本文将使用C#语言实现解析WTGPS和BD数据,需要的可以了解下... 目录一、代码结构概览1. 核心解析方法2. 位置信息解析3. 经纬度转换方法4. 日期和时间戳解析5. 辅助方法二、L

使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)

《使用Python和Matplotlib实现可视化字体轮廓(从路径数据到矢量图形)》字体设计和矢量图形处理是编程中一个有趣且实用的领域,通过Python的matplotlib库,我们可以轻松将字体轮廓... 目录背景知识字体轮廓的表示实现步骤1. 安装依赖库2. 准备数据3. 解析路径指令4. 绘制图形关键

解决mysql插入数据锁等待超时报错:Lock wait timeout exceeded;try restarting transaction

《解决mysql插入数据锁等待超时报错:Lockwaittimeoutexceeded;tryrestartingtransaction》:本文主要介绍解决mysql插入数据锁等待超时报... 目录报错信息解决办法1、数据库中执行如下sql2、再到 INNODB_TRX 事务表中查看总结报错信息Lock

使用C#删除Excel表格中的重复行数据的代码详解

《使用C#删除Excel表格中的重复行数据的代码详解》重复行是指在Excel表格中完全相同的多行数据,删除这些重复行至关重要,因为它们不仅会干扰数据分析,还可能导致错误的决策和结论,所以本文给大家介绍... 目录简介使用工具C# 删除Excel工作表中的重复行语法工作原理实现代码C# 删除指定Excel单元

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创

Nacos日志与Raft的数据清理指南

《Nacos日志与Raft的数据清理指南》随着运行时间的增长,Nacos的日志文件(logs/)和Raft持久化数据(data/protocol/raft/)可能会占用大量磁盘空间,影响系统稳定性,本... 目录引言1. Nacos 日志文件(logs/ 目录)清理1.1 日志文件的作用1.2 是否可以删除

使用Python获取JS加载的数据的多种实现方法

《使用Python获取JS加载的数据的多种实现方法》在当今的互联网时代,网页数据的动态加载已经成为一种常见的技术手段,许多现代网站通过JavaScript(JS)动态加载内容,这使得传统的静态网页爬取... 目录引言一、动态 网页与js加载数据的原理二、python爬取JS加载数据的方法(一)分析网络请求1

8种快速易用的Python Matplotlib数据可视化方法汇总(附源码)

《8种快速易用的PythonMatplotlib数据可视化方法汇总(附源码)》你是否曾经面对一堆复杂的数据,却不知道如何让它们变得直观易懂?别慌,Python的Matplotlib库是你数据可视化的... 目录引言1. 折线图(Line Plot)——趋势分析2. 柱状图(Bar Chart)——对比分析3