kaggle气胸疾病图像分割top5解决方案

本文主要是介绍kaggle气胸疾病图像分割top5解决方案，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

比赛背景

突然喘气，无缘无故地无助地呼吸，这会是肺衰竭吗？气胸可由胸部钝伤、肺部疾病的损害引起，有时候甚至无法探寻诱因。在某些情况下，肺萎陷可能会危及生命。气胸通常由胸部X射线放射科医生诊断，但有时很难确诊。因此由医学影像信息学学会（SIIM）提供了气胸图片数据，kaggle举办了一场比赛，开发模型，为非放射科医生提供更可靠的诊断，并在疾病早期识别气胸，挽救生命。

数据

图片数据是胸透图片，并标注好了气胸区域。

在这里插入图片描述

第一名

模型

AlbuNet(resnet34)(https://github.com/ternaus/TernausNet)
Resnet50(https://github.com/SpaceNetChallenge/SpaceNet_Off_Nadir_Solutions/tree/master/selim_sef/zoo)
SCSEUnet (seresnext50)(https://github.com/SpaceNetChallenge/SpaceNet_Off_Nadir_Solutions/tree/master/selim_sef/zoo)

三重推理与验证方案

模型输出的是一个像素是mask的概率，作者将这种mask称为sigmoid mask，并使用三种不同阈值：top_score_threshold, min_contour_area, bottom_score_threshold。

基于top_score_threshold, min_contour_area来生成决策规则，而不是单单进行有无气胸的分类。

top_score_threshold：二值化阈值，将sigmoid mask转成由0和1组成的离散mask。
min_contour_area：值大于top_score_threshold的最大像素数。

没有通过top_score_threshold和min_contour_area这两个阈值的图像则为非气胸图像。

对于剩下的气胸图像，使用bottom_score_threshold阈值（另外一个阈值，小于基于top_score_threshold），大多数参赛者假设bottom_score_threshold阈值等于top_score_threshold。

classification_mask = predicted > top_score_threshold
mask = predicted.copy()
mask[classification_mask.sum(axis=(1,2,3)) < min_contour_area, :,:,:] = np.zeros_like(predicted[0])
mask = mask > bot_score_threshold
return mask

验证阶段搜索最佳阈值

验证阶段最佳三元阈值：(0.75, 2000, 0.3)
public LB最佳三元阈值：(0.7, 600, 0.3)

在最后提交阶段作者选了介于这两者之间的三元阈值。

Combo Loss

使用Combo Loss（https://github.com/SpaceNetChallenge/SpaceNet_Off_Nadir_Solutions/blob/master/selim_sef/training/losses.py），结合BCE，dice，focal损失，损失权重：

albunet_valid和seunet为(3,1,4)
albunet_public为(1,1,1)
resnet50为(2,1,2)

滑动采样率（sample rate）

将气胸图片比例称为采样率，并且在采样的时候控制比例。

每个epoch，选取所有的气胸图片，然后根据这一比例选取非气胸图片，比例从训练开始的0.8减少至0.4。

使用大比例，可以在训练前期加快训练，后期使用小的比例有助于网络收敛。

学习过程

在预训练模型上使用大学习率（1e-3或1e-4）训练10-12轮，大采样率（0.8），使用ReduceLROnPlateau调整学习率。
在前一个模型基础上使用中等学习率（大约1e-5），0.6采样率进行训练，学习率使用CosineAnnealingLR或CosineAnnealingWarmRestarts调整，直到收敛。
在前一个模型基础上使用中等学习率（大约1e-5），0.4采样率，学习率使用CosineAnnealingLR或CosineAnnealingWarmRestarts调整，直到收敛。
使用1e-5或1e-6学习率训练，0.5采样率，学习率使用CosineAnnealingLR或CosineAnnealingWarmRestarts调整。

数据增强

使用albumentations中提供的数据增强方法：

albu.Compose([albu.HorizontalFlip(),albu.OneOf([albu.RandomContrast(),albu.RandomGamma(),albu.RandomBrightness(),], p=0.3),albu.OneOf([albu.ElasticTransform(alpha=120, sigma=120 * 0.05, alpha_affine=120 * 0.03),albu.GridDistortion(),albu.OpticalDistortion(distort_limit=2, shift_limit=0.5),], p=0.3),albu.ShiftScaleRotate(),albu.Resize(img_size,img_size,always_apply=True),
])

其他

在512x512的图像上训练后之后，再在1024x1024的图片上继续训练。
小批量数据训练，批次大小为2-4
水平翻转+TTA

结果

在这里插入图片描述

第二名

分割

使用unet和deeplabv3作为分割模型。

数据：气胸图像
损失：dice损失
数据增强：与分类一样
主干网络：seresnext50, seresnext101, efficientnet-b3, efficientnet-b5
集成方法：average

第三名

解决方案

在这里插入图片描述

数据

由于图片太大，作者在1024x1024的图片上训练Unet来分割肺区域。

在这里插入图片描述

作者充分使用了CheXpert和NIH数据集，并且在阅读了相关论文后发现数据标注不是很准确，因此不能直接使用，而是使用伪标签。因此作者使用比赛的数据训练了主干网络为resnet34的Unet模型，在CheXpert上预测标记为正样本的数据，然后从中选出模型预测也为正样本的数据，而由于作者参加的另外一场比赛（Dogs-GAN）推迟结束，参加这个比赛的时间有限，所以直接使用负样本数据，而不进行同样的筛选。而对于NIH数据集，则是直接使用自己的预测结果，不使用数据标记。

在这里插入图片描述

在训练伪标签模型时，保持正负样本比例一样，伪标签样本数为正确标签样本数的一半。

模型

在Unet上主要尝试了resnet34和SE-resnext50两种主干网络，因为resnet34是轻量级的，适合用于实验，而SE-resnext50足够深，适合用于比赛，作者没有更多的时间和资源来训练更大更深的网络。

在这里插入图片描述

作者最后的三个模型：

704x704图像，没有伪标签
576x576图像，CheXpert的伪标签
576x576图像，CheXpert和NIH伪标签

其他

注意力模块：CBAM
损失：Lovasz Loss
不用分类，作者认为像素级别的标签已经够了，如果使用分类模型的话，很难选择阈值。
不使用阈值搜索，直接使用0.5
优化器：Adam，学习率0.0001，学习率不变
Epochs：15
训练6轮后对模型参数使用EMA（指数滑动平均）
批次大小：576x576图像时使批次大小为3，不使用BN，704x704图像时批次大小为2。

第四名

在这里插入图片描述

模型：Unet
主干网络：ResNet34，固定BN
预处理：在随机裁剪的512x512图片上训练，768x768上进行预测。
数据增强：albumentations中的ShiftScaleRotate, RandomBrightnessContrast, ElasticTransform, HorizontalFlip。
优化器：Adam，批次大小8
Scheduler: CosineAnnealingLR
额外特点：非气胸数据比例在训练过程中逐渐减少，从0.8降至0.22，这样使模型收敛更快。
损失：

2.7 * BCE(pred_mask, gt_mask) + 0.9 * DICE(pred_mask, gt_mask) + 0.1 * BCE(pred_empty, gt_empty)

后处理：

if pred_empty > 0.4 or area(pred_mask) < 800: pred_mask = empty

集成：8折交叉验证得到4个最好模型，使用水平翻转TTA，对结果求平均。

第五名

作者的解决方法基于半监督学习，并且在网络中加入了两个分类器。

网络：带Aspp结构的Unet
主干网络：se50 & se101
图像大小：1024x1024
优化器：Adam
损失：1024 * BCE(results, masks) + BCE(cls, cls_target)
半监督学习： mean-teacher[1-2]，使用NIH数据集

扫码关注微信公众号：机器工匠，回复关键字“气胸”获取top5的代码实现。
在这里插入图片描述

这篇关于kaggle气胸疾病图像分割top5解决方案的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

kaggle气胸疾病图像分割top5解决方案

比赛背景

数据

第一名

模型

三重推理与验证方案

验证阶段搜索最佳阈值

Combo Loss

滑动采样率（sample rate）

学习过程

数据增强

其他

结果

第二名

分类

分割

第三名

解决方案

数据

模型

其他

第四名

第五名

相关文章

C#文件复制异常："未能找到文件"的解决方案与预防措施

C# LiteDB处理时间序列数据的高性能解决方案

SpringBoot3匹配Mybatis3的错误与解决方案

C++ vector越界问题的完整解决方案

Python 字符串裁切与提取全面且实用的解决方案

Linux部署中的文件大小写问题的解决方案

Java中InputStream重复使用问题的几种解决方案

MybatisPlus中removeById删除数据库未变解决方案

创建springBoot模块没有目录结构的解决方案

idea Maven Springboot多模块项目打包时90%的问题及解决方案