CIRDataset:用于临床可解释肺结节放射组学和恶性肿瘤预测的大规模数据集

本文主要是介绍CIRDataset:用于临床可解释肺结节放射组学和恶性肿瘤预测的大规模数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • CIRDataset: A Large-Scale Dataset for Clinically-Interpretable Lung Nodule Radiomics and Malignancy Prediction
    • 摘要
    • 详情
    • 结果

CIRDataset: A Large-Scale Dataset for Clinically-Interpretable Lung Nodule Radiomics and Malignancy Prediction

摘要

肺结节表面的尖刺/分叶状突起、尖锐/弯曲的尖刺是癌症恶性程度的良好预测因素,因此,放射科医生会定期评估和报告,作为标准化的肺RADS临床评分标准的一部分。考虑到结节的3D几何形状和放射科医生的2D逐片评估,手动穿刺/分叶注释是一项乏味的任务,因此到目前为止,还没有公共数据集来探索这些临床报告的特征在SOTA恶性预测算法中的重要性。作为本文的一部分,我们发布了一个大规模的临床可解释放射组学数据集CIRDataset,其中包含来自两个公共数据集LIDC-IDRI(N=883)和LUNGx(N=73)的956个放射科医生对分割的肺结节进行的QA/QC标记/分叶注释。我们还提出了一种基于多类Voxel2Mesh扩展的端到端深度学习模型,用于分割结节(同时保留尖峰)、分类尖峰(尖锐/毛刺和弯曲/分叶),并进行恶性预测。先前的方法已经对LIDC和LUNGx数据集进行了恶性肿瘤预测,但没有对任何临床报告/可操作的特征进行可靠的归因(由于通用归因方案的已知超参数敏感性问题)。随着这一全面注释的CIRDataset和端到端深度学习基线的发布,我们希望恶性肿瘤预测方法能够验证它们的解释,对照我们的基线进行基准测试,并提供临床可操作的见解。
代码地址

详情

在这里插入图片描述
结节毛刺量化数据集样本;第一行输入的CT图像;输入CT图像上的第二行叠加区域失真图和每个分类的轮廓;第三行-具有顶点分类的三维网格模型;红色:毛刺,蓝色:小叶,白色:结节(在线彩色图)

过去已经提出了几种深度学习体素/像素分割算法,但其中大多数算法倾向于平滑构成毛刺和分叶特征的高频尖峰(Voxel2Mesh[16]是迄今为止唯一保留这些尖峰的例外)。通过UNet、FPN和Voxel2Mesh进行的随机LIDC训练/验证分割的结节分割的Jaccard指数为0.775/0.537、0.685/0.592和0.778/0.609,峰值分割的Jaccard指数为0.450/0.203、0.332/0.236和0.493/0.476。

在这里插入图片描述
描述了基于多类Voxel2Mesh扩展的端到端深度学习架构。基于UNet的标准体素编码器/解码器(顶部)从输入CT体积中提取特征,而网格解码器将初始球形网格变形为与目标形状匹配的越来越精细的分辨率网格。网格变形利用通过学习邻域(LN)采样技术从体素解码器采样的特征向量,并且还在高曲率区域中执行具有增加的顶点计数的自适应去极化。我们通过引入额外的网格解码器层来扩展该体系结构,用于毛刺和分叶分类。我们还对来自最终网格非冷却层的顶点(形状特征)进行采样,作为全连通恶性肿瘤预测网络的输入。我们可选地将来自最后一个体素编码器层的深层体素特征添加到恶性肿瘤预测网络

结果

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

这篇关于CIRDataset:用于临床可解释肺结节放射组学和恶性肿瘤预测的大规模数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/261962

相关文章

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Python中isinstance()函数原理解释及详细用法示例

《Python中isinstance()函数原理解释及详细用法示例》isinstance()是Python内置的一个非常有用的函数,用于检查一个对象是否属于指定的类型或类型元组中的某一个类型,它是Py... 目录python中isinstance()函数原理解释及详细用法指南一、isinstance()函数

C#使用iText获取PDF的trailer数据的代码示例

《C#使用iText获取PDF的trailer数据的代码示例》开发程序debug的时候,看到了PDF有个trailer数据,挺有意思,于是考虑用代码把它读出来,那么就用到我们常用的iText框架了,所... 目录引言iText 核心概念C# 代码示例步骤 1: 确保已安装 iText步骤 2: C# 代码程

Pandas处理缺失数据的方式汇总

《Pandas处理缺失数据的方式汇总》许多教程中的数据与现实世界中的数据有很大不同,现实世界中的数据很少是干净且同质的,本文我们将讨论处理缺失数据的一些常规注意事项,了解Pandas如何表示缺失数据,... 目录缺失数据约定的权衡Pandas 中的缺失数据None 作为哨兵值NaN:缺失的数值数据Panda

C++中处理文本数据char与string的终极对比指南

《C++中处理文本数据char与string的终极对比指南》在C++编程中char和string是两种用于处理字符数据的类型,但它们在使用方式和功能上有显著的不同,:本文主要介绍C++中处理文本数... 目录1. 基本定义与本质2. 内存管理3. 操作与功能4. 性能特点5. 使用场景6. 相互转换核心区别

java时区时间转为UTC的代码示例和详细解释

《java时区时间转为UTC的代码示例和详细解释》作为一名经验丰富的开发者,我经常被问到如何将Java中的时间转换为UTC时间,:本文主要介绍java时区时间转为UTC的代码示例和详细解释,文中通... 目录前言步骤一:导入必要的Java包步骤二:获取指定时区的时间步骤三:将指定时区的时间转换为UTC时间步

python库pydantic数据验证和设置管理库的用途

《python库pydantic数据验证和设置管理库的用途》pydantic是一个用于数据验证和设置管理的Python库,它主要利用Python类型注解来定义数据模型的结构和验证规则,本文给大家介绍p... 目录主要特点和用途:Field数值验证参数总结pydantic 是一个让你能够 confidentl

JAVA实现亿级千万级数据顺序导出的示例代码

《JAVA实现亿级千万级数据顺序导出的示例代码》本文主要介绍了JAVA实现亿级千万级数据顺序导出的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 前提:主要考虑控制内存占用空间,避免出现同时导出,导致主程序OOM问题。实现思路:A.启用线程池

SpringBoot分段处理List集合多线程批量插入数据方式

《SpringBoot分段处理List集合多线程批量插入数据方式》文章介绍如何处理大数据量List批量插入数据库的优化方案:通过拆分List并分配独立线程处理,结合Spring线程池与异步方法提升效率... 目录项目场景解决方案1.实体类2.Mapper3.spring容器注入线程池bejsan对象4.创建

PHP轻松处理千万行数据的方法详解

《PHP轻松处理千万行数据的方法详解》说到处理大数据集,PHP通常不是第一个想到的语言,但如果你曾经需要处理数百万行数据而不让服务器崩溃或内存耗尽,你就会知道PHP用对了工具有多强大,下面小编就... 目录问题的本质php 中的数据流处理:为什么必不可少生成器:内存高效的迭代方式流量控制:避免系统过载一次性