44、基于深度学习的癌症检测(matlab)

2024-06-21 10:36

本文主要是介绍44、基于深度学习的癌症检测(matlab),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、基于深度学习的癌症检测原理及流程

基于深度学习的癌症检测是利用深度学习算法对医学影像数据进行分析和诊断,以帮助医生准确地检测癌症病变。其原理和流程主要包括以下几个步骤:

  1. 数据采集:首先需要收集包括X光片、CT扫描、MRI等医学影像数据以及对应的癌症诊断结果的大量数据集。

  2. 数据预处理:对采集的医学影像数据进行预处理,包括去噪、标准化、图像增强等操作,以确保数据的质量和一致性。

  3. 特征提取:利用深度学习算法对预处理后的影像数据进行特征提取,提取出代表影像中癌症病变特征的高级特征表示。

  4. 训练模型:搭建深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)等,使用提取的特征表示进行训练,让模型能够自动学习影像数据中与癌症相关的模式和规律。

  5. 模型评估:通过验证集或交叉验证等方法对训练好的深度学习模型进行评估,评估模型在未见过的数据上的性能表现。

  6. 癌症检测:使用训练好的深度学习模型对新的医学影像数据进行检测和诊断,判断是否存在癌症病变,并输出诊断结果。

  7. 可解释性分析:在输出诊断结果的同时,深度学习模型还可以提供对诊断依据的可解释性分析,解释模型是如何判断出病变的,并帮助医生理解判断依据。

通过以上流程,基于深度学习的癌症检测技术可以提高检测的准确性和效率,帮助医生更早地发现和治疗癌症,促进癌症的早期诊断和治疗。

2、基于深度学习的癌症检测说明

针对问题

训练一个神经网络来使用蛋白质表达谱上的质谱数据检测癌症。

数据来源

来自 FDA-NCI 临床蛋白质组学计划数据库的ovarian_dataset.mat文件

数据预处理

新文件包含变量 Y、MZ 和 grp。

说明:

Y 中的每列表示从一名患者身上获取的测量值。Y 中有 216 列,表示有 216 个患者,其中 121 个是卵巢癌患者,95 个是非癌症患者。
Y 中的每行表示 MZ 中指示的特定质量-电荷值下的离子强度水平。MZ 中有 15000 个质量-电荷值,Y 中的每行代表在特定质量-电荷值下患者的离子强度水平。
grp 保存关于哪些样本表示癌症患者以及哪些样本表示非癌症患者的索引信息。

3、关键特征排名

说明

特征的数量远大于观测值的数量,但是单个特征即可实现正确分类。因此,目标是找到一个分类器,该分类器应适当学习如何加权多个特征,同时生成不会过拟合的广义映射。
找到重要特征的简单方法:假设每个 M/Z 值都是独立的,并计算双向 t 检验。rankfeatures 返回最重要的 M/Z 值的索引,例如,按检验统计量绝对值排名的 100 个索引。
x 中的每一列表示 216 个不同患者中的一个。
x 中的每行表示每个患者在 100 个特定质量-电荷值之一下的离子强度水平。
变量 t 具有两行,包含 216 个值,其中每个值为 [1;0](表示癌症患者)或 [0;1](表示非癌症患者)。


代码

[x,t] = ovarian_dataset;
whos x t%显示数据信息

4、使用前馈神经网络进行分类

1)说明

已确定一些重要特征,可以使用这些信息对癌症样本和正常样本进行分类

设置随机种子以便每次都重现相同的结果

代码

setdemorandstream(672880951)

2)创建单隐藏层前馈神经网络

说明:创建并训练具有 5 个隐藏层神经元的单隐藏层前馈神经网络。

输入样本和目标样本自动分为训练集、验证集和测试集。

训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。

测试集提供独立的网络准确度测量。
输入和输出的大小为 0,因为网络尚未配置成与输入数据和目标数据相匹配。在训练网络时会进行此配置。

代码

net = patternnet(5);
view(net)

视图效果

3) 开始训练

说明:样本自动分为训练集、验证集和测试集。训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。测试集提供独立的网络准确度测量。

代码

[net,tr] = train(net,x,t);

4)均方误差图

说明:性能以均方误差衡量,并以对数刻度显示。随着网络训练的加深,均方误差迅速降低。

代码

plotperform(tr)

视图效果

5) 测试训练的神经网络

说明:从主数据集划分出来的测试样本测试经过训练的神经网络。
在训练中没有以任何方式使用过测试数据,因此测试数据是可用来测试网络的“样本外”数据集。这样可以估计出当使用真实数据进行测试时,网络的表现如何。
网络输出的范围为 0-1。对输出应用阈值以获得 1 和 0,分别表示癌症患者和非癌症患者。

 代码

testX = x(:,tr.testInd);
testT = t(:,tr.testInd);
testY = net(testX);
testClasses = testY > 0.5

 6)混淆矩阵图

说明

混淆矩阵图:衡量神经网络数据拟合程度
该混淆矩阵显示了正确和错误分类的百分比。正确分类表示为矩阵对角线上的绿色方块。红色方块表示错误分类。
如果网络是准确的,则红色方块中的百分比应该很小,表示几乎没有错误分类。
如果网络不准确,则可以尝试训练更长时间,或者训练具有更多隐藏神经元的网络。
正确和错误分类的总体百分比

代码

[c,cm] = confusion(testT,testY);
fprintf('Percentage Correct Classification   : %f%%\n', 100*(1-c));
fprintf('Percentage Incorrect Classification : %f%%\n', 100*c);

 7)受试者工作特征图

说明

受试者工作特征图:衡量神经网络数据拟合程度
显示随着输出阈值从 0 变为 1,假正率和真正率之间的相关性。
线条越偏向左上方,达到高的真正率所需接受的假正数越少。最佳分类器是线条从左下角到左上角再到右上角,或接近于该模式。
第 1 类表示癌症患者,第 2 类表示非癌症患者。

代码

plotroc(testT,testY)
legend('种类1','种类2')

视图效果

 

5、总结

基于深度学习的癌症检测在 MATLAB 中的实现通常涉及以下几个关键步骤:

  1. 数据预处理:首先,收集和准备医学影像数据集,包括癌症病变的影像数据和对应的标签(是否患有癌症)。然后对数据进行预处理,包括图像的调整、裁剪、缩放、标准化等,以确保数据质量和一致性。

  2. 构建深度学习模型:使用 MATLAB 中深度学习工具箱中的函数和工具来构建深度学习模型,如卷积神经网络(CNN)、循环神经网络(RNN)等。在模型的构建过程中,需要定义网络的架构、层的数量和类型,以及激活函数等参数。

  3. 数据划分和训练:将数据集划分为训练集、验证集和测试集。然后,使用训练集数据对深度学习模型进行训练,通过反向传播算法来不断调整模型参数,提高模型的准确性和泛化能力。

  4. 模型评估和优化:在训练过程中,通过验证集来评估模型的性能,根据评估结果进行模型的优化和调整,以提高模型在未见过数据上的泛化能力。

  5. 测试和应用:最终,在训练好的深度学习模型上使用测试集来评估模型的性能和准确性。通过模型对新的医学影像数据进行预测和诊断,实现癌症病变的检测。

通过以上步骤,基于深度学习的癌症检测在 MATLAB 中可以很好地实现,并且 MATLAB 提供了丰富的深度学习工具和函数,方便用户搭建和训练深度学习模型,应用于医学影像数据的分析和诊断。

6、源代码

代码

%% 基于深度学习的癌症检测
%说明:训练一个神经网络来使用蛋白质表达谱上的质谱数据检测癌症。
%数据来源:来自 FDA-NCI 临床蛋白质组学计划数据库的ovarian_dataset.mat文件
%数据预处理:新文件包含变量 Y、MZ 和 grp。
%Y 中的每列表示从一名患者身上获取的测量值。Y 中有 216 列,表示有 216 个患者,其中 121 个是卵巢癌患者,95 个是非癌症患者。
%Y 中的每行表示 MZ 中指示的特定质量-电荷值下的离子强度水平。MZ 中有 15000 个质量-电荷值,Y 中的每行代表在特定质量-电荷值下患者的离子强度水平。
% grp 保存关于哪些样本表示癌症患者以及哪些样本表示非癌症患者的索引信息。
%% 关键特征排名
%说明:特征的数量远大于观测值的数量,但是单个特征即可实现正确分类。因此,目标是找到一个分类器,该分类器应适当学习如何加权多个特征,同时生成不会过拟合的广义映射。
%找到重要特征的简单方法:假设每个 M/Z 值都是独立的,并计算双向 t 检验。rankfeatures 返回最重要的 M/Z 值的索引,例如,按检验统计量绝对值排名的 100 个索引。
%x 中的每一列表示 216 个不同患者中的一个。
%x 中的每行表示每个患者在 100 个特定质量-电荷值之一下的离子强度水平。
%变量 t 具有两行,包含 216 个值,其中每个值为 [1;0](表示癌症患者)或 [0;1](表示非癌症患者)。
[x,t] = ovarian_dataset;
whos x t%显示数据信息
%% 使用前馈神经网络进行分类
%说明:已确定一些重要特征,可以使用这些信息对癌症样本和正常样本进行分类。
%设置随机种子以便每次都重现相同的结果
setdemorandstream(672880951)
%创建并训练具有 5 个隐藏层神经元的单隐藏层前馈神经网络。输入样本和目标样本自动分为训练集、验证集和测试集。训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。测试集提供独立的网络准确度测量。
%输入和输出的大小为 0,因为网络尚未配置成与输入数据和目标数据相匹配。在训练网络时会进行此配置。
net = patternnet(5);
view(net)
%开始训练
%样本自动分为训练集、验证集和测试集。训练集用于对网络进行训练。只要网络针对验证集持续改进,训练就会继续。测试集提供独立的网络准确度测量。
[net,tr] = train(net,x,t);
%性能以均方误差衡量,并以对数刻度显示。随着网络训练的加深,均方误差迅速降低。
%绘图会显示训练集、验证集和测试集的性能。
plotperform(tr)
%从主数据集划分出来的测试样本测试经过训练的神经网络。
%在训练中没有以任何方式使用过测试数据,因此测试数据是可用来测试网络的“样本外”数据集。这样可以估计出当使用真实数据进行测试时,网络的表现如何。
%网络输出的范围为 0-1。对输出应用阈值以获得 1 和 0,分别表示癌症患者和非癌症患者。
testX = x(:,tr.testInd);
testT = t(:,tr.testInd);
testY = net(testX);
testClasses = testY > 0.5
%混淆矩阵图:衡量神经网络数据拟合程度
%该混淆矩阵显示了正确和错误分类的百分比。正确分类表示为矩阵对角线上的绿色方块。红色方块表示错误分类。
%如果网络是准确的,则红色方块中的百分比应该很小,表示几乎没有错误分类。
%如果网络不准确,则可以尝试训练更长时间,或者训练具有更多隐藏神经元的网络。
%正确和错误分类的总体百分比
[c,cm] = confusion(testT,testY);
fprintf('Percentage Correct Classification   : %f%%\n', 100*(1-c));
fprintf('Percentage Incorrect Classification : %f%%\n', 100*c);
%受试者工作特征图:衡量神经网络数据拟合程度
%显示随着输出阈值从 0 变为 1,假正率和真正率之间的相关性。
%线条越偏向左上方,达到高的真正率所需接受的假正数越少。最佳分类器是线条从左下角到左上角再到右上角,或接近于该模式。
%第 1 类表示癌症患者,第 2 类表示非癌症患者。
plotroc(testT,testY)
legend('种类1','种类2')

这篇关于44、基于深度学习的癌症检测(matlab)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080989

相关文章

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

深度解析Spring Security 中的 SecurityFilterChain核心功能

《深度解析SpringSecurity中的SecurityFilterChain核心功能》SecurityFilterChain通过组件化配置、类型安全路径匹配、多链协同三大特性,重构了Spri... 目录Spring Security 中的SecurityFilterChain深度解析一、Security