前列腺癌检测 AI 算法登上《柳叶刀》:分类性能超过人类专家,还能完成其他临床任务...

本文主要是介绍前列腺癌检测 AI 算法登上《柳叶刀》:分类性能超过人类专家,还能完成其他临床任务...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

来源:AI科技评论

本文约2200字,建议阅读6分钟。

本文为你介绍一种基于人工智能的算法,其用来处理常规临床应用任务,具体而言是辅助前列腺疾病诊断。

近日,《柳叶刀-数字医疗》期刊刊登了一篇“用人工智能算法诊断前列腺癌”的论文,论文中,作者除了报告了一项盲法临床验证研究,还部署了一种基于人工智能的算法用来处理常规临床应用任务,具体而言是辅助前列腺疾病诊断。

在算法性能测试中,该 AI 算法用内部数据得到的AUC是0.997,在UPMC外部验证数据集上,其AUC是0.991。换句话说,性能指标超过了一般的AI算法。

论文地址:

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30159-X/fulltext

这篇论文的作者是来自UPMC和匹兹堡大学的研究员,他们提出的算法的核心技术是多层卷积神经网络,专门为图像分类任务而设计。整个算法工作的流程有三个连续的步骤:组织检测、分类和病理图片级别分析。 

算法和临床应用一览

具体而言,先使用数千个图块对梯度提升(Gradient Boosting)分类器进行训练,目的是为了区分图片中的组织区域和背景区域;然后用分离出的组织区域训练三个基于CNN的模型。

这些模型接受了1,357,480张贴有标签图块的训练,这些图块是从549张图片的“手工标注”中提取出来的,而这549张图片则是根据不同的标准,从65,000张图片中挑出来的。

值得一提的是,“手工标注”由三位资深病理学家完成,每位都从业20~40年。

模型训练好之后,作者又用了1,600张图片进行了测试,这1,600张图片取自100名在 UPMC 就诊的疑似前列腺癌患者。

测试结果是:AI在前列腺癌症检测方面表现出了98%的敏感性和97%的特异性,此外,不仅是癌症检测,在完成例如肿瘤分级等其他临床上重要的特征任务方面,也有比较高的性能。更值得注意的是,AI还“看”出了6张人类专家没检测出的前列腺癌图片。

同时,作者也提出,这并不一定意味着这台机器比人类更优秀。但对于经验较少的病理学家来说,该算法可以作为一个故障保险机制,帮助他们“漏检”错过的病例。

毕竟在评估这些病例的过程中,病理学家可能只是在病人的样本中看到了其他地方恶性肿瘤的足够证据,从而推荐治疗。不过,对于经验较少的病理学家来说,该算法可以作为一个故障保险机制,发现否则可能会错过的病例。

作者在论文中还表示,在训练人工智能算法和模型的时候,过拟合是一个非常常见的问题,尽管在训练数据中进行测试时表现良好。但在训练集之外的数据上进行测试时,性能会出现下降。虽然有多种策略可以避免过度拟合(例如,交叉验证),但真正的性能只能通过外部数据集的盲法研究来确定。

在这里,作者创新性地使用了外部的、不同地理、盲试验数据集( blinded dataset)来测试算法的性能和实用性。在论文中,作者称:“据我们所知,很少有医学研究尝试过这样的验证,尤其是对于应用范围较窄,性能明显较低的算法。”

网友评论:褒贬不一

此项研究的新闻也被网友贴在了Reddit的人工智能版块,引起了一波小讨论,有的网友持赞成态度,肯定了AI在癌症和心脏病发病几率预测方面的工作;也有的网友,对作者使用的算法产生了好奇,也提出了精度和召回率的疑问。


例如,上面这位网友:AI对于医疗行业来说不可或缺,特别是在预测癌症和心脏病发病几率方面。

这应该是属于专用的算法,没有数据和代码共享,这让复现成为了一个问题......我们应该如何解决这个问题。

还有网友说:“虽然有非常好的结果,但在精确度方面并不比专家高出多少。”在这条帖子下面,也有网友“交流”到:“普通患者不太可能从专家小组那里得到诊断,他们只是从普通的医生那里得到诊断。而人工智能可以让每个人都能得到“专家”诊断。”

AI会取代影像科医生么?

在今年一月份,关于前列腺癌AI辅助诊断研究就曾经发表在《柳叶刀肿瘤》杂志,当时作者在论文中得出的结论是:用AI系统来检测和分级前列腺穿刺活检样品中的癌症,在部分场景中其等级可与前列腺病理学专家相媲美。

另外,在1月2日,Google Health联合多个机构在《Nature》杂志上发表了一篇论文,介绍了一种新型的深度学习钼靶影像系统。根据Google的说法,这个系统与之前的模型相比,该模型有效减少了乳腺癌被错误识别或遗漏的情况,将乳腺癌检测的假阳性率降低了5.7%,假阴性率也降低了9.4%,并号称击败了6名受过“”全日制教育”的放射科医生。

当然,Google对该成果过于夸大的公关措辞,随之也引来了图灵奖得主Yann Lecun以及中美多位知名学者在社交媒体上的炮轰。

可以看到,当前的一些AI医学研究动不动就是“超越专家”、“打败人类”,尤其是在影像科这种计算机视觉“容易”攻克的领域,AI即将取代人类的声音最盛。

那么问题来了,AI在医学影像方面取代人类么?换句话说,当前影像学有哪些地方在短期离不开人类。

 

2018年,英国影像学AI大牛Hugh Harvey发布了一篇《Why AI will not replace radiologists》,称:“无论你已经有多么深信甚至痴迷AI和自动化的诸多可能性,要想在不久的将来完全替代人类影像科医生是完全不可能的。”

当时,他给出了三个理由:第一、医学影像科医生不是只会看片子,诊断推导仍然是最难啃的那块骨头,也是人类有最多存在感的地方;第二、人类始终要承担最终责任,几乎不可想象人工智能系统的所有者在人命关天时,会让机器负全部法律责任;第三、生产力进步将驱动需求,最明显的表现是:在影像科,只要你能安排多一个医生来检查患者,就总会有患者来补上这个空位。

这也正如《柳叶刀-数字医疗》那篇论文而言,AI算法或许很优秀,或许在很多方面准确度、精度比人类高,但是人类终究是不可或缺的。

https://scitechdaily.com/artificial-intelligence-identifies-prostate-cancer-with-near-perfect-accuracy/

https://zhuanlan.zhihu.com/p/33424522

https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30159-X/fulltext

编辑:王菁

校对:林亦霖

这篇关于前列腺癌检测 AI 算法登上《柳叶刀》:分类性能超过人类专家,还能完成其他临床任务...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901345

相关文章

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

SpringBoot集成XXL-JOB实现任务管理全流程

《SpringBoot集成XXL-JOB实现任务管理全流程》XXL-JOB是一款轻量级分布式任务调度平台,功能丰富、界面简洁、易于扩展,本文介绍如何通过SpringBoot项目,使用RestTempl... 目录一、前言二、项目结构简述三、Maven 依赖四、Controller 代码详解五、Service

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

深度剖析SpringBoot日志性能提升的原因与解决

《深度剖析SpringBoot日志性能提升的原因与解决》日志记录本该是辅助工具,却为何成了性能瓶颈,SpringBoot如何用代码彻底破解日志导致的高延迟问题,感兴趣的小伙伴可以跟随小编一起学习一下... 目录前言第一章:日志性能陷阱的底层原理1.1 日志级别的“双刃剑”效应1.2 同步日志的“吞吐量杀手”

Linux系统管理与进程任务管理方式

《Linux系统管理与进程任务管理方式》本文系统讲解Linux管理核心技能,涵盖引导流程、服务控制(Systemd与GRUB2)、进程管理(前台/后台运行、工具使用)、计划任务(at/cron)及常用... 目录引言一、linux系统引导过程与服务控制1.1 系统引导的五个关键阶段1.2 GRUB2的进化优

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦

Python Flask实现定时任务的不同方法详解

《PythonFlask实现定时任务的不同方法详解》在Flask中实现定时任务,最常用的方法是使用APScheduler库,本文将提供一个完整的解决方案,有需要的小伙伴可以跟随小编一起学习一下... 目录完js整实现方案代码解释1. 依赖安装2. 核心组件3. 任务类型4. 任务管理5. 持久化存储生产环境

Java慢查询排查与性能调优完整实战指南

《Java慢查询排查与性能调优完整实战指南》Java调优是一个广泛的话题,它涵盖了代码优化、内存管理、并发处理等多个方面,:本文主要介绍Java慢查询排查与性能调优的相关资料,文中通过代码介绍的非... 目录1. 事故全景:从告警到定位1.1 事故时间线1.2 关键指标异常1.3 排查工具链2. 深度剖析:

深入解析Java NIO在高并发场景下的性能优化实践指南

《深入解析JavaNIO在高并发场景下的性能优化实践指南》随着互联网业务不断演进,对高并发、低延时网络服务的需求日益增长,本文将深入解析JavaNIO在高并发场景下的性能优化方法,希望对大家有所帮助... 目录简介一、技术背景与应用场景二、核心原理深入分析2.1 Selector多路复用2.2 Buffer

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指