6.26.3 基于Transformer的深度神经网络在数字乳腺断层合成图像上的乳腺癌分类

        开发一种有效的深度神经网络模型,该模型结合了相邻图像部分的上下文,以检测数字乳腺断层合成(DBT)图像上的乳腺癌。

        数字乳房断层合成(DBT)是一种医学成像技术,其中检测器围绕患者以有限角度旋转并记录多幅图像。然后将这些图像重建为二维(2D)切片堆栈,从而改进病变检测、表征和定位。许多研究表明,与2D数字乳房x线摄影相比,DBT在筛查和诊断成像结果方面都有改善(1,2)。虽然DBT正在成为乳腺癌检测的标准,但其解释时间仍然是一个问题(3)。

        使用神经网络进行DBT的一个关键挑战是三维(3D)数据量;每次扫描都有很高的空间分辨率和几个部分,这意味着一个病例在未压缩的情况下可以很容易地得到几GB的数据。此外,3D cnn(5)由于其庞大的计算成本而难以应用。因此,大多数DBT的计算机辅助检测方法一次只评估单个部分(6,7),或者根据每个部分的推理结果将整个DBT堆栈合成为图像并评估该图像(8-10)。这些方法的缺点是区段之间的关系没有得到最佳利用。 

        在研究中,提出了一种考虑相邻切片的方法来检测DBT图像上的乳腺癌。方法依赖于一个配备了分割时空注意力的变压器来学习相邻部分之间的关系(17)。该方法在多个机构收集的数据集上进行了训练和评估。将提出的模型的分类性能与一次只分析单个DBT部分的基线模型和3D卷积基线模型的分类性能进行了比较。        

材料和方法

数据

        内部DBT数据集包括6829个(1699个癌症,3418个良性,1712个正常)四视图Hologic DBT研究,这些研究是通过外部实体从美国9个机构回顾性收集的。活检证实为癌,活检或随访影像至少1年证实为良性,随访影像至少1年证实为正常。

        数据集分为训练集、验证集和测试集。来自一家机构的655份研究(163份为癌症,328份为良性,164份为正常)被用作测试集。其余的随机分为训练集和验证集,分别由5174个(1286个癌症,2590个良性,1298个正常)研究和1000个(250个癌症,500个良性,250个正常)研究组成。测试集未用于训练或调优。

        对于每个DBT研究,放射科医生被要求在显示病变最大横截面积的部分画出病变的轮廓。这被认为比绘制所有剖面的轮廓更具成本效益,并且仍然可以捕获病变的最重要部分。除了轮廓外,注释者还被要求将病变的亚型分类为钙化、软组织病变(包括结构扭曲、肿块和不对称)或两者兼而有之。

模型开发

        DBT扫描是由从多个角度拍摄的2D x光片重建的2D切片堆叠而成(1)。方法输入重建切片的DBT堆叠,并为每个切片生成预测。该模型输出其包含恶性病变的分段可能性和包含每个分段中每个像素的预测的热图。像素的值表示该像素属于恶性病变的可能性。

        在DBT数据上训练深度神经网络是具有挑战性的,主要是因为它的高内存和计算需求。与2D乳房x线照相术类似,DBT切片以高分辨率(通常为50-80 μm)记录,以捕获钙化等细节。此外,每个视图的切片数量各不相同(每个视图有50到100张图像),这意味着假设固定大小输入的典型模型不容易采用。

        为了在提供给模型的信息和计算成本之间进行权衡,没有将整个DBT堆栈提供给模型,而是一次只提供部分的子集。对相邻部分进行采样,因为可疑病变通常只在堆栈的连续部分可见。通过这种方式,可以更容易地处理大量不同数量的部分。在测试期间,方法对整个DBT堆栈进行预测。模型由三个网络组成:骨干网、交互网络和聚合网络(图1)。骨干网独立地从每个输入部分提取特征图。交互网络随后通过与相邻的部分特征交互产生每个部分的上下文感知表示。最后,聚合网络对邻居特征进行约简,生成最终的预测分数、包含恶性病变的可能性以及恶性病变的热图。下面将详细解释每种网络。        

骨干网络

        骨干网以单个区段作为输入,输出一个特征表示。骨干网有多种架构选择,从2D CNN到3D CNN或长短期记忆。虽然我们的方法旨在捕获相邻部分之间的关系,但我们选择使用二维主干来适应二维乳房x线照片的预训练。

交互网络

        交互网络的目的是捕获相邻部分的上下文,并对骨干网络提取的空间特征进行处理。实验了两种架构:TimeSformer(17)和3D卷积基线(Conv3D)。对于后者,我们堆叠了四个由3D卷积和批归一化和激活层组成的3D残差块(5,18)。

         TimeSformer(17)是最近推出的一种用于高效视频分类的变压器架构。它将输入分解为补丁,即我们数据集扫描中的每个部分,这些补丁随后用作Transformer的输入令牌。然后对令牌进行分割时空注意,分别处理时间注意和空间注意(图2)。通过这种方式,可以有效地处理3D体积,而不会牺牲表现能力。当部署到DBT扫描时,剖面轴表示时间维度,高度和宽度表示空间维度。

时序发生器在交互网络中划分时空注意块。对于输入中的一个标记(在左侧块中突出显示),将计算各部分(中间块)上相同空间位置上的标记的时间注意力。随后,计算同一部分(右块)中标记的空间注意力。

聚合网络

        聚合网络结合多个区段的特征,预测每个目标区段的最终区段级分数和热图。使用沿截面方向的最大池化来聚合相邻的特征图。然后使用聚合的特征图来预测中心部分和像素级热图的分数。 

子组分析

        将测试集分成子组,并分析3D模型在这些特定组上的表现。首先,为了确定在阅读具有挑战性或模棱两可的检查时考虑邻近切片的影响,提取了一个由活检证实的癌症和良性研究组成的子集。活检证实的良性研究被召回并进行活检,因此可以认为是硬阴性结果,因为放射科医生不能单独使用图像对病变进行分类。

        首先,数据集根据其放射学发现(即软组织病变、钙化或两者兼而有之)分为三个子集,以确定哪一组模型最有效。其次,根据估计的病灶大小对集合进行分割,病灶大小是基于标注多边形的像素数和医学标题中数字成像和通信的像素间距。数据被分成两个范围:直径小于或等于2厘米和直径大于2厘米。

统计分析

        通过三个指标来比较这些方法:(a)受试者工作特征曲线下的面积(AUC), (b)固定特异度下的灵敏度,(c)固定特异度下的特异性。为了比较灵敏度,选择了一个高特异性为0.8的操作点,这与作为检测辅助操作的系统相关,其中人们更喜欢少量的假阳性结果。为了进行特异性比较,我们选择了一个具有0.8高灵敏度的操作点,这是相关的,例如,在分类应用中,该模型将作为预滤波器工作。

        使用DeLong检验(19)生成置信限,并比较不同算法的auc。为了产生置信限并在特定的操作点比较模型,使用了渐近正态近似(20)和McNemar检验。我们还通过计算每秒千兆浮点操作(FLOPS)的数量和测量墙时间中的相对模型延迟来比较不同架构的计算成本。

结果

计算效率

与Conv3D相比,基于TimeSformer架构的方法所需的计算量大大减少。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/770745.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

盛元广通打造智慧校园实验室安全管理系统

盛元广通智慧校园实验室安全管理系统以安全为重点,构建由学校、二级单位、实验室组成的三级联动的实验室安全多级管理体系、多类用户角色,内置教育部标准检查表,支撑实验室相关业务过程的智慧管理。实现通过PC端/手机移动端开展检查工作、手机…

一个opencv实现检测程序

引言 图像处理是计算机视觉中的一个重要领域,它在许多应用中扮演着关键角色,如自动驾驶、医疗图像分析和人脸识别等。边缘检测是图像处理中的基本任务之一,它用于识别图像中的显著边界。本文将通过一个基于 Python 和 OpenCV 的示例程序&…

Vue86-Vuex中的getters属性

一、getters的使用 1-1、index.js中getters的书写 计算属性computed靠return获得返回值! 1-2、组件中getters的调用 state是数据源,getters是拿着数据源里的东西进行一番加工。像极了:data和computed 二、小结

Map Set(Java篇详解)

🍁 个人主页:爱编程的Tom💫 本篇博文收录专栏:Java专栏👉 目前其它专栏:c系列小游戏 c语言系列--万物的开始_ 等 🎉 欢迎 👍点赞✍评论⭐收藏💖三连支持…

设备的智能决策AI大模型与ESP32-S3芯片应用,启明云端乐鑫代理商

在数字化浪潮的推动下,智能家居、智能安防、智能设备等领域对AI技术的需求日益增长,人工智能(AI)正迅速成为推动各行各业创新的核心力量。 AI大模型技术以其强大的数据处理能力和深度学习能力,正在成为智能时代的新动…

图书电商引入实在Agent:自动化运营提效80%,节省人天1000+

某知名教辅图书品牌深耕中小学教辅图书领域,是中国最具影响力的教育出版策划与发行集团之一,以丰富的图书品类,满足了小学、初中、高中各年龄段读者多元化的阅读需求。 2023年,该品牌在运营、客服等多部门超60个场景中部署实在Ag…

维护el-table列,循环生成el-table

1、lib/setting.js(维护table列) const columns[{ label: 类型, prop: energyName, width: 150, isText: true },{ label: 消耗量(t或10⁴m), prop: inputNum, isInput: true },{label: CO₂,children: [// { label: 核算因子, prop: co2FactorValue, w…

IC烧录员-带着工程师的梦想远航!

如果说软件工程师是代码程序的创造者,那么IC烧录员就是把工程师们辛苦敲代码,日夜辛劳的成果烧录到芯片里面的实践者,是他们,让工程师们的梦想运用到实践中,是他们带着工程师的梦想远航,他们的薪酬或许没有…

SprongBoot3整合Knife4j实现在线接口文档

大家好,我是晓凡。 写在前面 在上一篇文章,我们详细介绍了SpringBoot3 怎么整合SpringDoc实现在线接口文档。但是,有不少小伙伴 都觉得接口界面太丑了。有没有什么更美观一点的UI界面呢? 当然是有的了,毕竟这是一个…

temu a4接口 逆向

声明(lianxi a15018601872) 本文章中所有内容仅供学习交流使用,不用于其他任何目的,抓包内容、敏感网址、数据接口等均已做脱敏处理,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关! 前言(lianxi …

c++习题09-分离整数的各个数

目录 一,题目 二,思路 三,代码 一,题目 二,思路 一开始我想到的是将简单容易输出的1000以内的数先进行相应的运算,再输出之后再对1000以上的数字进行判断(主要还是想先将很大的数变小&#x…

每日一题——Python实现PAT乙级1026 程序运行时间(举一反三+思想解读+逐步优化)五千字好文

一个认为一切根源都是“自己不够强”的INTJ 个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数 Python-3.12.0文档解读 目录 我的写法 代码结构和逻辑 时间复杂度 空间复杂度 代码优化建议 总结 我要更强 …

生物分子生物学实验过程的自动化与智能监控系统设计

开题报告:生物分子生物学实验过程的自动化与智能监控系统设计 一、引言 随着生物科学技术的飞速发展,生物分子生物学实验在科研、医疗、农业等领域的应用日益广泛。然而,传统的生物分子生物学实验过程大多依赖于人工操作,存在操…

组件丰富、支持2/3D数据可视化的编辑器平台软件?

数据可视化编辑器通常用于创建交互式的图表和模型,可以帮助用户以更直观的方式展示数据。一些在线平台软件提供了丰富的组件,支持2D和3D数据可视化: 1、Plotly - 提供了多种语言的库,支持在线创建交互式图表,包括2D和…

【2023ICPC网络赛I 】E. Magical Pair

当时在做洛谷U389682 最大公约数合并的时候我就想到把每个质因子分解出来然后跑高维前缀和,但是那一道题不是用这个方法,所有我也一直在思考这种做法是不是真的有用。因为昨天通过2024上海大学生程序设计竞赛I-六元组计数这道题我了解到了不少关于原根的…

平安养老险安徽分公司:助力乡村振兴 保险知识进农村

为深入宣传普及保险理念,进一步提升服务品质,营造“78全国保险公众宣传日”活动氛围,助力保险业健康稳定发展,近日,平安养老保险股份有限公司(以下简称“平安养老险”)安徽分公司走进安庆市宿松…

智能座舱相关问答

一、基本概念与理解 智能座舱的定义 回答:智能座舱是指在现代交通工具中,通过应用智能技术,实现对乘客座舱环境和服务进行智能化管理和优化的系统。它不仅提供更加舒适的乘坐体验,还能通过精确的数据分析和实时监控,提…

教育行业的网络安全:保护学生数据与防范网络欺凌

在数字化的春风中,教育行业迎来了知识的繁花似锦,然而,随之而来的网络安全风暴也悄然逼近。学生数据的脆弱性与网络欺凌的阴影交织成一幅复杂的画卷,呼唤着教育工作者与技术专家共同编织一张密不透风的网络安全之网。本文深入探讨…

A*——AcWing 178. 第K短路

A* 定义 A算法是一种广泛应用于路径搜索和图遍历的启发式搜索算法,它结合了最好优先搜索和Dijkstra算法的优点,旨在找到从初始节点到目标节点的最短路径。A算法在游戏AI、机器人导航、地图路线规划等领域有广泛应用。 A*算法的核心在于使用一个评估函…

React+TS前台项目实战(二十四)-- 全局常用绘制组件Qrcode封装

文章目录 前言Qrcode组件1. 功能分析2. 代码详细注释3. 使用方式4. 效果展示(pc端 / 移动端) 总结 前言 今天要封装的Qrcode 组件,是通过传入的信息,绘制在二维码上,可用于很多场景,如区块链项目中的区块显示交易地址时就可以用到…