Accuracy improvement for classifying retinal OCT images by diseases using deep learning-based selective denoising approach
基于深度学习的选择性去噪方法提高视网膜OCT图像疾病分类准确率
Lantian Hu, Ruixiang Guo, Sifan Li, Jing Cao, and Qian Liu
研究背景
光学相干层析成像(Opticalcoherencetomography, OCT)技术由于具有高分率、实时成像和非侵入等优点,被广泛应用于心血管科和在眼科。尤其在眼科应用中,结构清晰的眼底OCT图像为疾病的诊断提供了科学依据。近年来,随着人工智能的兴起,基于深度学习的眼底OCT图像按疾病分类成为了研究热点。然而,原始的OCT图像往往包含噪点,图像质量不佳,这大大影响了深度学习模型在疾病识别和分类方面的准确性。
内容简介
针对上述问题,本文提出了一种基于深度学习的图像预处理和去噪方法,通过去除原始OCT图像中的噪声,来提高训练模型对人眼眼底OCT图像分类准确率的方法同时尽可能缩短图像处理的时间。通过对比使用原始数据集和处理后数据集训练的模型,本研究提出的方法在总体准确率(Overall accuracy)、宏观和微观F1-score上均有显著提升并且为高效处理大规模图像数据提供了一种新思路。
图文导读
1.实验方法
图1:方法流程图。Step1:训练并使用深度学习模型将原始眼底OCT图像分为NRR(Noise reduction required)图像和NF(Noise free)图像。Step2:去除NRR图像中的噪声,改善图像质量。Step3:使用处理后的数据集训练模型将眼底OCT图像按疾病分类。
本研究基于4个性能优异的预训练卷积神经网络(DenseNet161, InceptionResNetV2, SE-ResNet152, and VGG19_BN)作为实验模型;在实验数据方面,收集并整理了114,214幅人眼眼底OCT图像,包括:25,380幅AMD(Age-related macular degeneration)图像,37,944幅CNV(Choroidal neovascularization)图像,13,149幅DME(Diabetic macular edema)图像,9,316幅Drusen图像和28,425幅正常图像。
2.NRR/NF图像分类
图 2 :NRR 图像和N F 图像分类效果示意图。
图2展示的是使用训练好的深度学习模型对原始眼底OCT图像进行分类的结果。通过结果可以看出,其中包含大量噪点、眼底结构模糊,严重影响模型训练效果的图像全部被划入NRR图像;而NF图像则不含有噪声,眼底结构清晰,可以直接用于训练。
图3:NRR 图像和N F 图像的噪声量级。
如图3所示,NRR图像和NF图像在噪声量级上也有显著差异。NRR图像的噪声量级远远高于NF图像,通常都超过1.0阈值;而NF图像的噪声量级均低于1.0。从定量分析方面,这一结果证明了模型对原始OCT图像分类的准确性。
3.眼底OCT图像按疾病分类
图4:使用原始数据集和处理后数据集训练的DenseNet161模型的混淆矩阵。
从图4中可以看出,使用原始数据集训练的模型,在分类常规图像时会引入错误;而使用处理后数据集训练的模型,对这一子类图像分类的准确率达到了100%。同时,与使用原始数据集训练的模型相比,使用处理后数据集训练的模型在该类上的准确率提高了5.35%,总体准确率也提高了1.98%,达到了98.14%。
图5 :使用原始数据集和处理后数据集训练模型的R OC ( receiver operating characteristic )曲线和 AUC ( area under the ROC curve )值。
如图5所示,使用处理后数据集训练的模型,在性能上均有显著提升。在总体准确率、宏观和微观F1-score上平均提升了2.04%、5.19%和5.10%。此外,本研究提出的方法还节省了81.12%的处理时间。
通讯作者简介
曹靖,海南大学生物医学工程学院副教授,博士生导师。长期从事生物医学光学成像技术研究及应用,包括光学相干层析成像、共聚焦显微内窥成像等。以第一作者/通讯作者身份,在Light: Sciences & Applications,Photonicsresearch,APL Photonics等期刊发表SCI论文7篇。获得海南自贸港D类人才称号,主持国家自然科学基金青年项目1项,海南省重点研发项目1项。