上海代写皇冠比分平台8网专业提供代写毕业皇冠比分平台8、代写本科皇冠比分平台8服务
基于人工智能的眼底图像自主识别系统探析
发布时间:2019-12-12

  摘    要: 眼底在眼科医学中是重要的研究对象,眼科医生往往通过眼底图像来诊断人眼疾病。为提高眼科医生的眼疾诊断率,研究利用图像处理和人工智能技术对眼底图像进行智能识别的可行性。首先对眼底图像数据运用OpenCV、MATLAB包含的多种图像技术进行有效处理,然后利用TensorFlow建立不同结构不同参数的卷积神经网络,对处理后的眼底图像进行特征提取与训练学习;通过改变层级和加入中心损失函数来提升识别率以优化网络,将眼底图像输入网络即可实现眼底疾病的快速分类同时显示相应的识别概率。本文选取包括糖尿病、青光眼等八类500张250×166像素眼底图片进行分类训练及测试实验。结果表明,网络模型在迭代次数为20000次时,识别率达到44.81%。该方法实现了对眼底图像的识别,可帮助眼科医生辅助判断眼疾。

  关键词: 人工智能; 图像处理; 卷积神经网络; 图像识别;

  Abstract: In order to improve the Ophthalmologist diagnosis rate, the study aims to explore the feasibility of using image processing and artificial intelligence technology to recognize eye fundus images. First, the fundus image data are processed effectively using various image technologies included in OpenCV and MATLAB. Then TensorFlow is used to construct convolutional neural networks with different structures and parameters to extract features and train the processed fundus images. The recognition rate is improved by changing the hierarchy and adding the central loss function to optimize the network. By inputting the fundus image into the network, the image classification can be realized rapidly and the corresponding recognition probability can be displayed at the same time. 500 250×166 pixel fundus images including diabetes mellitus and glaucoma are selected for classification training and testing. The results show that the neural network recognition rate reaches 44.81% when the iterations number is 20,000. This method realizes the fundus image recognition, and it can help ophthalmologists to assist in judging eye diseases.

  Keyword: artificial intelligence; image processing; convolutional neural networks; image recognition;

  1、 引言

  在眼睛疾病检查中,眼底筛查是一种常见的经济有效的方法。对于不同的眼病,眼底图像所展示的形态和特征也各不相同,并且会随着患者身处的环境及条件的不同产生相应的变化,同时在不同的人群、不同的年龄群体中均会存在差异,因此眼科医生常通过对眼底图像的观察及自身经验判断眼科疾病[1]。

  数字图像处理技术的飞速发展在医疗影像领域产生了积极的作用,现代的眼科医生已经抛去了过去传统的人眼观察模式转而利用当代的计算机技术进行更好的判断。但是随着眼疾患者的日益增多,眼科医生的压力也与日俱增,长时间依赖图像处理技术也难免造成身心劳累,并且早期发现眼部疾病存在较大困难,因为在眼部疾病的早期阶段,眼科医生通常很少能见到相应症状[2]。
 

基于人工智能的眼底图像自主识别系统探析
 

  人工智能的兴起几乎渗透到各个领域,在医学中也是如此,AI医疗目前已经成为人工智能领域最热门的领域之一[3]。国外已经有很多将人工智能技术应用于医学领域的先例[4,5],而有着非常广泛应用领域的图像识别技术作为人工智能一个重要分支在医学图像领域一直发挥了重要作用,在国内[6]和国外已经被实际运用[7]。

  所以,在数字图像处理技术和大数据技术的基础上,结合人工智能技术,医生可以利用AI 建立起的模型更进一步提升疾病类型的诊断精度,从而大幅度提高诊断效率,降低诊断压力[8]。

  查阅资料发现,在眼科领域,将眼底图像作为识别对象的先例目前较少。海军军医大学团队采用基于超过18万张来自EyePACS 的眼底彩照构建了辅助诊断糖尿病视网膜病变的人工智能深度学习算法模型。在实验室条件下,该模型灵敏度和特异度分别为 95.3% 和 79.5%[9];最近,南通大学医学院团队开发出远程智慧眼底筛查云平台项目,利用人工智能查找眼底视网膜血管的微小变化,为病程研究评判及治疗提供参考[10]。

  而在实际的眼科疾病中,除了因糖尿病造成的眼疾以外,也会存在因青光眼、白内障、年龄相关性黄斑变性和许多其他原因引起的失明,同时由于可能存在部分图像源模糊不清 的状况,也需要预先进行大量的图像预处理。

  综上所述,本文在对在眼底图像处理的基础上,提出了适应人工智能框架的眼底图像自主识别系统,可以在一定程度上同时识别包含糖尿病、青光眼,白内障,高血压等其它原因引起的眼疾,并给出相应概率。

  2、 图像处理

  在实际判断中,部分图像源可能存在图像迷糊不清的状况,同时也为了让计算机更好的识别,因此本文提出的眼底图像识别方法分为两步,第一步为图像处理[11],第二步为图像识别[12]。

  针对眼底图像,本文图像处理算法的语言以Python和MATLAB为主,同时结合图像开源库OpenCV。执行过程为首先从第三方获取图像源,然后经过系统的预处理、图像分割等一系列图像处理流程以后,最终再用于图像识别。处理流程如图1所示,下面对每一步骤做简要说明:

  图 1 眼底图像处理流程
图 1 眼底图像处理流程

  1)图像获取:从第三方的数据库获得临床医学仪器输出的标准眼底图像源,如图 2(a) 所示。

  2)图像增强:由于获取的图片源可能存在质量参差不齐,或多或少存在模糊等情况, 需要对图片源预处理消除噪声。增强通过CLAHE 算法[13],如图 2(b) 所示。

  3)图像去噪:在对源图像增强以后,伴随着图像获取及预处理过程中可能存在的误差,需要去除噪声,本文通过高斯平滑[14]来实现,效果图 2(c)所示。

  4)图像分割:对预处理的细胞图像进行分割,图像分割是很重要的一环,合理的分割是后续处理的重要保证[15],如图 2(d) 所示。

  5)形态学处理:对分割后的细胞进行腐蚀膨胀[16],腐蚀膨胀如图 2(e)所示。

  6)取反:将黑白对换,更为直观地突出细胞形态和边缘,取反后效果如图2(f)所示。

  图2 眼底图像处理
图2 眼底图像处理

  其中,眼底图像处理和图像识别数据集来自北京大学“智慧之眼”国际眼底图像智能识别竞赛(odir2019), 官方提供了 5000 组包含患者的性别、年龄、双眼彩色眼底照片和医生的诊断关键词等的结构化脱敏后眼科的数据集。数据集被分为8 个标签,包括正常(N)、糖尿病(D)、青光眼(G)、白内障(C)、AMD(A)、高血压(H)、近视(M)和其他疾病/异常(O)。因为机能的限制,本文选取了包含 8 个标签在内共 500 个图像数据作为原始数据。

  3、 深度模型的搭建

  3.1、 学习方式及神经网络选择

  在机器学习中,除监督学习和非监督学习两种常见的形式外,还有半监督式学习[17],即数据集中,很少一部分有对应的匹配标签,另外绝大多数数据是未知标签,因此隐藏在半监督学习下的基本规律需要通过已知数据的对应标签进行挖掘,挖掘的过程可以看作机器学习的过程。

  因为官方数据集已经提供了大量的相应标签,将所需的数据集进行分类以后就可先训练,因此本文采用半监督学习。

  卷积神经网络简称CNN,经常用于图像的分类[18],卷积神经网络主要通过自行设定的卷积核从图像中提取特征值,然后根据特征值进行分类,本文神经网络的建立及识别过程如图 3 所示:

  图 3 网络训练流程
图 3 网络训练流程

  首先选取450张250×166像素的眼底源图像和对应标签作为训练集进行训练,第一次遍历图像集,第二次遍历图像集的标签。然后开始建立卷积神经网络,本文设计的卷积层有两层,神经元为1024个,优化算法采用梯度下降算法[19],CNN搭建完成后开始训练。训练结束后得到完整模型,最后将未知标签的眼底图像源载入模型进行识别,图像识别是配合SOFTMAX分类器[20]搭建而成。

  3.2、 模型测试

  然而经过实际测试发现,数据集中的眼底图像是2400×2400,因此若要使神经网络模型正常的训练,需要修改网络结构,否则过大的容量会导致显存不够用导致训练失败。

  改善的方法有两种,第一种可以通过缩 小图片尺寸来实现,第二种通过降低输入模 型的数据量来实现。而一张复杂的图像集所 包含的特征量需要通过足够的像素点支撑, 若是为了满足模型运转而大幅度较少图像 像素,反而失去了分类的本质。

  但是同时也要保证一定的训练数量,因此多次尝试以后,最终设定图像输入为 250×166像素。

  本文采用32个7×7的卷积核,即抽取7×7 像素子区域,把输入的图像源作为4d的向量,采用灰度图作为输入形式,并且设为函数自动计算一维大小,图像源的宽为250、高为166。

  此外,在搭建模型的过程中,还需特别关注神经网络的全连接层的参数,全连接层是根据经过卷积层和池化层的特征进行分类,可以选用 SOFTMAX 模型,最终进行输出。在本文中的全连接层因为输入的图像的尺寸,设定为63×24×64,共1024个神经元。全连接层模拟图如图4 所示。

  图 4 全连接层
图 4 全连接层

  4 、实验结果

  4.1、实验条件

  本文所采用是单独 GPU 为 GTX1080, CPU 为 I78700K,内存为 12 G 的工作站。抽取500张250×166包含8种标签的数据集用作训练集,将额外的50张数据源作为测试集,测试集用于评估模型的性能。考虑时间成本的原因,经500次迭代训练模型得到收敛。

  4.2 、实验结果

  在第三方数据库的帮助下,项目抽取了550 幅眼底图像,并对其加以指导分类,分为 8 组,分别为正常(N)、糖尿病(D)、青光眼(G)、白内障(C)、AMD(A)、高血压(H)、近视(M)和其他疾病/异常(O)。

  训练样本为 500 例,其余 50 例作为测试样本,8 个类别作为输出节点,对训练样本进行网络训练。考虑时间的成本,在进行500 次迭代以后,识别率达到了近 45%。

  完成分类器的训练后,用它对50例测试样本进行预测分类,检测其分类精度,结果如表 1所示。

  从测评结果发现,由近视眼和白内障引起的眼部疾病具有显着的图像特征,差异明显,因此较好分辨,取得了较好的识别效果。但是像 AMD、糖尿病视网膜病变、青光眼及高血压几种症状并没有起到很好地识别效果,存在着很明显的分类干扰。

  误差在于算法并不能很好地提取每个病症的特征点,即使是经过前期的图像处理之后,依旧难以分辨。因此,需要寻找新的特征参量寻找它们显着的特征,比如说在眼底某个特定区域内的形状。另外,本文的图像处理是统一将数据集进行了二值化之后才导入到了训练模型,而色彩其实也可作为一分类特征,所以后续将在这些方面逐步改进。

  5、 结论

  眼底图像识别的方法结合了图像处理和人工智能的技术,对眼底图像先进行了处理分析及特征描述,然后将之输入到卷积神经网络模型里面进行识别并归类。试验的语言以Python为主,图像处理和图像识别分别以OpenCV和TensorFlow 为辅。

  试验结果表明结合梯度下降算法和卷积神经网络,系统可以有效地建立学习模型并给出分类的概率,对眼底图像可以一定程度上进行识别,但是考虑到机能和时间成本的限制,还有很大的改进空间。

  表1 实验结果
表1 实验结果

  下一步的是继续完善和改进识别率,搭建更好的硬件平台同时更好的改进图像处理算法, 同时也将神经网络模型更加深化,最终结合嵌入式和智能物联网技术将对眼底的研究成果转入实际应用。

  参考文献

  [1]王平,陶利娟,杨慧玲,王曦琅,熊师,肖志刚,郭艳,杨俊芳,唐晓容,漆争燕.新生儿眼底变化规律及疾病筛查分析[J].国际眼科杂志,2007(5):1343-1344.
  [2]郭宽.数字图像处理技术在医学领域的应用[J].科技与创新,2016(13):106.
  [3]朱艳春.在医疗影像 AI 中的探索与实践 [J].软件和集成电路,2019(7):44-45.
  [4] Balasooriya, U., Perera, M.U.S. Intelligent brain hemorrhage diagnosis using artificial neural networks[P]. Business Engineering and Industrial Applications Colloquium (BEIAC), 2012 IEEE,2012.
  [5] Dehariya, A., Chaudhary, V.K., Khan, I., Karsoliya, S.. An effective approach for medical diagnosis preceded by artificial neural network ensemble[P]. Electronics Computer Technology (ICECT), 2011 3rd International Conference on,2011.
  [6] 薛迪秀. 基于卷积神经网络的医学图像癌变识别研究[D].中国科学技术大学,2017.
  [7] Blahuta, Jiri, Soukup, Tomas, Cermak, Petr, Rozsypal, Jiri, Vecerek, Michal. Ultrasound medical image recognition with artificial intelligence for Parkinson's disease classification[P]. MIPRO, 2012 Proceedings of the 35thInternational Convention,2012.
  [8]朱振一,王巍.人工智能在医疗领域的发 展现状及前景分析[J].世界最新医学信息文摘,2019,19(50):77-78.
  [9]黄潇,谷硕,马晓晔,梁文君,张韵,高连娣,魏锐利.人工智能糖网眼底图像识别在真实世界的应用[J].情报工程,2018,4(1):24-30.
  [10] 季天宇. 眼底病变须重视,它是疾病“信号源” [N]. 科技日报,2019-07-11(007).眼底人工智能
  [11] 王帅.嵌入式角膜内皮细胞图像分析系统的研究[D].重庆理工大学,2015.
  [12] Horani, M.E.D., Sukker, F., Horo, A.H. Design and implementation of artificial intelligence system for 2-dimensional image recognition[P]. Information and Communication Technologies: From Theory to Applications, 2004. Proceedings. 2004 International Conference on,2004.
  [13]孙冬梅,陆剑锋,张善卿.一种改进 CLAHE 算法在医学试纸条图像增强中的应用[J].中国生物医学工程学报,2016,35(4):502-506.
  [14] 肖孟强. 混合噪声图像滤波算法在医学图像中的应用研究[D].兰州交通大学,2012.
  [15]范群贞,吴浩,林真.医学图像基于阈值的分割技术[J].福建电脑,2019,35(4):32-35.
  [16]安静,张贵仓,刘燕妮.数学形态学在医学眼睛图像处理中的应用研究[J].机械工程与自动化,2016(1):15-17.
  [17]屠恩美,杨杰.半监督学习理论及其研究进展概述[J].上海交通大学学报,2018,52(10):1280-1291.
  [18] 高强.基于深度卷积网络学习算法及其应用研究[D].北京化工大学,2015.
  [19] Chia-Feng Juang,Guo-Cyuan Chen. A high-order fuzzy classifier learned through clustering and gradient descent algorithm for classification problems[P]. Industrial Electronics and Applications (ICIEA), 2014 IEEE 9th Conference on,2014.
  [20] 孙新胜.基于多层卷积神经网络的研究与应用[D].杭州电子科技大学,2018.

对应分类:
版权所有:上海皇冠比分平台8网专业权威的皇冠比分平台8代写、皇冠比分平台8发表的网站,秉承信誉至上、用户为首的服务理念,服务好每一位客户
本站部分皇冠比分平台8收集于网络,如有不慎侵犯您的权益,请您及时致电或写信告知,我们将第一时间处理,邮箱:shlunwen@163.com