时间:2023-03-23 15:17:56
序论:写作是一种深度的自我表达。它要求我们深入探索自己的思想和情感,挖掘那些隐藏在内心深处的真相,好投稿为您带来了七篇图像分析论文范文,愿它们成为您写作过程中的灵感催化剂,助力您的创作。
英文名称:Chinese Journal of Stereology and Image Analysis
主管单位:中国科学技术协会
主办单位:中国体视学学会
出版周期:季刊
出版地址:北京市
语
种:中文
开
本:大16开
国际刊号:1007-1482
国内刊号:11-3739/R
邮发代号:
发行范围:国内外统一发行
创刊时间:1996
期刊收录:
核心期刊:
期刊荣誉:
Caj-cd规范获奖期刊
联系方式
关键词:憎水性;模糊逻辑;阈值分割
中图分类号:TP311文献标识码:A文章编号:1009-3044(2012)10-2343-02
当今社会,输电线路中有一种不可缺少的重要设备,这就是以硅橡胶复合绝缘子为主要选择的绝缘子。这种绝缘子在输电、发电、变电、配电等各个环节中的应用非常广泛,它不仅量大面广,而且种类繁多。硅橡胶表面不仅憎水性良好而且憎水迁移非常独特。如果绝缘子表面一旦受潮,吸附的水分就会以不连续的并且孤立的小水珠形式性而存在,它并不会形成连续的水膜,这就大大地限制了表面泄漏的电流,从而提高了闪络的电压。相比于其它有机材料来说,硅橡胶是具有独特的憎水迁移性的,也就是说硅橡胶表面被脏污后,硅橡胶能够把自身的憎水性轻易地迁移到污秽物的表面,能让污秽物表面也具有憎水性。为了能让憎水性鉴定的结果体现出客观性,国内外的一些学者已做过很多研究,为了能客观地判断绝缘子的憎水性,他们曾试着使用图像分析法,实际上,他们确实取得了一些研究成果,但是这些方法不能很好地判决现场所获污秽复合绝缘子的喷水图像的等级效果。
因为图像本身存在的不确定性,使得进行图像分析和处理较为困难,图像分割旨在把图像划分成各个特色的区域,它是一种基本的计算机视觉技术,利用图像信息中的部分特征提取图像中的目标进行技术分析,亦是进行图像分析与描述研究的关键技术之一。本质上说,对图像进行分割是在其属性的基础上对图像像素进行分析的过程,由于图像分割方法是面向具体问题的,故没有通用的方法能够对图像分割进行描述,而诸多方法中的阈值分割法是最重要的图像分割方法之一,为此该文提出了基于二维最大模糊熵的阈值分割法对图像分割进行研究。
1模糊逻辑理论与图像分割关系
1965年美国加州大学伯克利分校的自动控制专家和数学家L.A.Zadeh教授发表的论文中正式提出集合理论,首次把模糊引入技术文献中,开创了一数学分支。所谓模糊逻辑理论的提出就是通过模拟人的各种模糊信息处理能力来处理实际问题的理论学科,模糊技术应用于图像处理,因为模糊逻辑方法的引入,改变了人们对事物特征单纯的版面的描述,使其参客体信息的表达更加合理,目标信息的利用更加充分,也将模糊问题转化为确定性或者更加适合于计算机处理的问题,因此得到了广泛的应用。
基于模糊逻辑理论的图像分割技术,通常也简称之为图像的模糊分割技术,就是用模糊概念来描述图像的性质、特征和关系,用模糊集合与系统理论来理解、表示和处理分割过程的图像处理方法。一幅图像中往往包含灰度、空间结构等相关信息,这些信息是与具体的视觉和观察者相关的,而这些信息是取决于先验知识和经验,在多数情况下是复杂的,不能够用经典的精确的数学语言来描述的,所以这些信息一般是具有较强的模糊信息特性的。在图像分割的理论中,如何选取图像信息以及如何利用图像信息是实现分割的关键所在,在图像处理的过程中,由于模糊处理的信宿是人,所以在认识和处理图像的过程中,应当对人的视觉特性以及图像本身所具有的特点进行充分考虑。图像本身具有模糊性,即存在许多不精确性和不确定性,这是由于图像在成像过程中是多对一的映射过程所决定的。这种不精确性和不确定性主要是体现在几何形状的不确定性、图像灰度的不确定性以及不确定性知识等形式,L.A.Zadeh教授提出用模糊理论来对这种不精确性和不确定性进行研究,从而提供了有效的处理技术来对智能信息进行处理。很多专家学者近几年来都致力于把模糊理论应用到图像处理中,并且取得了一些良好的效果。
2图像分割的数学描述
从数学角度,图像分割是按选定的一致性属性准则P,将图像I正确地划分为互不交迭的区域非空子集S1,S2,....Sr,的过程。正确的区域划分必须满足下列四个条件:
(1)I=∪
3基于二维最大模糊熵的阈值分割法
识别绝缘表面喷水图像中的水珠(水迹)极为困难,主要因为绝缘子的目标与背景之间的灰度差非常小,灰度差极小是由水珠的透明性和绝缘子所处环境的复杂性所导致的,还有一个重要的原因是水对光的反射以致于对光一侧的边界极为模糊,为了达到好的识别效果,必须选用好的图像增强和图像滤波方法。基于模糊逻辑的滤波的思想是对憎水性图像进行图像滤波时应用模糊知识,在此基础上建立适当地隶属函数,从而达到增强边缘与去除噪声的双重效果。该文提出的算法是以图像的模糊熵为依据,选取阈值的依据是最大熵原则,由于对模糊集的判断的标准各式各样,为了减少这种主观性的误差,引入录入模糊熵的概念。
熵是用在信息论中进行描述概率分布的不确定性程度的一个重要的概念。将熵理论和模糊集理论进行结合,就可以得到模糊熵。顾名思义,用以描述一个模糊集的模糊程度叫做模糊熵。根据信息论,熵的定义为:H(x)=-∫-∞
p(x)lgp(x)dx
所谓灰度的一维熵最大,就是选择一个阈值,使图像用这个阈值分割出的两部分的一阶灰度统计的信息量最大。设nk为数字图像中灰度级k的象素点数,pk为灰度级k出现的概率,则pk=nk/(N×N), k=1,2…L
图像灰度直方图如下图1所示:图1图像灰度直方图
O区概率分布为:pi/pt i =1,2…t
B区概率分布为:pi/(1-pt) i =t+ 1,t+2…L
其中:pt=∑i=1tpi
选取灰度图像中4邻域的4个像素点为研究区域,计算区域灰度均值,如此则对应于各像素点,设nij分别为N个灰度级的图像的灰度为i的点以及所选区域中灰度均值为j的像素点的数量,而pij为点灰度区域灰度均值对应的(i,j)所发生的概率,则有
pij=nij/(N×N),
{pi,j}就定位是该图像中关于点灰度-区域的灰度均值所得的二维直方图。
假设一大小为M×N的憎水性灰度图像R,像素(x,y)的灰度值用R(x,y)来表示,区间为[0,N-1],令:
pk=
其中,nk代表的是灰度值为k的像素的数量,设定合适的阈值门限,阈值的选取时阈值分割技术是关键,如果过高则过多的目标点会被误归为背景;如果阈值过低则会出现相反的情况,误成为目标。要成功地将图像分为背景和目标两大类,就必须找到适当的阈值,利用该阈值就可以很好地对图像进行分割,大于阈值的像素值为目标,少于阈值的像素值为背景。
4实验结果与分析
用该文的算法进行图像分割,该文采用了水珠的憎水性图像进行了实验测试,对HC1的低昂性的憎水性图像进行图像分割的处理,结果表明,对憎水性图像进行基于二维最大模糊熵的图像分割不仅可以很好地改善图像的灰度分布,还能有明显地图像增强效果。基于二维最大模糊熵的图像分割相对经典的图像分割算法来说,可以更准确地提取出水珠的形状信息,利用模糊滤波可以去除一些噪声,将更方便于的图像的边缘检测。采用该文算法能够将憎水性等级判决的准确率提高,且采用预处理方法对憎水性图像进行预处理,不仅可以对图像进行简单地去噪,而且能够将憎水性等级判决的准确率提高,实验仿真结果如图所示。
5结束语
根据憎水性图像的特点,该文采用了基于二维最大模糊熵阈值分割法对现有的憎水性图像进行试验性分割,实验仿真结果表明该方法对图像进行分割后可以使图像更加清晰,同时也可以提高评定憎水性图像等级的准确率。
参考文献:
[1] Wei Zhang,qun li.An improved adaptive threshold image denoising algorithm based on wavelet[J].IEEE Transaction on image processing,
2002,35(19):1623-1629.
[2].周彬,孙毅,祁兵.硅橡胶复合绝缘子憎水性图像分割算法[J].安徽电气工程职业技术学院学报,2008(1)。
[3].娄联堂,甘霞,林均.基于图像分析绝缘子憎水性分级系统[J].鄂州大学学报,2007,(05).
[4].Sendur L, Selesnick I W. Bivariate shrinkage with local variance estimation.IEEE Signal Process. Lett, 2002, 9(12): 438-441.
[5].祁兵,唐良瑞,赵春辉.绝缘子憎水性图像水珠/水迹形状提取算法[J].电工技术学报,2008(6)。
医学工程由于其学科的高度综合交叉性,对学生创新能力的培养相对其它学科更为重要,也更具有探索性。关于医学工程学生创新能力培养的论文已有很多[3-6],他们都从不同的角度阐述了医学工程学生创新能力培养的途径、方法与模式。具体从某一学术领域研究对医学工程创新能力培养的文章还鲜见于文献,本文尝试从图像分割领域入手,首先概述图像分割的概念和基本算法,接着阐述图像分割在医学工程领域中的重要作用,最后结合实际应用重点研讨医学工程学生的创新能力培养。
1图像分割及其基本算法
图像分割是一种重要的图像分析技术。在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣,这些部分常称为目标或前景,而其他部分称为背景,前景一般对应图像定的、具有独特性质的区域。为了辨识和分析图像中的目标,需要将它们从图像中分离提取出来,在此基础上才有可能进一步对目标进行测量和对图像进行处理。简而言之,图像分割就是指根据某种均匀性或一致性的原则将图像分成若干个有意义的部分,使得每一部分都符合某种一致性的要求,而任意两个相邻部分的合并都会破坏这种一致性。图像的分割在很多情况下可以归结为图像像素点的分类问题[7]。目前应用较多的图像分割方法主要有两种:基于区域的图像分割方法和基于边缘检测的图像分割方法。前者通过检测同一区域内的均匀性是否一致来将图像中的不同区域识别出来,主要包括阈值分割法、区域生长法、聚类分割法以及基于随机场的方法等。基于边缘检测的分割法是通过边缘检测技术把不同区域分割开来,常用的方法包括微分算子法、形态学梯度法、曲面拟合法、边界曲线拟合法,以及串行边界查找等[8]。这些分割方法都有自己的优点和缺点,以及不同的应用范围。经过对这些算法的改进以及重新组合,也有人提出了新的算法,尽管这些新的算法对一些图像的分割能够取得好的效果。但对于背景复杂的弱边界医学图像分割效果不佳。近十年以来,针对传统图像分割方法的局限性,研究重点逐渐放在基于偏微分方程、借助曲线演化模型等数学建模方法的图像分割,其中最具有代表性的就是水平集方法和活动轮廓模型[9]。尽管这类方法的分割效果与参数的选择有关,但具有一定的规律,且只要参数选择合理,对于边界模糊、对比度低的医学图像分割,亦可达到理想的分割效果[10]。
2图像分割在医学工程中的重要作用
随着医学成像在临床诊断和治疗上的作用越来越显著,医学图像分割就成为医学图像分析领域的一个重要的研究课题。由于手工分割很耗时,且主观性强,因此,寻求在计算机的帮助下,从CT、MRI、PET以及其它模式医学图像中提取有关解剖结构的有用诊断信息成了我们的任务。尽管现代成像设备提供了对内部解剖结构的优越的观察条件,使用计算机技术对内部解剖结构进行精确而有效的量化和分析仍然是有限的。医学图像分割可以提取出准确的、可重复的、量化的病理生理数据,满足不同的生物医学研究和临床应用的需要。医学图像分割的目的是通过提取描述对象的特征,把感兴趣对象从周围环境中分离出来,分析和计算分割对象的解剖、病理、生理、物理等方面的信息。图像分割过程是对医学图像进行对象提取、三维重建、体积显示、图像配准、临床诊断、病理分析、手术计划、治疗方案、疗效评估、影像信息处理、计算机辅助诊断等处理的一个必不可少的步骤。医学临床实践和研究经常需要对人体某种组织和器官的形状、边界、截面面积以及体积进行测量,从而得出该组织病理或功能方面的重要信息。精确的测量对疾病的诊断和治疗有重要的临床意义。在一段时间内多次测量同一种与某种疾病相关的组织的体积,可以得到病情发展的信息或用作治疗效果的监测手段[9]。如肿瘤学的临床研究经常用肿瘤收缩的程度和时间来评估治疗效果,将肿瘤大小的精确量化数值作为疗效的测度;肝脏移植供体与受体的肝脏体积测量与脉管分析是肝脏移植术前最重要的预评估工作;视网膜血管的形状、宽度、扭曲以及分叉等结构特征的变化可以直接反映各种眼科疾病对血管网络形态结构的影响,这些特征的变化对某些眼底疾病的早期诊断有重要的意义[11]等等,这些都与图像分割及其准确程度密切相关。此外,不同模式医学图像间的配准、血液细胞的识别和分类、血管造影图像中冠状动脉边缘的监测、乳腺片中微钙化点的检测、放化治疗、神经外科手术的计划与图像引导的手术等也都要求对组织成分的位置和大小精确定位和计算。对人体各种组织的正确分类不仅可以为临床组织病变提供计算机辅助诊断依据,而且也是图像三维重建和医学图像可视化的基础。由于人体解剖的个体差异较大,临床应用对医学图像分割的准确度和分类算法的速度要求又较高,目前虽然已有多种分割算法,但是远未达到完善。因此,医学图像分割领域的研究仍然是当前医学图像处理和分析的热点。
3图像分割与医学工程学生创新能力培养
图像分割实践是培养医学工程学生创新能力非常有效的途径。首先,由于医学图像实际获取设备与条件的不同,引起测量上的不精确性和不确定性,造成医学图像数据非常复杂,这给医学图像分割带来了极大的挑战。其次,图像分割方法灵活多样,能否熟练地、有针对性地应用这些方法解决医学图像分割领域的具体问题,是检查学生创新能力的非常有效的办法。第三,图像分割要求学生具有扎实的数学基础,熟练的编程能力以及知识的综合应用能力。现在的医学成像设备,如CT、MRT成像设备,它们自带的分割软件一般使用阈值分割的方法,尽管这些设备尤其是国外设备使用阈值分割的精度很高,但因阈值分割只是简单地根据图像的灰度值进行分类,因此,这一方法对于具有复杂背景、形状不规则的医学图像分割来说,具有自身的缺点。如对于肝脏CT图像的分割与三维重建,由于肝脏与周围器官的弱边界问题,单独应用阈值分割是很难解决问题的,因此,我们就要激发学生的创新思维,从模糊聚类、区域增长、数学形态学、水平集方法等角度加以思考。尽管如此,自动地分割某一个人的肝脏CT序列图像,也会遇到困难,这是因为(1)肝脏相邻器官或组织如腔静脉、肌肉等的灰度值与肝脏很相近;(2)由于造影剂影响、CT设备不同模态的设定对不同供体的肝脏和其它组织呈现出不同的灰度值,甚至同一供体不同切片都会如此;(3)CT图像不同切片的解剖结构不同,不同供体的肝脏形状差异显著,甚至会出现两三个分散的肝脏区域出现在同一个切片中;(4)肝脏形状是不规则的,它们延伸至腹部左侧与脾脏相连,由于这两个器官的灰度值范围几乎相同,即便人眼观察,也无法确定二者边界,因此,由于检测不到脾脏和肝脏的边界,一般算法无法完成分割。因此,我们可以启发学生应用神经网络的智能分割方法,根据上一切片的分割结果自动分割同一序列的下一切片图像,这样又会涉及到如何将肝脏的灰度信息、分块信息,以及相邻切片间的空间信息融合到一起,也就是说,如何构造神经网络的特征向量[12]。在肝脏分割的过程中,还会涉及到肋脊椎骨与肾脏的分割,这些器官如果单纯根据图像分割的方法是很难解决问题的,必须借助于医学解剖学知识,如对称性、连续性等[13、14]。再如,对于医生非常感兴趣的肝静脉与肝门静脉的分割与三维重建,由于注射造影剂后它们的灰度与周围的的肝脏区别明显,因此,采用阈值分割的方法就很容易得到所需的结果,但由于这两种血管灰度一致,因此,使用医院CT设备自带的软件三维重建后,它们是交织在一起的,这就不便于医生观察,甚至会发生混淆,这个时候就要启迪学生的医学知识应用能力,结合解剖学知识并应用图像分割方法解决这个问题。另外,通过对肝脏图像的分割,学生还可以进一步将这些知识和理论应用到非医学图像领域的分割。如结合单阈值分割,可以引导学生进行多阈值分割,并提出改进的方法[15];结合CV模型与LBF模型,可以引导学生通过高斯核函数改进CV模型图像拟合函数,得到加权形式的能检测局部区域灰度不均匀的函数;并针对当CV模型在低对比度图像中检测不同灰度目标时出现的误分割情况,提出一项全局约束函数,用于调控曲线在运动中兼顾检测梯度幅值不为零的点,并将改善的方法用于复杂的纹理图像分割[16]。
综上所述,对于学生的创新能力培养,我们如果能结合实际应用就能挖掘学生的潜能,开阔学生的视野,激发学生的学习热情,还可以提高学生理论与实践相结合的能力。在以上肝脏CT图像的分割例子中,可以看出,学生不仅需要一定的医学知识与医学影像基础,还需要一定的图像处理理论与智能模式识别理论,如模糊聚类、水平集方法、区域增长、数学形态学[17]、神经网络等,而且,更重要的是,通过肝脏分割这一简单的课题可以引申出一系列相关的课题,这些课题不仅具有内在的联系,也是相对独立的,而且层层深入,要求学生不仅要知识全面,尤其要能灵活运用,融会贯通。这对于学生的创新能力培养具有极大的价值,我们课题组的学生也通过这条途径,结合国家级、省级与校级的创新课题,学到了很多书本上学不到的知识,包括他们的团队协作能力和科研能力的提高,还发表了相应的学术论文[10,12-17]。
再比如,对于视网膜血管图像的分割,现在的文献中已有很多方法,包括传统的Gabor小波方法,匹配滤波(MatchedFilter,MF)方法以及它的改进算法,基于知识引导的自适应阈值分割方法等等,尽管这些方法都比较新颖,也能取得较好的分割结果,但都对视网膜中微小血管的分割无能为力。如果能够引导学生先对图像进行直方图增强,再经过二维Gabor小波的平滑处理,学生就会发现被“隐藏”的微小血管得到了呈现。由于水平集方法对较粗血管分割的优势,以及区域增长方法对微小血管分割的优势,学生自然就会找到最终的分割方法。尽管方法比较传统,但效果比其他方法都好,这样不仅加深了学生对以上各种图像分割算法的进一步认识,更大大激发了学生的科研热情,提高了学生的创新能力。还有,图像分割往往离不开对分割结果的比较与评价,高水平学术论文中,分割结果的比较与评价往往是一件很重要的事情,也是一件比较困难的事情,并且一般占了大量的篇幅,因此,在图像分割的学习与实践中,有意识地培养学生这方面的能力,也是值得重视的。这不仅要求学生有一定的图像分割知识积累,敏锐的思维,扎实的数学基础,娴熟的编程能力,更要有图像分割结果评估这方面的意识,而且这往往是我们中国学生最容易忽视的,他们往往认为只要分割结果出来就完成任务而不去关注。
譬如,上面所提及的视网膜血管分割,因为已有的方法和我们改进的方法相比,往往相差无几,甚至肉眼难以观察,如果不加以定量比较,往往很难体现算法的优势,或者没有足够的说服力,因此,这也是学生创新能力培养的一个重要领域,我们应该加以高度重视。值得一提的是,现在很多学生看了国际期刊上发表的医学图像分割领域的高水平论文之后,一般只关注它的算法和结果,甚至感慨论文水平并不怎么样,为什么别人能发表,而自己却不能发表。熟不知,别人论文的组织水平,知识体系的全面性,展开讨论与结果评价的深入性往往比我们高出一筹。因此,对学生创新能力的培养应该是全方位的、多领域的,不仅要有意识地引导学生深入思考,也要注重对国内外优秀成果与经验的吸收借鉴。
关键词:结构化局部边缘模式;文档图像;模式分类
目前,文档图像具有很多种模式形态,其分类方法也多种多样。在过去,人们比较常用的分类方法是光学字符识别系统,该系统主要根据文本特征、结构特征、混合特征三种方法对文档进行识别分类,但是该分类方法的分类速度比较慢,对所处理图像解析度的要求比较高。因此,该方法逐渐被结构化局部边缘模式分类方法所替代。
1 结构化局部边缘模式下处理图像分类的预备知识
文本管理工作主要包括:压缩、管理、归档、文本分析等,在进行文档工作处理的时候,相对准确的文档类型信息能够有效的提高文本检索的速度以及工作人员的工作效率。文档具有多种模式形态,每种形态都有自己的独特性以及形态之间的相似性。结构化局部边缘模式的使用,不仅可以实现对图像分割模式的自由调节,还能够有效的提高文档图像特征提取的准确性,在使用结构化局部边缘模式进行文档图像特征提取的时候,采用的是图像区块之间重叠的方法,通过这种方式有效的确保图像分割区域特征本身的连贯型性。
2 采用结构化局部边缘模式下,文档图像分类特征的提取
本文在对结构化局部边缘模式下文档图像分类处理的研究中,进行分类对比采用的是HOG。结构化局部边缘系统通过LEP特征,根据图像像素邻域的边缘方向进行了相关的编码。文档图像本身特征就比较明显,例如影像图片的像素数值变化比较大;一般学术论文的格式比较规整且字数比较多;灰度图像之相似性比较大,没有明显的规律可循;表格文件的特征性比较明显,横线和竖线比较多;PPT幻灯片的图像、文字等变化性比较明显,但是在排版方面具有一定的规律可以遵循,为了方便结构化局部边缘模式在处理文档图像方面的研究工作,上述几种图像类型的边缘信息都比较明显。
3 结构化局部边缘模式和HOG的主要特征
3.1 模式分类框架
文中在进行结构化局部边缘模式下,文档图像的分类处理研究中,还没有形成一一个完整通用的基准数据库进行相关的实验研究,并且受其它因素的限制也比较明显。所以,本文在进行处理研究的时候,通过综合对比研究选取了含有5000张图像并具有四种文档图像类别,每种类型都包含1250张图像,类型包括:影像图片、学术论文、PPT幻灯影片以及含有表格的文件。另外,在进行文档图像处理研究时,图片都是随机获取的。
3.2 结构化局部边缘模式的特征描述
结构化局部边缘模式主要是利用计算机模拟技术对对视觉、图像等进行处理,在使用的过程中,根据图片中重复出现的不同pixel,并将其按照不同的方向延伸成九宫格的形状作为参考的重点。在模式计算的过程中,首先要获取到原始的边缘图像,并建立一个3*3的邻域窗口,在这一过程中,文本会被分为比较小的空间区块,其计算方式为:结构化局部边缘模式(SLEP)=Ni/N,i=0,1,2,…31,其中结构化边缘模式的变化范围是在0到31之间,Ni中的i代表的是pixel的数目,n代表的是piexl的总数目。
3.3 HOG的特征描述
HOG特征是目前人们比较常用的图像特征提取方法,该方法在计算的时候选取的是320*256的图像区域,在此基础上,把区块的大小划分为32*32,其中九宫格的大小为16*16,将九宫格的每一格作为最基本地计算单元,然后进行相关的串联计算。方法步骤如下。第一,可以对图像进行卷积处理,目的是了解图像中像素的梯度以及方向变化,一般将范围值控制在[-1,0,1]或者是[1,0,-1]。第二,对每个格子进行量化处理,角度量化的范围值是[0,180],然后根据每个像素的模建立九维方向角直方图。第三,把区块内部各格子之间的直方图进行串联处理,然后组成36维直方图的特征向量。第四,把所有的特征向量串联在一起,就会形成最后的直方图特征向量。
4 结构化局部边缘模式的处理分析
在对上述四种类型的图像特征进行信息提取研究以后,了解到在进行图像分析的过程中,图像的解析度分别为:80*64,160*128,这组数据说明和HOG相比,结构化局部边缘模式在运用过程中性能效果比较好,分辨率也比较高。这说明结构化局部边缘系统在不适用OCR系统的条件下,也具有高质量的文档图像分辨率。当图像大小为80*64,文档图像的类别为影像照片以及规范化的学术论文的时候,SLEP测试效果要比HOG高0.1到1.6个百分点,但是当进行表格文件处理的时候,百分点就会比HOG的百分点低,当进行PPT幻灯片测试的时候,百分点又会比HOG高,这表明,结构化局部边缘模式在文档图像处理的时候,使用整体效能比较高。当图像大小逐渐变大的时候,除表格文件的测试百分点比较低之外,其余也呈现逐渐增高的现象。上述研究表明,当图像文档比较混乱的时候,梯度方向呈现混乱的状态,进行文档图像、影片特征分类会比较方便,但是在进行表格文档处理的时候,使用HOG取得的效果会更加的明显。
[参考文献]
论文摘要:目的:探讨早期脑缺血病变在非增强CT扫描的成像表现。方法:采用回顾性分析的方法,对21例发病时间小于24h,临床怀疑有早期脑缺血,经过CT灌注扫描、CT和MRI随访检查确诊为脑缺血的患者,利用AlbertaStrokeProgramEarlyCTScore(ASPECTS)评分标准分析其非增强CT(NoncontrastCT,NCCT)的影像学表现特征,和CT灌注扫描以及CT和MRI随访结果对比,研究CT平扫在早期脑缺血诊断中的作用。结果:21例经过CTP和(或)MRI随访检查确诊为早期脑缺血患者中,缺血核区CBF和CBV均较正常脑组织明显下降(P<0.05)。经NCCT扫描发现脑缺血病变的患者11例,其中8例主要表现为患侧密度降低,3例主要表现为患侧脑组织水肿、脑沟变浅,ASPECTS评分分析的26个异常区域中,有19个区域表现为密度降低,7个表现为脑组织肿胀。结论:早期脑缺血患者中,NCCT所见的低密度区大致和缺血核区域相符,脑组织肿胀区域大致和半暗带区相符。虽然平扫CT不能准确判断半暗带和缺血核区,但是对早期脑缺血性疾病能提供很多有用的信息。
急性缺血性脑血管病占脑卒中患者的50%~80%,致残和致死率高,成功的治疗取决于能否在早期及时诊断和治疗,建立再灌注,抢救半暗带脑组织。目前公认的治疗方法是早期溶栓治疗,由于受到3h治疗时间窗的限制,早期诊断对治疗有决定性的意义。随着CT和MRI灌注技术以及PET技术的发展,对早期脑缺血的诊断提供了非常有用的影像学诊断手段,由于CT灌注扫描(CTPerfusion,CTP)可以分析脑血流情况,显示脑血流发生改变的区域,CTP扫描越来越多的应用于临床脑缺血疾病的早期诊断。目前早期脑缺血患者的首选影像学检查仍然为非增强CT(NoncontrastCT,NCCT)扫描[1],并且由于各种条件的限制,有一些患者不适合行CTP和MRI检查,NCCT可能是唯一的影像学检查方法,因此研究NCCT表现特点对临床脑缺血性疾病的诊断有重要的价值。本研究通过CTP和MRI扫描,回顾性分析NCCT的表现特点,提高早期NCCT诊断的水平。
1资料与方法
1.1病例选择
选择21例根据临床表现怀疑脑缺血的患者,主要临床表现为:一侧或者患侧肢体运动障碍,一侧肢体无力或者肌肉张力下降,部分患者言语不清、构音不良、鼻唇沟变浅,主要体征为一侧Babinski,Gordon,Hoffman征阳性等。所有患者都行NCCT和CTP扫描,1~2周内复查CT或(和)MRI,确诊为缺血性脑梗死。
1.2CT扫描方案
1.2.1NCCT检查患者仰卧位行常规CT扫描(His2peedZX/i,GeneralElectricMedicalSystems),自颅底区向上扫描至颅顶,层厚为10mm,层距为10mm,重建距阵为512×512,标准算法,显示野为24cm,管电压为120kV,管电流为自动毫安控制。
1.2.2CTP检查根据栓塞的部位和平扫后CT表现确定病变区和扫描层面。经前臂静脉使用高压注射器注入非离子型造影剂50ml(Iohexol,300mgI/ml),注射流率为3ml/s,注射开始后7s进行cine方式扫描,连续扫描45s,1层/s,扫描层厚10mm,管电压80kV,管电流120mA,重建距阵为512×512,使用标准算法。
1.2.3CTP图像处理将cine方式扫描后得到的轴位图像传送到独立工作站(GEAdvantageWorkstation4.02)进行处理。应用CTP软件(GeneralElectricMedicalSystems)使用精确方法分别计算出下列参数图像:脑血容量(cerebralbloodvolume,CBV),脑血流量(cerebralbloodflow,CBF),血流平均通过时间(meantransittime,MTT)和最大峰值时间(timetopeak,TTP)。
1.3后期分析
1.3.1NCCT图像分析5名放射科中高年资医生,在不知道临床表现的情况下,按照AlbertaStrokeProgramEarlyCTScore(ASPECTS)标准,进行大脑中动脉供血区分析。ASPECTS分区的每个区域分别按照影像学表现分为正常区、脑质密度降低区和水肿区。
1.3.2CTP图像分析早期CBV、CBF同时下降区域定义为缺血核区,其余CBF下降而CBV不下降的区域定义为半暗带区。
2结果
2.1所有21例最后确诊为脑缺血的患者中,NCCT发现异常改变11例,阳性率为52%。
2.2NCCT扫描后,利用ASPECTS评分分析方法发现的26个异常区域中,有19个表现为密度降低,7个表现为肿胀。19个NCCT表现为密度降低的区域,经过CTP扫描发现所有区域CBF和CBV均显著降低(P<0.01),并且随访确诊为脑梗死区;7个NCCT表现为肿胀的区域中,5个CBV正常或者稍增高,随访没有发现该区明确梗死灶形成,另外2个区域随访发现梗死灶形成。
2.3CTP扫描:脑缺血核区和半暗带区平均CBF(ml/100g/min)为缺血核区25.1±9.5,缺血边缘区39.3±12.1,血流正常区59.5±18.3,P<0.05。脑缺血区CBV和正常区域平均CBV:缺血区(2.4±0.8ml/100g),正常脑组织(3.9±0.9ml/100g),P<0.05。
3讨论
脑缺血后治疗的关键是抢救半暗带,半暗带是指脑缺血性疾病发生后,缺血核心区域以外脑血流量降低的区域。这些区域如果能及时干预治疗,半暗带脑组织将不至于发生坏死,因此半暗带又可以称为可挽救的脑缺血区[2]。很多学者的研究表明,CT灌注可以预测半暗带的范围。一般认为,CT灌注成像显示的脑血流量(CerebralBloodFlow,CBF)和脑血流容积(CerebralBloodVolume,CBV)都明显降低的区域提示为缺血核区域,CBF轻度下降而CBV不下降或者轻度升高的区域提示为半暗带区[3]。本组病例的CT灌注结果和以往的经验相符,两组数据均可见显著差异(P<0.01)。
本研究21例最后确诊为脑缺血的患者中,NCCT发现异常改变的有11例,阳性率为52%。该数据表明,有脑缺血临床表现的患者,早期NCCT检查有约一半的患者可出现阳性表现。AlbertaStrokeProgramEarlyCTScore(ASPECTS)标准[4]是主要针对大脑中动脉供血区脑缺血的评分标准,在脑部CT扫描的两个标准层面,把大脑中动脉供血区分成10个区域。本实验采用相同的分区法,评价大脑中动脉缺血后的影像学表现。NCCT扫描后,利用ASPECTS评分分析方法发现的26个异常区域中,有19个表现为密度降低,7个表现为肿胀。19个NCCT表现为密度降低的区域,经过CTP扫描发现CBF和CBV均显著降低(P<0.01)并且随访确诊为脑梗死区;7个NCCT表现为肿胀的区域中,5个区域为CBV正常或者稍增高,随访没有发现该区明确梗死灶形成,另外2个区域随访发现梗死灶形成。本研究表明,在NCCT扫描图像上所见的低密度区符合脑梗死区域,而脑水肿区则和半暗带区大致相符。其机理可能是脑缺血后早期,缺血核区域由于脑组织缺血流量降低并且发生细胞坏死为主,密度降低;而半暗带区域脑组织血流量降低程度较轻,细胞以肿胀为主[5],因此主要表现为脑组织肿胀。
虽然随着CTP、MRI和SPECT等技术的发展,提高了早期脑缺血性疾病的诊断率,CTP扫描检查对半暗带的判断非常有价值。大部分患者就诊后首先进行的影像学检查是NCCT扫描,虽然其影像学表现特点不能作为准确判断半暗带和缺血核的标准,但是对早期脑缺血性疾病能提供很多有用的信息。提高对NCCT扫描图像的认识,对患者的早期诊断非常有帮助。
参考文献:
[1]KHRMANNM,JUTTLERE,HUTTNERHB,etal.Acutestrokeimagingforthrombolytictherapy-anupdate[J].CerebrovascDis,2007,24(2-3):161-169.
[2]高培毅,林燕.脑梗死前期脑局部低灌注的CT灌注成像表现及分析[J].中华放射学杂志,2003,37(10):882-886.
[3]陈涓,刘银红,赵斌,等.超急性期脑梗死的多层螺旋CT灌注成像与脑卒中评分及预后相关性的研究[J].中华放射学杂志,2005,39(4):413-417.
关键词:图像拼接 SURF ROI 渐入渐出法
中图分类号:TP391.4 文献标识码:A 文章编号:1007-9416(2016)12-0133-01
图像拼接技术是当前图像处理的研究热点,被广泛应用于计算机视觉、遥感图像绘制、医学图像分析、智能视频监控和虚拟现实等领域。图像配准是图像拼接的基础,目前配准效果最好的是SURF算法。SURF(Speeded Up Robust Features)是一种具有鲁棒性的局部特征检测算法,SURF算法来源于SIFT[1](Scale Inviariant Feature Transform)。文献[2]与文献[3]中对SIFT和SURF算法进行了综合对比,在执行速度上,SURF算法是SIFT算法的三倍多,当图像存在旋转、模糊、光照、尺度和视角变换下,SURF与SIFT都表现出了较好的稳定性。因此本文采用SURF算法实现图像的配准。文献[4]提出了在感兴趣区域寻优搜索的策略,将特征配准算法缩减到重叠区域,提高了图像配准的效率,同时减少了特征的误匹配,提高了图像配准精度。图像融合是图像拼接另一个关键部分,渐入渐出法在速度上具有较好的体现,但是当图像质量不高和曝光不一致的情况下会出现明显的断裂和拼接痕迹。为解决普通监控摄像头图像质量不高以及视差引起的拼接质量问题,本文提出基于ROI与SURF算法的图像拼接方法,并采用RANSAC[5]算法求取最佳单应变换矩阵,最后通过改进的渐入渐出法[6][7]融合图像,有效解决了图像融合过程中的拼接痕迹,使融合区域过渡更自然。
1 系统流程
基于SURF和改进渐入渐出法的图像拼接思路如下:
(1)首先输入两张具有重叠区域的图像;
(2)大致估算重叠区域的大小;
(3)对ROI区域寻找特征点,进行特征匹配,并通过比值提纯、对称性提纯以及RANSAC提纯选出优质匹配,然后利用RANSAC计算最佳单应性矩阵;
(4)采用改进的渐入渐出法进行图像融合;
(5)输出图像。
2 图像配准
图像拼接要求重叠区域占图像的20%至30%,特征点的寻找与匹配只针对重叠区域,重叠区域外的特征点检测和匹配,增加了算法的耗时,同时会带来不必要的误匹配,降低了图像配准的精度。本文通过估算重叠区域的大致范围,然后在ROI区域内检测特征点并进行匹配。
3 图像融合
4 实验结果及分析
测试的实验平台为Intel 酷睿2 T6600@2.20 GHz CPU,内存为2GB,软件开发环境为VS2010及opencv2.4.9,图像为普通USB摄像头所拍摄,分辨率为640X480。
本文在该平台上实现了使用ROI区域的SURF算法进行图像配准,与直接使用SURF算法对比,对特征点数与程序耗时的统计如表1所示。对特定区域提取后的SURF算法比原SURF算法快了大约2倍。使用渐入渐出法融合后的图像过渡区域会出现断裂以及不自然的现象。使用改进算法融合后的图像拼接效果更接近原图像,没有明显的拼接痕迹。
5 结语
本文基于提取ROI与SURF算法快速找到特征点对并进行图像配准,然后利用改进的渐入渐出算法实现了图像的拼接,消除了拼接痕迹,改善了拼接质量。
参考文献
[1]David G Lowe.Distinctive Image Features from Scale-Invariant Keypoints[J].International Journal of Computer Vision.2004,60(60):91-110.
[2]索春宝,杨东清.多种角度比较SIFT、SURF、BRISK、ORB、FREAK算法[J].北京测绘,2014,4,23-26.
[3]张锐娟,张建奇,杨翠.基于SURF的图像配准方法研究[J].红外与激光工程,2009,38(1):160-165.
[4]王勇,何晓川,刘清华等.一种感兴趣区域寻优搜索的全自动图像拼接算法[J].电子与信息学报.2009, 31(2):261-264.
[5]杨云涛,冯莹,曹毓.基于SURF的序列D像快速拼接方法[J].计算机技术与发展,2011,21(3):6.
关键词:数字图像取证;图像区域复制粘贴篡改
中图分类号:TP391.41文献标识码:A文章编号:1007-9599 (2011) 16-0000-01
Comparative Study of Ddigital Image Copy Paste Tamper Forensics Technology
Han Min,Sun Jinguo
(Chinese People's Public Security University,Beijing102623,China)
Abstract:This article describes several algorithms aiming at a common copy-paste forgery in the research field of digital image forensics,compared?the performance of?various methods.Different of kinds of tamper detection methods have been analyzed and discussed.It also prospects the future of copy-paste forgery in the research field of digital image forensics.
Keywords:Digital image forensics;Image area copy paste tamper
一、引言
近年来随着电子技术的发展传统的“胶卷相机”已经几乎被数码相机所代替,这为人们省去了很多传统相机使用上的不变,但伴随着数字图像处理软件的发展,数字图像的非法篡改给人们的生活以及社会带来很多负面的影响,数字媒体的信息安全无法得到保障。复制粘贴篡改是一种常见的篡改手法,它利用同幅图片内各种统计参数比较相近,从一个区域复制一个图块粘贴到另一区域上,以达到掩盖图像真实内容的目的。
二、数字图像被动取证技术
数字图像被动取证技术,要求只给出待检测图像就可以鉴别真伪,即在不依赖任何预签名提取或预嵌入信息的前提下,对图像内容的真伪和来源进行鉴别和取证的技术,因此这类取证技术也叫数字图像盲取证技术。
数字图像被动取证技术实现的可行性基于这样一个事实:任何来源的数字图像都有自身的统计特征,而任何对数字图像的篡改都会不可避免地引起图像统计特征上的变化。因此,可以通过检测图像统计特征的变化,来判断图像的原始性、真实性和完整性。
三、取证算法
目前的取证算法大体上可以分为两类,即基于单个像素的穷举搜索和基于图像块的检测方法。块匹配算法共同的特点就是对输入的图像数据进行分块处理。得到这些块之后,从这些块中提取相应的特征值构成特征向量,不同的基于块匹配的算法的实质区别就在于选取的特征值各不相同。下面就各种方法进行比较:
(一)穷举搜索。基于单个像素点的穷举法原理很简单,但计算复杂度很高,将之应用于大幅图像的篡改检测显然是不可行的,与此同时,此算法也不能够抵抗外来的一些干扰操作,如加噪、模糊等。算法本身受条件的约束性较强。一般我们只用于对较小尺寸的篡改图像的检测。
(二)简单块匹配。最基本的块匹配检测算法是将得到的b2大小的块展开,每个方形块按行优先顺序被展为一行,存入一个矩阵中,这样所有的行向量组成了一个二维矩阵X,其中列数为b2,行数为(Mb+1)(Nb+1)。为了减少算法的计算量,按照字典排序的方法对X阵中的行进行排列。最后根据判断是否存在等同的行向量来确定篡改结果。这种算法在图像遭到了复制粘贴篡改后没用进行其他篡改的情况下显示出了良好的性能,但是当篡改图像经过如压缩等后续操作时,检测的正确率明显降低,这是由于块与块之间不再是精确的相似,检测效果大打折扣。
Fridrich等人对此进行了改进,先对图像进行块离散余弦变换(BDCT)变换,采取经过量化后各块的BDCT系数进行对比分析。由于是在DCT域上做分析,算法具有一定的鲁棒性。但是当处理的图像比较大时,由于计算量太大,往往需要很长的时间来实现篡改定位,这个时间很可能无法令人接受。
骆伟祺等人提出了一种鲁棒的检测算法,这种算法也是基于图像块匹配的。假定问题图像为彩色图像(大小为MxN),首先对其进行分块处理,分块的方式同前面一样,在得到了(M-b+1)x(N-b+1)个图像块之后,对每个图像块提取可以代表其内容的七个特征值,并以向量的形式来表示,前三个分量a1、a2、a3分别是b2大小的彩色图像块RGB通道的均值。若为灰度图,只需记录像素点的灰度值即可,a4、a5、a6、a7则是由图像块内各像素点的亮度分量Y组成的阵列经过四种分解方式整合处理后得到的特征。此算法具有一定的鲁棒性能,能够抵抗一定程度的后处理操作,如模糊、压缩等。但如果被复制的区域发生了形变,则容易造成误判,甚至失效。
(三)基于不变矩的检测算法。不变矩方法是一种经典的特征提取方法,目前已经广泛应用于图像分析与模式识别领域中。Hu提出的7个矩不变量,不但具有平移不变性,而且还具有旋转不变性,适合用于表示图像的特征。但Hu矩的方法对模糊和加噪操作没有明显效果。
Zernike矩是一组正交矩,也具有旋转不变性,即旋转目标并不改变其模值。由于Zernike矩能构造出任意高阶矩,而高阶矩包含更多的图像信息,所以Zernike矩的识别效果优于其他方法。何坤等人提出了一种方法,将尺寸较大的篡改图像运用小波变换得到低频子图像,再把低频子图像分割为图像子块,对其子块序列图像分别进行Zernike矩分析判断是否存在复制篡改,该方法克服了噪声和几何变换对取证的影响。
(四)基于SVD的检测算法。奇异值分解(SVD),是一种图像特征分析方法。它的目的在于消除图像数据各分量间相关性,是基于信号二阶统计特性的一种方法。国防科技大学吴琼等人提出了一种基于SVD的图像复制区域检测算法。利用奇异值分解变换来处理图像块数据,并对图像块进行相似性匹配检验。这种方法对图像羽化或边缘模糊等处理具有鲁棒性。
四、结语
目前主流算法对于相对简单的复制粘贴篡改检测效果较好,但伪造者为了使篡改图像更加可信,除了采用简单的平移、旋转外,还可能会根据实际情况对篡改内容进行缩放、模糊等操作,这样传统的块匹配算法将会失效。因此,在保证算法健壮性与检测准确率的前提下,我们要设计出能够同时抵抗平移、旋转、缩放、模糊等各种操作的取证算法,这是我们今后努力的方向。
参考文献:
[1]周琳娜.王东明数字图像取证技术[M].北京:北京邮电大学出版社,2008:69-70
[2]骆伟祺,黄继武,丘国平.鲁棒的区域复制图像篡改检测技术[J].计算机学报,2007,11