首页 文学文摘 时政新闻 科技科普 经济法律 健康生活 管理财经 教育教学 文化艺术 社科历史

基于Matlab的图像感兴趣区域提取

作者:刘丽 苏赋 田芳 卢阿娟 来源:现代电子技术

摘 要: 在图像中精确提取出用户感兴趣的区域,消去无关背景对目标区域的影响,有助于提高后续图像分析与处理的精度。在此介绍了差影法、交互提取法、自动图像分割提取法3种方法实现对图像感兴趣区域的提取,并分析了各自的实现过程和提取效果,为图像感兴趣区域提取算法的进一步研究提供参考。

关键词: 感兴趣区域; 差影法; 交互式提取; 阈值分割

中图分类号: TN919?34; TP751 文献标识码: A 文章编号: 1004?373X(2013)08?0117?04

随着信息社会的发展,大量具有摄像功能的电子产品迅速普及,图像数据呈现几何级数的增长趋势,图像因此成为科研和生活中承载信息的重要载体。一幅图像包含的数据非常丰富,但由于关注的角度不同,同一幅图像的不同部分对不同的人来说意义不同。如何在图像中提取出自己感兴趣区域的图像特征,精确描述感兴趣目标区域所蕴含的数据信息,弱化背景对目标图像的干扰,便于对这一区域做进一步的处理,成为图像处理中一个重要的研究热点。

1 感兴趣区域

感兴趣区域(Regions of Interest,ROI)这一概念,是指图像中最能引起用户兴趣、最能表现图像内容的区域。感兴趣区域(Regions of Interest,ROI)就是图像中表现图像主要内容、人们最感兴趣的那一部分区域[1],这些关键区域称为感兴趣区域。图像感兴趣区域的提取具有以下特点[2]:

(1)感兴趣区域并没有十分严格的定义。对于同一幅图像而言,在不同的应用背景下,人们的关注角度不同,对图像的具体需求也相应会有所不同,因此会按各自的需求定义图像中的感兴趣区域。

(2)现有的感兴趣区域算法都依赖于图像的颜色、形状、纹理等底层特征。由于图像的语义特征获取并没有特别有效的算法,现阶段感兴趣区域的检测和提取大多基于感兴趣区域所具有的低层特征。

对图像ROI的提取,一般从两方面着手解决:一是利用图像分割技术提取ROI;另外一个就是从人眼的视觉特性出发,通过模拟人眼的视觉特点,寻找特定的视觉敏感区域,并将这些视觉敏感区域排序作为ROI[3]。

下面介绍差影法、交互式提取法、自动图像分割提取法等3种方法实现对图像中感兴趣区域的提取,实验采用仿真软件Matlab R2007b,实验选择分别含有蝴蝶和花朵的两幅图片,用户对花朵和蝴蝶的部分感兴趣,文中分析了相应的程序实现过程,并对比研究了3种提取方法的提取效果,为图像感兴趣区域提取算法的进一步研究提供了参考。

2 差影法

差影法实际是对图像进行代数运算的一种不同的叫法。代数运算是指对两幅输入图像进行点对点的加、减、乘、除计算得到输出图像的运算。本文中主要用到图像减法,在进行图像处理时,对混合背景和前景的图像,人们往往对前景比较感兴趣,将前景作为主要研究对象,即所谓的感兴趣区域,为了要突出所研究的对象而需要清除掉图像的背景。假设背景图像为[bx,y],前景背景混合图像为[fx,y],则有:

[ax,y=fx,y-bx,y] (1)

式中[ax,y]为去除了背景的图像。

通过差影法提取图像感兴趣区域的实现过程如下:

(1)使用strel函数创建指定形状对应的结构元素,形状参数选择disk,根据背景复杂程度选择合适的圆盘半径;

(2)对原始图像和由strel函数创建的结构元素进行开运算,得到背景图像;

(3)使用imsubtract函数对原始图像和背景图像做减法运算,得到消去背景后的感兴趣区域图像。

运行程序处理实验图片,由于实验图片的背景复杂度不同,圆盘半径参数选取不同,对蝴蝶图片取圆盘半径为6,对花朵图片取圆盘半径为30,提取效果如图1,图2所示。

使用差影法提取感兴趣区域对于背景简单的图像处理效果较好,处理速度快,但对于背景复杂的图像处理效果并不好,背景干扰不易去除,且需要通过不停的实验选取适合的圆盘半径,操作比较麻烦,不太适用于大量图片的感兴趣区域提取。

3 交互式提取法

图像的最终使用者是用户,在理想的情况下应以用户的评价为标准衡量提取图像感兴趣区域的效果,不同的用户有不同的要求,以用户为中心,实现用户与提取算法的交互,能得到比较好的提取效果。

使用交互法提取图像感兴趣区域的实现过程如下:

(1)提取原图的R,G,B分量;

(2)使用ginput函数获得所选择点的坐标;

(3)使用line函数在2个相邻选择点连线,直到终点与起点重合,连成封闭区域;

(4)使用roipoly函数选择封闭折线围成的灰度图的多边行区域,背景部分为黑,区域内为白;

(5)将原图像的R,G,B分量分别与roipoly所得到的多边形区域图像做点乘运算,并联结各分量归一化,得到去除背景保留感兴趣区域的图像。

运行程序后,选择要处理的图像,在图象感兴趣区域边缘任意一个地方点击鼠标左键,确定折线起点,然后继续沿着感兴趣区域边缘点击鼠标左键,两点之间自动以蓝色直线相连,随着鼠标沿着感兴趣点击,折线不断自动在2个点击点间连接,直至终点与起点重合,封闭折线将感兴趣区域选定,点击鼠标右键或点键盘Enter键,程序运行,从原图片中将感兴趣区域分割出来,以便于做后续的图片分析。

以分别含有蝴蝶和花朵的2幅图片为例,用户只对图片中的蝴蝶和花朵感兴趣,运行交互式提取感兴趣的程序,提取结果如图3,图4所示。

从显示结果可以看出,基于交互的方法通过人机界面让用户选择图像的若干区域作为感兴趣区域,以用户为中心,让用户自己定义图像的感兴趣区域,不管边界简单或复杂,都可以人为精确选择感兴趣边缘,从而很好地提取出用户感兴趣的区域图像。交互式方法提取精度高,但依赖于用户的自定义操作,处理速度不高,交互过程复杂,不易做到友好、自然,不适应于大量图片的感兴趣区域提取。

4 自动图像分割提取法

4.1 基于类间方差法分割图像

为了将灰度图像转换为二值图像,需要设定一个阈值,使用最大类间方差法获得的阈值通常比人为设定的阈值能更好地把一张灰度图像转换为二值图像。最大类间方差法[4]是由日本学者大津(Nobuyuki Otsu)于1979年提出的,是一种自适应的阈值确定的方法,是在判决分析或最小二乘法原理的基础上推导出来的,又叫大津法,简称OTSU。

采用基于最大方差自动获取阈值的方法进行ROI提取,先考虑图像只存在目标和背景2个区域的情况,设图像[f(x,y)]的像素按灰度级用阈值T分为[C0]和[C1]两部分,则:

[C0=f1x,y|fmin≤fx,y≤T] (2)

[C1=f2x,y|fmax≥fx,y>T] (3)

式中:[fmin],[fmax]分别为图像[f(x,y)]中灰度的最小值和最大值。设[Ni]是灰度值为[ifmin≤f≤fmax]的像素数,则图像[fx,y]总的像素为[N=iNi],各灰度级出现的概率为[Pi=NiN],[C0]部分出现的总概率为:

[P0=i=fminTPi] (4)

其均值为:

[u0=i=fminTiPiP0] (5)

[C1]部分出现的总概率为:

[P1=i=T+1fmaxPi] (6)

均值为:

[u1=i=T+1fmaxiPiP1] (7)

图像[fx,y]的均值为:

[u=i=fminfmaxiPi=i=fminTiPi+i=T+1fmaxiPi=P0u0+P1u1] (8)

两个区域的平均灰度为[u0]和[u1],整幅图像的平均灰度为[u],区域间的方差为:

[σ2T=P0TuT-u0T2+P1TuT-u1T2] (9)

当被分割的2个区域的方差达到最大时,可以认为是2个区域的最佳分离状态,由此可以确定最佳阈值[T?]。

基于最大方差获取阈值的方法是一种全自动的方法,不需要认为的设定其他参数。它是按图像的灰度特性,将图像分成背景和目标2部分。背景和目标之间的类间方差越大,说明构成图像的2部分的差别越大,当部分目标错分为背景或部分背景错分为目标都会导致两部分差别变小。因此,使类间方差最大的分割意味着错分概率最小。并且经过推广,只需用同样的算法继续迭代,就可以适用于多个区域的情况。

4.2 形态学处理

为了更好地提取图像的边界,将图像边界包围的感兴趣区域完整提取出来,用到形态学处理中膨胀、腐蚀、填充3种运算[5]。

结构元素是数学形态学运算中一个重要的概念,二维或平面结构元素是一个包含0或1元素的数组,结构元素的原点是结构元素参与形态学运算的参考点。

膨胀是在二值图像中 “加长”或“变粗”的操作,特殊的方式和变粗的程度由结构元素的集合控制。数学上,膨胀定义为集合运算。[A]被[B]膨胀,记为[A⊕B],是所有结构元素原点位置组成的集合,其中映射并平移后的B至少与A的某些部分重叠。

腐蚀是在二值图像中“收缩”或“细化”的操作。腐蚀的数学定义与膨胀类似,[A]被[B]腐蚀,记为[AΘB],是所有结构元素原点位置的集合,其中平移的B与A的背景并不重叠。

填充是在二值图像中填充图像区域和空洞。已知图像中边界的集合[A],对该边界线包围的区域的填充过程是从区域内的某一点[P]开始做以下迭代运算:

[Xk=Kk-1⊕B?Ac, k=1,2,3,…] (10)

式中:[B]为结构元素,当[Xk=Xk-1]时停止迭代,这时,集合[Xk]和[Ac]的交集就包含了填充区域的内部及它的边。在膨胀过程中,与[Ac]交集是为了将其限制在感兴趣的区域。

4.3 实现过程与仿真验证

结合最大类间差阈值分割和形态学处理的自动感兴趣区域提取方法程序实现过程如下:获取图像的RGB颜色信息,并分别提取图像的R,G,B分量;将RGB颜色空间转换到lab彩色空间,通过函数makecform和applycform实现;取出lab空间的a分量,采用最大类间方差法实现图像的自动阈值分割,按图像的灰度特性,将图像分为背景和目标2部分,通过函数graythresh实现;将灰度图像转化为二值图像,采用膨胀运算和腐蚀运算平滑图像的边界轮廓曲线,去除狭窄的连接,去掉细小的突出部分,保留边界曲线围城的感兴趣区域[6],膨胀通过函数imdilate实现,腐蚀通过函数imerode实现;填充边界曲线包围的感兴趣区域,通过函数imfill实现;将图像中对应感兴趣区域之外的区域颜色信息设为0,去除背景,对应感兴趣区域的部分颜色信息保持不变,实现原图像中感兴趣区域的提取。同样以含有蝴蝶和花朵的两幅图片为例,运行程序,提取效果如图5,图6所示。

从显示结果可以看出,这种基于自动阈值分割的图像感兴趣区域提取方法,提取效果比较好,且全部提取过程可以自动实现,不需要用户的参与,比较适合于大量图片的处理。

5 结 语

通过仿真实验可以看出,本文介绍的3种方法各有优劣,差影法提取速度快,但参数依赖于人为设定,在背景复杂时提取效果不佳,交互式提取法提取效果精确,但需人机交互,不适用于大量图像的处理,自动图像分割提取法提取效果相对较好,且全程自动提取,不需要人机交互,比较适用于大量背景简单图片的处理。通过精确提取图像的感兴趣区域,人们可以专注于对图像感兴趣区域的处理,改善图像处理的结果,更好地服务于图像压缩、图像检测和图像检索[7]等众多图像处理领域。

参考文献

[1] WANG T, RUI Y, SUN J G. Constraint based region matching for image retrieval [J]. International Journal of Computer Vision, 2004, 56(1): 37?45.

[2] LIN Hui?bao, SI J, ABOUSLEMAN G P. Region?of?interest detection and its application to image segmentation and compression [C]// Proceedings of International Conference on Integration of Knowledge Intensive Multi?Agent System. Waltham, MA: KIMAS, 2007: 306?311.

[3 ] 张菁,沈兰荪,高静静.基于视觉注意机制的感兴趣区检测[J].光子学报,2009,38(6):1561?1565.

[4] 刘刚.Matlab数字图像处理[M].北京:机械工业出版社,2010.

[5] 陈超.Matlab应用实例精讲:图像处理与GUI设计篇[M].北京:电子工业出版社,2011.

[6] 井艾斌,柳青,孟祥增,等.基于Matlab的图形轮廓提取及填充[J].电脑知识与技术,2008(9):1722?1727.

[7] 刘恒,马涛,高金辉.感兴趣区域特征提取的图像检索[J].信息化纵横,2009(10):50?54.