基于感兴趣区域轮廓的图像分割方法
摘 要:针对耗时和区域边界不精确的图像分割问题,对边缘检测方法和区域生长方法进行研究、改进,提出以边缘检测和区域生长相结合的感兴趣区域轮廓的图像分割方法,该方法能够更加精确地对图像进行分割。实验结果表明,该方法对复杂环境下感兴趣区域的图像分割具有良好的效果。
关键词:边缘检测;区域生长;感兴趣区域;图像分割
中图分类号:TP391.4 文献标识码:B 文章编号:1004373X(2008)1613303
Image Segmentation Method Based on Silhouettes of Interested Region
WANG Yanni.1,2,FAN Yangyu.2,MAO Li.1,2
(1.School of Information and Control Engineering,Xi′an University of Architecture & Technology,Xi′an,710055,China;
2.School of Electronic and Information,Northwestern Polytechnical University,Xi′an,710072,China)
Abstract:An image segmentation method based on silhouettes of interested region is proposed in this paper because the segmentation problem of wasting time and illegibility of region′s boundary,which method is combined with edge detection and region growth.Searching the two methods and improving them,the new method can segment the image very accurately.The experimental results show that the segmentation algorithm has better performance to image segmentation of interested region in complex environment.
Keywords:edge detection;region growth;interested region;image segmentation
目标分割是图像识别中最基本的步骤。目前有直方图阈值法、特征空间聚类、边缘检测方法、基于区域的方法、模糊方法、神经元网络方法等主要图像分割方法。其中边缘检测方法提供了图像的简单几何结构,而彩色边缘通常是不连续的或过检测的,这样不能直接用于图像内容的描述。在以边缘为基础的图像分割中,检测边缘点之后执行的一些后处理过程,如边缘追踪、间隙填充、平滑及细化等,都是耗时的。以区域为基础的图像分割能够提供封闭的区域边界,但边界可能非常不精确。针对以上问题,提出一种以边缘检测方法和区域生长方法相结合的感兴趣区域轮廓的图像分割方法,不仅避免了以边缘检测方法的耗时过程,并使以区域生长方法所提供的边界更加精确。
1 边缘检测法
边缘检测[13]是所有基于边界分割算法的基础。边缘是灰度不连续的结果,两个具有不同灰度值的相邻区域之间总存在边缘。用一阶导数的局部最大值或二阶导数的过零点可以用来方便地检测边缘。
梯度算子是一阶导数算子。对一个连续函数f(x,y),它在(x,y)位置的梯度g可表示为一个矢量:
g(x,y)=f(x,y)=[gx,gy].T=[fx,fy].T(1)
它的模(幅度)和方向角分别为:mag(f) = g.2x+ g.2y ,θ = argtangy gx (2) 在对象分割时,如果对象的部分边界纹理与相邻部分背景纹理相近或相同,则在对象区域提取时,其边界线会出现断点、不连续、分段连续等情况。在图像中有噪声干扰时,也会使轮廓线断开,所以在对象区域提取分割时,未得到闭合的边界以使对象区域完整的分开,应经历一个使不连续边界闭合的过程,即边界闭合,在此利用基于邻域梯度的边界闭合技术。
一般,图像中的对象应具有轮廓或边界的,勾画轮廓使用梯度计算的方法,即求取轮廓各点处梯度的大小和方向。要把断续的边界点连接起来,则需要对断开处两端点梯度的大小和方向检查其是否相近,如果相近即将该处连接,是否相近,使用阈值的方法予以判断,如果断点邻域处梯度幅度的差在某邻域内,梯度方向的差也在某邻域内,即认为其相近可以使其闭合连接。表达式为:|f(x1,y1)-f(x2,y2)|≤T1(3)
|φf(x1,y1)-φf(x2,y2)|≤T2(4)其中(x1,y1),(x2,y2)是断开处的2个端点。
f(x1,y1)是梯度的大小;φf(x1,y1)是梯度的方向;T1是梯度大小的阈值;T2是梯度方向的阈值。
2 区域生长法
区域生长法[46]首先对每个要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围的邻域中与种子像素有相同或相似性质的像素合并到种子像素所在的区域中,像素之间的相似性准确预先确定。将这些新像素当作新的种子像素继续进行上面的过程,直到没有满足条件的像素被包含进来。
(1) 选择或确定一组能代表目标区域的种子像素;
(2) 确定在生长过程中能将相邻的像素包含进来的准则;
(3) 制定使生长过程停止的条件或准则。
种子像素的选取一般根据具体问题的特点来确定。如果对具体问题有先验知识,可人为制定种子像素的特性。若没有先验知识,可借助生长准则对每个像素进行相应的计算,如果计算结果呈现聚类情况,则选择聚类重心的像素作为种子点。
区域生长的关键是选择合适的生长或相似性准则,大部分区域生长准则使用图像的局部性质。生长准则的选取不仅依赖于问题本身,也和所利用图像数据的种类有关。一般生长过程进行到没有满足生长准则的像素时就停止生长,但常用的基于灰度、纹理的准则大都基于图像的局部属性,并没有考虑生长的“历史”,为增加区域生长的能力需要考虑一些与尺寸、形状等图像的全局性质有关的准则。
3 感兴趣区域轮廓的图像分割算法
3.1 结合算法
把边缘提取和区域生长的结果结合起来能够提供更加精确的图像分割,方法如下:
(1) 对于同一区域找出每一行和每一列的第一个和最后一个像素,作为此区域的边界像素,从而确定每个同质区域的边界像素;
(2) 结合由种子区域生长过程所得的区域边界和由边缘检测过程所获得的边缘有以下可能性:
① 既是区域的边界像素,又是边缘的边缘像素,这种的像素应该是最后的区域边界像素;
② 既不是区域的边界像素,也不是边缘的边缘像素,这样的像素应该是区域内部的像素,而不是区域边界像素;
③ 是区域的边界像素而不是边缘的边缘像素,这样的像素可能是不连续点,应该在其邻域像素的基础上确定,是不确定像素;
④ 不是区域的边界像素但是边缘的边缘像素,这样的像素可能是边缘检测的过检测像素,也应在邻域像素的基础上确定,是不确定像素;
(3) 对于不确定像素,利用边缘检测的方法确定是否为区域的最后边界像素。
3.2 感兴趣区域轮廓提取
区域是一个具有某种意义的整体,通常由一系列彼此相连的区域组合而成,并且这些区域的关系图及其轮廓能够在原始图像中很好的体现。这些连接区域包含不同的颜色和纹理,并且它们的轮廓决定这些区域应该被放在一起来形成一个整体区域[7,8]。不同区域有不同的视觉模型,很难用一个通用视觉模型来产生不同区域[9,10]。在此以人为例,设计人体的提取模型,把人脸作为人体对象产生的种子,根据设计的人体视觉模型来管理种子区域增长的过程,并且这个视觉模型可指导怎样把人脸、身体、手臂和腿组合在一起。
应用一个简单的人头肩的比例模型仅对人的头肩图像进行处理,以比例模型为基础的人体头肩像提取技术的步骤如下:
(1) 检测人脸区域,作为人体区域增长的种子;
(2) 利用人脸区域,根据比例模型确定图像中人的头肩的大致位置;
(3) 利用结合算法得到精确的区域边界图像,计算每个区域落在比例模型范围内的像素个数占整个区域所包含像素数的百分比,如果超过75%,则认为此区域是人体的一部分,否则不是;
(4) 将认为是人体部分的区域像素值设为1,否则设为0,则将感兴趣区域提取出来。
4 仿真试验
为验证结合算法的效果,采用各种典型视频序列图像如American miss,Carphone等对算法进
行了试验,另外也从各种影片中截取了视频图像进行测试,图像大小均为360×288 pixels,试验平台是P42.4 G的微机,处理速度在10 f/s左右,图1是对American miss视频序列中感兴趣区域轮廓,即人的头肩区域进行实验的部分结果。由该图可以看出来,在人脸位置不断变化的情况下,算法能很好地进行图像提取分割,并且结合算法比边缘检测算法所产生的误差平均降低2.6 pixels。
5 结 语
通过对边缘检测方法和区域生长方法进行分析、研究及改进,提出一种边缘检测与区域生长相结合的新的感兴趣区域轮廓的图像分割方法,不仅实现了复杂环境下的感兴趣区域的分割,且精度较高。
图1 分割误差实验证明,基于边缘检测与区域生长的结合算法能有效解决感兴趣区域变化的各种问题,并能提高系统对环境的适应能力。
参 考 文 献
[1]贺贵明,吴元保,蔡朝晖,等.基于内容的视频编码与传输控制技术[M].武汉:武汉大学出版社,2005.
[2]孙即祥.图像分析[M].北京:科学出版社,2005.
[3]朱秀昌,刘峰,胡栋.数字图像处理与图像通信[M].北京:北京邮电大学出版社,2002.
[4]徐立中.数字图像的智能信息处理[M].北京:国防工业出版社,2001.
[5]Stephen J.solari.数字视频和音频压缩[M].北京:电子工业出版社,2000.
[6]张旭东,卢国栋,冯健.图像编码基础和小波压缩技术——原理、算法和标准[M].北京:清华大学出版社,2004.
[7]王燕妮,樊养余.基于视频压缩的多分辨率预测菱形搜索算法[J].计算机工程与应用,2007,43(27):9597.
[8]王燕妮,樊养余,彭轲.基于视频压缩的快速自适应菱形搜索算法[J].电子技术应用,2007(9):6668.
[9]Hong Lu,YapPeng Tan.An Effective PostRefinement Method for Shot Boundary Detection [J].IEEE Trans.Circuit Syst.Video Techno1.,2005,15(3):1 4071 421.
[10]Giuseppe Boccignone,Angelo Chianese.Foveated Shot Detection for Video Segment [J].IEEE Trans.Circuit Syst.Video Techno1.,2005,15(3):365377.
作者简介 王燕妮 女,1975年出生,陕西蒲城人,讲师,博士生。主要研究方向为视频压缩、图像处理等信号与信息处理。
樊养余 男,1960年出生,教授,博士生导师,工学博士(博士后),曾在英国华威大学做访问学者。从事的研究领域为数字信号处理、数字图像处理、人工智能等;目前主要从事强噪声中信号检测与恢复、数据压缩、信息安全、目标识别等方面的研究。
毛 力 男,1980年出生,博士生。主要研究方向为信号与信息处理。
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文