一种改进的半调图像分类算法
摘 要:半调图像分类在逆半调过程中是非常关键的步骤。文献[1]提出的神经网络分类算法利用增强的一维相关性,可以对半调图像进行适当的分类,但分类精度不够高。在神经网络分类算法的基础上,通过计算图像的灰度共生矩阵,进而提取图像的纹理特征来对图像进行分类。实验表明,改进后的算法可提高分类的精度。
关键词:半调图像;图像分类;纹理特征;灰度共生矩阵
中图分类号:TP391.41文献标识码:B
文章编号:1004-373X(2008)22-112-03
Improved Algorithm for Halftone Image Classification
FAN Junjie,Kong Yueping
(Xi′an University of Architecture and Technology,Xi′an,710055,China)
Abstract:The classification of halftone image is a key step in the process of inverse halftone.The neural net classification Algorithm can classify the halftone images using the enhanced one-dimensional correlation of halftone images,but the precision is not very high.This paper based on the neural net classification algorithm abstract the textural features by calculate the gray level co-occurrence matrix of halftone images.Experimental results show that the improved algorithm can enhance the classification precision.
Keywords:halftone image;image classification;texture feature;gray level co-occurrence matrix
1 引 言
数字半调技术是将连续色调图像转换成等观感的半色调图像;而逆半调技术是将半色调图像转换成连续色调的图像,它去除在半调过程中所产生的半调噪声和人工纹理,将离散的二值图像恢复为连续色调图像。对于不同的半调图像只有采用相应的逆半调技术才能得到比较满意的结果,因此半调图像分类在逆半调、半调图像压缩过程中扮演着非常重要的角色。
由于连续色调图像在半调过程中引入了许多噪声,同时会呈现出许多有周期有规律的人工纹理,因此可以选取半调图像的纹理特征作为图像分类的依据。本文先对文献[1]中提出的半调图像分类算法进行简单介绍,并分析这种方法的优缺点,并针对缺点提出基于灰度共生矩阵的纹理特征提取方法,最后对改进后的算法进行仿真,并给出实验结果。
2 基于BP神经网络的半调图像分类算法
文献[1]中通过观察发现各种半调图的频谱之间存在明显的差异,因此将其作为半调图像分类的依据,但是由于图像的频谱计算量比较大,复杂度比较高,所以提取图像的一维相关性,然后用神经网络进行分类。
一个M×M大小图像块(IM×M(a,b),a,b=0,1,…,M-1)的一维相关性的定义为:
(l)=1M×M∑M-1i=0 ∑M-1j=0I(a+i,b+j)·I(a+i,b+j+l)
其中l=1,2,…L,L是一维相关性的最大偏移长度。
文献[1]中通过只有单个隐层的BP神经网络来进行半调图像分类,并将一维增强相关性数据向量作为神经网络的输入。神经网络结构如图1所示,它由16个输入节点(对应16个相关性数据)、4个输出节点(对应4个分类结果)和10个隐层节点(根据输入节点和输出结点数目的平均值得到)构成。
图1 半调图像分类的神经网络结构
在神经网络结构确定之后需要进行训练,以便获得神经网络的最佳权值和偏移。
利用该算法对半调图像分类可以得到如图2所示的分类结构图。
图2 神经网络分类结构图
由于自相关性函数描述的是一幅图像中块与块之间的空间相关性,自相关函数值的大小与图像中纹理粗细的变化有着对应关系。当图像的纹理较粗时,函数的变化速度较慢,当纹理较细时,函数的变化速度较快。对于同一大类中的不同半调方法,虽然它们生成的半调图在局部存在一定的差异,但在整体上,图中块与块之间的空间相关性变化规律非常相似,因此只能暂时被划分为同一大类。对于局部存在差异的半调图像需要一种能提取局部特征的方法来进行分类,而基于灰度共生矩阵的特征提取方法正好解决这一问题。
灰度共生矩阵是对图像上保持某距离的两像素分别具有某灰度的状况进行统计的到的,因此可以看成是两个灰度组合的联合直方图。因此,对于同一大类中无法利用自相关函数分开的半调图像,本文将利用基于灰度共生矩阵的纹理特征进行区分。
3 改进算法描述和试验
对于第三大类的有序抖动模板矩阵Cluster 4×4和DispersedCL 8×8,它们在矩阵大小和元素排列上存在明显的差异;而对于第4大类中误差分散方法Burkers和其他3种误差分散算法,它们的误差分散核在形状大小和分散权值上也存在着比较大的差异。这些差异导致它们生成的半调图在局部也存在着一定的区别。下面利用改进的算法对半调图像进行分类:
改进后的半调图像分类算法首先计算出图像的一维增强相关性,并用BP神经网络进行分类,对第3大类和第4大类中的半调图像利用纹理特征中的逆差矩特性进行二次分类,对于其他大类则直接输出结果。框图如图3所示:
图3 改进后的算法框图
其中,基于灰度共生矩阵的分类算法框图如图4所示:
图4 基于灰度共生矩阵的半调图像分类算法框图
下面主要介绍利用灰度共生矩阵对第三大类和第四大类进行区分:
(1) 图像预处理
由于灰度半调图像只有0和1两个灰度级,在此基础上计算得到灰度共生矩阵并没有实际意义。在此,需要先将灰度半调图像转换成一个灰度级比较丰富的图像,然后再计算灰度共生矩阵。在实验中采用的办法如下所示:
g=a×8+b×4+c×2+d×1
先将图像分为2×2的块,然后按照上述公式将4个像素映射为一个像素。通过转化,灰度半调图像就转换成一个具有16个灰度级的图像,在此基础上计算的灰度共生矩阵就可以提取有用的特征值。
(2) 计算图像的灰度共生矩阵
一幅灰度级为G的灰度图像I,其大小为Ny×Nx,那么它的空间灰度共生矩阵定义为为:
其中(i,j)∈G×G,d是间隔距离,可以取为1,2,3,4,8等值。θ为方向(θ=0°,45°,90°,135°)。矩阵第i行第j列元素P(i,j,d,θ)表示所有θ方向,相邻间隔为d的像素中有一个取i值、另一个取j值的相邻对点数,可以简记为P(i,j)。对于不同的θ,矩阵元素定义如下[3]:
P(i,j,d,0°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(k-m=0,|l-n|=d);
I(k,l)=i,I(m,n)=j}
P(i,j,d,45°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(k-m=d,l-n=-d)or(k-m=-d,l-n=d);I(k,l)=i,I(m,n)=j}
P(i,j,d,90°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(|k-m|=d,l-n=0);
I(k,l)=i,I(m,n)=j}
P(i,j,d,135°)=#{((k,l),(m,n))∈(Ny×Nx)×(Ny×Nx)|(k-m=d,l-n=d)or(k-m=-d,l-n=-d);I(k,l)=i,I(m,n)=j}
上述式中记号#{X}表示集合X的元素数。
为了分析方便,矩阵元素常用概率值表示,即将各元素P(i,j)除以各元素之和S,得到的各元素都是小于1的归一化值(i,j),即:
(i,j)=P(i,j)/S
由此得到的共生矩阵称为归一化共生矩阵[3],特征的提取就是在此矩阵上进行的。
利用步骤一中预处理后的图像,将d设为1,可以计算得到在四个方向的归一化的灰度共生矩阵l(i,j),(l=1,2,3,4)。
(3) 特征提取
基于灰度共生矩阵提取的纹理特征量有很多种,常用的主要有能量、对比度、熵、逆差矩和相关等。本方法用到的特征量主要是逆差矩(Inverse Different Moment)[4],因为它反映了图像纹理局部变化的多少。其值大则说明图像纹理的不同区域间缺少变化,局部非常均匀。定义为:
Idm=∑L-1i=0∑L-1j=011+(i-j)2P(i,j)
根据步骤二中得到的l(i,j),(l=1,2,3,4)计算4个方向上的逆差矩,并把它们作为一个结果向量。
(4) 最小欧氏距离分类
在进行分类之前首先需要确定各类的标准向量,然后计算结果向量和标准向量之间的欧氏距离,距离最小的就是半调图像所采用的半调技术。标准向量通过计算80幅图像的逆差矩特征值,然后计算每种半调方法特征向量的平均值得到的。通过实验,可以算得标准向量如表1所示,在得到标准向量之后就可以对未知半调图像进行分类。
表1 标准向量
半调技术标准向量类别代码
Burkers00.830 80.974 50.624 141
Others0.047 50.992 60.136 10.747 942
Cluster 4×4100.012 1 031
DispersedCL8×8100.011 9032
4 实验结果
在实验中,利用Matlab 7.0.1[5]对算法进行仿真,对89幅图像的15种半调方法进行了测试,其中256大小的图像40幅,512×512大小的图像49幅,测试结果如表2所示,正确率可以达到98.35%。
表2 灰度半调图像分类测试结果
半调技术Bayer4×4Bayer8×8Cluster4×4Cluster8×8DispersedCL4×4DispersedCL8×8DispersedW8×8DispersedW8×8
所属类别1131213211
测试数目8989898989898989
错误数目00400200
半调技术BurkersFloydJarvisSierraStenvensonStuckiBayerOpt8×8
所属类别41542426421
测试数目89898989898989
错误数目1630240
参考文献
[1]Chi Chang Pao,Yu CheSheng.Neural Net Classification and LMS Reconstruction to Halftone Images[J].SPIE,1998:592-602.
[2]Haralick R M.Statistical and Structural Approaches to Texture[J].Proceedings of the IEEE,1979,67(5):786-804.
[3]王耀南,李树涛,毛建旭.计算机图像处理与模式识别技术[M].北京:高等教育出版社,2000.
[4] Haralick R M,Shanmugam K,Dinstein I,Textural Features for Image Classification[J].IEEE Transactions on Systems,Man and Cybernetics,1973,3:610-621.
[5]徐飞,施晓红.Matlab应用图像处理.西安:西安电子科技大学出版社,2002.
[6]章毓晋.图像工程(上册)图像处理和分析[M].北京:清华大学出版社,2003.
[7]飞思科技产品研发中心.神经网络理论与Matlab 7实现[M].北京:电子工业出版社,2005.
作者简介 范俊杰 男,1983年出生,山西运城人,硕士研究生。研究方向为图像处理。
孔月萍 副教授。
注:本文中所涉及到的图表、注解、公式等内容请以PDF格式阅读原文