您的位置:

基于神经网络的图像半色调(Halftoning)处理算法

2022-07-29
来源:求医网
摘要:本文在对图像的半色调处理理论进行新的认识基础上,依据人的视觉特性提出一种基于神经网络的图像半色调处理的算法,它在保持误差扩散法灰度分布自然及细节检测能力好的优点的基础上,改善了误差扩散法的一些缺点。结果表明有较好的视觉效果。

中图分类号:R445

文献标识码:A

文章编号:1005-202X(1999)02-0073-03

A algorithm based on nueral networks about halftoning

processing of the digital image

XIE Xiao-ping1, RUAN Xiao-sheng1,Lu ya-qing2

(1.Department of physics of Zhejiang medical university;

2.Hangzhou electronic vocational school, Hangzhou 310031,China)

Abstract: A algorithm based on the neural networks is put forward on Halftoning processing of the digital image in this paper.By this method we can lessen the drawbacks produced by Error diffusion algorithm while holding some advantage.The results are proved to be effective.

Key words: neural networks; image processing; halftoning

引言:人眼对图像的灰度分辨率只有几十个灰度等级,供人观看的图像实际上用6 bit表示灰度值就已经足够了。但为了高保真的需要,一般数字图像用8 bit表示其灰度值。在很大一部分图像的应用场合(如打印、印刷、数字显示器件等),无法直接重现8 bit灰度的自然图像,而只能重现二个灰度状态。这些场合就要用到图像的半色调处理技术,图像半色调处理实际上是利用图像的空间平均来重现灰度层次感觉。对于在人眼中视神经所传递的神经脉冲也是只有二个状态,它所传递的图像类似于一幅半色调图像,这一定程度上与图像的半色调技术有点相似。因此,对图像的半色调处理技术的研究就具有十分重要的意义。这也可能会成为研究人类视觉系统的一个新途径,有助于我们研究图像的本质。

人工神经网络是大量神经元相互连接而成的自适应非线性系统,它反映人脑功能的若干基本特性,是对人脑的某种模仿、简化和抽象。而神经元模型的工作原理与图像的半色调处理过程相仿,在图像的半色调处理过程中引入神经网络预期能产生较好的视觉效果。

1图像半色调处理的理论基础

假设M是一个平面点集,(x,y)∈M,原始灰度图像可用f(x,y)表示,而输出的半色调图像用h(x,y)表示,当然h(x,y)∈{h0,h1}。图像的半色调处理就是要使任意的点集AM,有下式成立:

对于数字图像,上式不可能成立。因此数字图像的半色调处理过程中不可避免地引入伪纹理。

根据人眼的视觉特性[1],人眼对空间频率的中间频率区域比较敏感,而对于高频的和低频的区域却不敏感。典型的视觉空间频率特性MTF(modulation transfer function)如图1所示。

图1视觉空间频率特性

在高空间频率处存在空间域视觉阈值。若图像某处的空间频率大于这个值(或者视角小于某个阀值),则人眼感觉不到它的变化。因此,若半色调图像的伪纹理越小,则其视觉效果也就越好。如果产生的伪纹理小于空间探测阀值,则人眼感觉不到伪纹理的存在。在这种图像半色调处理算法中,空间分辩率和灰度层次感之间存在着固有的矛盾[2]。因此,一个好的方法应该是尽可能充分保持细节和灰度层次感的基础上而尽量少引入伪纹理,计算也应当尽量简单。

2基于神经元的误差扩散法

2.1误差扩散法(error diffusion)

在目前最常用的图像二值半色调处理算法中,误差扩散法[2,4]是较优秀的一种,它的基本思想是利用原图像中某一像素的灰度值与输出二值图像对应像素灰度之间的误差,将这个误差分配到相邻几个像素,使相邻像素共同承担该像素的灰度值,这样两个图像灰度平均在局部达到一致,从而使整个图像的灰度值与输出二值图像的总误差达到最小,故也称最小平均误差算法。其算法表示如下。

设待处理的图像是N×N大小,8 bit灰度值,f(x,y)表示在(x,y)处像素的灰度值,其中0xN-1,0yN-1,图像的各灰度等级用e0=0,e1,…,e255=R表示,其中e0<e1<…<e255,则f(x,y)∈{e0,…,e255};经过半色调处理后输出的二值图像用h(x,y)∈{h0,h1}表示,其中h0,h1为输出图像的两个灰度值,一般取h0=0,h1=R。这样对于每一个像素f(x,y),它与对应的输出二值图像像素之间的误差为e(x,y):

e(x,y)=f(x,y)-h(x,y)

设当前处理像素为f(x,y),则其灰度修正值为:

其中ij表示像素(x,y)邻域内与该像素距离的两个分量,αij是误差扩散系数,它一般排列成矩阵形式,称为误差扩散矩阵。

这样,当前处理像素的输出图像值的判决为:

若f*(x,y)>R/2h(x,y)=R,

否则h(x,y)=0;

误差扩散法较好地保留了图像细节,特别是在整个灰度范围内检测细节,并且灰度分布比较自然。然而,其主要缺点是产生较严重的伪纹理,边缘模糊,对比度较差。

误差扩散法缺点产生的原因之一就是由于误差扩散,更加重了图像像素之间的相关性,而算法中误差扩散矩阵却在整个图像处理过程中均没有变化,因而造成输出图像的这些缺陷。

2.2神经元的模型及α LMS算法

自适应线性元件(Adaline)是许多神经网络采用的基本神经单元,其结构如图2所示。

图2Adaline神经单元

设神经元的输入信号矢量为:

Xk=[x0k,x1k,…,xnkT

权矢量为:

Wk=[W0k,W1k,...,WnkT

模拟输出Sk由Xk与Wk的内积产生,即:

SK=XTK.WK=WTK.XK

相应的二进制输出为:

权值训练的准则为:

其中k为自适应周期数:Xk为当前输入模式,Wk为权矢量的当前值,Wk+1为权矢量的下一时刻值,而瞬时线性误差εk定义为理想输出dk与线性模拟输出的差值:

εkdk-WTkXk

在本文的处理中还需对系数进行归一化处理。

权值变化引起相应的误差变化为:

△εk=△(dk-WTkXk)=-XTk△Wk