基于机器视觉的数字1-10手势识别系统( 五 )


基于3D的手势模型可以分为四类:几何模型,骨架模型,网格模型和纹理模型[10] 。各个模型对应不同的应用场合,例如,骨骼模型主要用于跟踪和识别身体的姿势,几何模型适合于对实时性要求较高的系统等 。使用3D模型时通常会碰到两个问题:首先,模型参数空间的维数比较高,计算上会比较复杂;其次,通过视觉技术来检测模型的参数难度将会比较大,并且过程复杂 。
基于表观的手势模型同样也可以分为四类:基于灰度图像本身手势模型,基于图像属性的表观模型,基于2D变形模板的表观模型以及基于图像运动的表观模型 。基于表观的手势模型相对而言更加简单,使用较少的信息表达出用户需要的描述的信息 。同样,各个模型也适用于不同的情况,如基于图像运动的表观模型一般用于识别动态手势图像,本文中选择的是基于灰度图像的表观模型 。
8.手势图像的输入及预处理 图像的平滑处理
图像的平滑处理也称作模糊处理,是一项简单且使用频率很高的图像处理方法 。使用平滑处理有多种用途,最常见的是用来减少图像上的噪声和失真 。降低图像分辨率时,平滑处理尤其重要 。平滑处理有多种方法:第一种,局部平均法,这种方法原理是直接在空域上进行平滑处理,使用这种方法时,我们把图像看作是由若干个灰度不变的小块组成,互相之间空间相关性很高,但是噪声的统计则是独立的 。因此,我们利用每一个像素相邻的8个像素的灰度的均值来代替这个像素原来的灰度值,这样逐个像素处理以后,整幅图像就有了平滑的效果 。比较常用的局部平均法有:非加权邻域平均,这种方法对每个邻域中的像素所给的权值都一样,全部对等看待,因此该算法计算速度快,算法较简单,但是也会在降噪的同时使得图像在边界和细小处变得模糊,对其改进后的方法有超限像素平滑法、梯度倒数加权法、灰度最相近的N个相邻点平均法以及自适应滤波法等等 。第二种,中值滤波法,中值滤波其实也是局部平均法的一种,它的特点主要是是针对脉冲干扰和椒盐进行抑制减噪,其效果比较好,同时在抑制随机噪声过程中,能使边沿减少模糊 。中值滤波法是一种非线性的图像平滑方法,它使用一个滑动窗口,对窗口中的各个像素根据其灰度值进行排序,取这些灰度的平均值,再平均值代替窗口中心像素原
来的灰度值 。中值滤波与局部平均法进行比较,其有以卜优点:R得底能使图佟边明显;如果图像中像素灰度值变化较小,其平滑处理的效果可以很好f;能使图像边沿的模糊程度得到降低 。第三种,频域平滑技术,上面介绍的平滑处理是在空域中
进行的,在频域中同样也可以进行平滑处理 。在频域中进行平滑处理,即将一维信号低通滤波器推广在二维图像中 。我们采用二维傅里叶变换对输入图像处理大多数噪声频谱都分布在空间频域的较高区域,而图像有用区域的频谱分量空间频域较低的区域内,因此可以采用低通滤波器,这样高频的分量就会被阻拦,我们需要的图像本身低频分量就会保留,这样就实现了图像的平滑处理 。
二值化处理
完成了许多针对图像的处理后,我们通常需要对图像中的像素做出最后的决策,直接剔除一些高于或者低于某个定值的像素,这个过程即将灰度图转化为二值图像 。
设图像f(x,y)的灰度值范围在[a,b],二值化阀值设为H(a
h(x,y)是二值图像,我们在这里用1来表示对象物体,用0来表示背景区域 。对于阀值T的选择有多种方法,它的值决定了处理以后的图像的质量对图像二值化方法进行简单的分类则一般可以分为两种:整体阀值二值化和局部阀值二值化 。