谭升
非主流人工智能科学家 我和外面那些妖艳的货不一样

【数字图像处理】3.0:二值图像

二值图像

二值图像(Binary Image),按名字来理解只有两个值,0和1,0代表黑,1代表白,或者说0表示背景,而1表示前景。其保存也相对简单,每个像素只需要1Bit就可以完整存储信息。如果把每个像素看成随机变量,一共有N个像素,那么二值图有2的N次方种变化,而8位灰度图有255的N次方种变化,8为三通道RGB图像有 $255255255$ 的N次方种变化。也就是说同样尺寸的图像,二值图保存的信息更少。

Center

上图中,彩色图像和灰度图像很好的可以看出右侧的镜子,而二值图像无法看出,根据信息论的相关知识,也可以得出二值图像有很大的信息损失,上图中二值图像由灰度图经过阈值100处理后得到的结构

邻接

首先注意邻域与邻接的不同,邻域是指某像素p的周围像素,p与他们间的欧式距离不超过“根号2”即对角线的距离。如果q在p的某种邻域中,则p,q为某种邻接

4-邻域

即对于像素 $(x,y)$ ,其中 $(max-1>x>1,max-1>y>1)$ 。其4-邻域为以下元素:$(x-1,y)(x,y-1)(x+1,y)(x,y+1)$。

D-邻域

即对于像素 $(x,y)$ ,其中 $(max-1>x>1,max-1>y>1)$ 。其4-邻域为以下元素: $(x-1,y-1)(x+1,y-1)(x-1,y+1)(x+1,y+1)$ 。

8-邻域

即对于像素 $(x,y)$ ,其中 $(max-1>x>1,max-1>y>1)$ 。其8-邻域为以下元素: $(x-1,y-1)(x-1,y)(x-1,y+1)(x,y-1)(x,y+1)(x+1,y-1)(x+1,y)(x+1,y+1)$

Center 1
Center 2
Center 3

下面解释下邻接,以下针对二值图像:
– 4-邻接:如果q点在p点的4-邻域集合中,则p,q为4-邻接
– 8-邻接:如果q点在p点的8-邻域集合中,则p,q为8-邻接
– D-邻接:如果q点在p点的D-邻域集合中,则p,q为D-邻接
– m-邻接:如果q在p的4-邻域中,或者q在p的D-邻域中,且q的4-邻域与p的4-邻域交集为空,则p,q为m-邻接。

Center 4
Center 5
Center 6

对于m邻接,其主要目的是为了消除8-邻接的二义性。
二义性:在某种情况下,如果邻域中存在多种通路。如下图所示:

Center 7

其中点1到点3存在两种通路,1->p->3,1->p->2->3。所以点1和点3关系不明确。如果使用m邻接,点3将不会是点p的m-邻接,因为点p和点3的4-邻域存在交集点2。

补充说明,冈萨雷斯的书中有一个集合v的概念,在二值图中 $v={1}$ ,即元素值为1的集合,这个主要是针对灰度图,多值的,比如对于255个灰度级的图像,我们对 $v={255,254}$ 的集合操作,则不是255和254的灰度被视为0,255,254被视为1。

连通性

对于集合S存在一条通路的条件是,通路的像素的某种排列,相邻像素满足某种邻接关系。例如点p到点q之间有 $A_1,A_2,A_3\dots A_n$ 个像素点,且相邻像素点都满足某种邻接。则p和q间存在通路。如果通路首尾相连,则称闭合通路。S集合中的一点p只存在一条通路,则称为一个连通分量,如果S只有一个连通分量,则称为一个连通集。
对于R为一个图像子集,如果R连通的,则称R为一个区域。对于所有不连接的K个区域,其并集Rk构成了图像的前景,Rk的补集称为背景。
二值图像简单的介绍如此,下节介绍形态学。

Share

You may also like...

说点什么

avatar
  Subscribe  
提醒

试录了几节线性代数视频课程,欢迎大家支持,
点击试看
点击购买更多内容

由于博客移至wordpress,部分公式和代码显示不正常,博主正在努力修改,如发现公式显示错误,请及时在文章下留言,感谢您的帮助,尽请原谅!