快捷分类

基于距离和的二值化算法及其应用

更新时间：2009-03-28

在图像处理和分析中，二值化图像是很基础也很重要的一个步骤，不仅因为它是一种可以快速区分前景(或目标)和背景、提取出感兴趣的目标的简单方式，还因为很多图像处理的操作对象都基于二值图像，例如图像细化(或骨架化)、边缘检测、字符识别等.通过灰度图像可以很容易得到二值图像，其主要过程为：设灰度图像和二值图像都由一个m×n的矩阵(或二维数组)表示，每个像素值不妨记为f(x,y)和g(x,y),1≤x≤m,1≤y≤n.其中灰度图像是每个像素的R、G、B分量值相等时的彩色图像，二值图像是像素灰度值只有0和255时的灰度图像.在不引起歧义的前提下，分别记灰度图像为f(x,y)，二值图像为g(x,y).对于灰度图像来说，图像二值化就是将其中灰度值大于分割阈值T的像素设置成1(纯白色)，将灰度值小于等于这个阈值的像素设置成0(纯黑色)，即

周末，许元生照例沉浸在他的代码世界里，如芸也如法炮制，要逼他学做饭。他在厨房里叮叮当当了半天，才端出一碗黑乎乎的面条，还没等她批评他，他却红了眼圈，“我只想安安静静地码个代码，不行吗？”

(1)

然而，二值化图像往往伴随着信息损失，这也必然会影响之后进行的图像操作的效果，因此如何找到适合的、最有利于后续图像操作的分割阈值T是十分重要的.

人们对美好生活的向往，不仅要有充足的食物，更需要有丰富、安全的食物，更需要有优质的食物，更需要有自己喜欢的、舒适的环境，不能每人都穿着航空服，吃着所谓的“有机食品”，这样真的幸福吗？充满污染的土壤、水、空气、还有人为增加的那些化学品，还能生产出有机食品，谁信呀！

1 OTSU算法及存在的问题

基于统计理论的TSU算法[1]是选择阈值的一种常见方法，它的核心思想是选取使得前景和背景两类像素的类间方差最大的阈值作为分割阈值，其主要思路如下：

设灰度图像f(x,y)存在L级灰度，其取值范围从小到大依次为g1,g2,…,gL.在此范围内选取gi(i=1,…,L)作为分割阈值，将图像f分成G0和G1两组，其中G0包含的像素的灰度值范围是g1,…,gi，G1包含的像素的灰度值范围是gi+1,…,gL.设N表示图像f像素个数的总和，ni表示灰度值为gi的像素的个数.设每个灰度值gi出现的概率为和G1两组像素的个数在图像f中所占的百分比分别为w0和w1，则可得概率和设两组的平均灰度值为u0和u1，则有和由此可以得到图像f的总平均灰度为u=w0×u0+w1×u1.则类间方差为

σw(gi)=w0(u0-u)2+w1(u1-u)2=w0w1(u0-u1)2,

(2)

则OTSU算法寻求的最佳阈值为T=argmax(σw(gi)).这种方法最大化的对象是类间方差，它同时等价于最小化类内方差.

针对文献[2]实际应用中定义的由9个数字构成的“学号图像”，利用MATLAB中的graythresh函数求得OTSU阈值，通过im2bw函数用所得的OTSU阈值实现图像二值化[3-5].发现部分使用铅笔填涂的学号,当颜色较淡即背景和前景区分度不高时，二值化后的图像中数字的笔画连线会出现许多断点，导致图像信息大量损失(图1(a)).实验中逐步提高阈值，发现信息损失得到有效控制，二值化图像效果逐步转好.据初步统计，提高的阈值平均达到20个灰度级.由此，认为OTSU算法得到的阈值比实际效果需要的阈值小很多[2].从式(2)和这类图像的灰度直方图(图1(b))可知，由于灰度值很高的像素居多，因此选取的分割阈值会偏小以增大(u0-u1)2，最终使得对应的σw达到最大.

经计算，在有效执行SD算法后，由SD算法得到的分割阈值都比OTSU算法得到的分割阈值大，且图像区分度越低偏差越大，平均偏大20左右，中位数约为19.阈值偏大恰好保证了区分度不大的图片不会因为分割阈值偏小而损失有效的信息.限于篇幅，表1仅给出18张学号图像分别采用OTSU算法和SD算法得到的二值化阈值.

(a) OTSU算法的信息损失

(b) 灰度直方图

图1 图像的灰度直方图和OTSU二值化

Fig.1 Histogram and OTSU binarization of image

2 距离和SD算法

灰度图像f具有L级灰度值，从小到大排列依次为g1,g2,…,gL.由于书写每个数字的地方都有6个基点来控制涂写数字的位置和大小，因此在二值化阈值从g1逐级上升到gL的过程中，基点、位于基点周围及基点连线周围的像素点会先变黑，而背景像素和远离这些部分的点则随后变黑.

设图像f中所有灰度值为gi的像素点用来表示，基点与基点间连线的所有像素点用Bj=(Xj,Yj)来表示，则定义距离和指标(sum of distances,简记为SD)为：

(3)

其中为欧氏距离.从上述的像素点逐渐由白变黑的过程可知，随着分割阈值gi的增加，SD会先缓慢上升，之后大量远离基点及基点连线的背景像素开始变黑，从而使得SD急剧上升. 当分割阈值增加到一定程度时，SD会开始突增并最终达到一个很大的值.

此外，谭凤明还积极配合优质厂家，打破小厂家请客吃饭、忽悠团走街宣传的模式，通过科学的示范试验观摩和农技推广知识讲座，用效果和服务打动并引导农民科学选肥，正确用肥，增产增收。通过差异竞争和服务发力，世纪农资赢得了转型升级的先发优势。

基于构造的距离和指标SD，所寻找的二值化阈值即为SD开始突增时对应的灰度值.基于此时的分割阈值，在二值化后的图像中位于基点和基点连线周围的深色像素点大多都被二值化成黑色，因此出现数字连线之间因分割阈值偏小而造成间断的情况很少.同时SD的值不大，说明该分割阈值没有将过多属于背景的像素二值化为黑色以造成大量噪声.

高校作为人才培养的实施主体，要充分重视双创教育的重要性。利用微信、QQ群等“互联网+”新媒体，营造良好的双创学习氛围，实时关注学生的创业的思想动态，以学生兴趣出发，增强学生的双创意识。在教学过程中，任课教师要多引入一些国内外的前沿的科技事件作为课程教学的案例，并邀请知名的校外专家做行业发展报告。各高校还要重点培育双创课程，根据学生双创需求，建设个性化、模块化的双创课程资源。为有双创想法的学生，同时提供校内外的创业导师，依托社会资源，协同培养双创人才。再有，依托“互联网+”资源，帮助学生将双创成果进行展示和推荐。进而打造符合高校，服务社会的双创文化，提高学校双创人才培养的水平。

在观察了大量学号图片的SD值随灰度值变化的趋势图后，总结出了SD值的2个特点:

1)忽略SD在到达最大值后的变化情况，它的整体趋势是持续上升的，而细微趋势是不断上下波动；

2)满足SD≤1 000的灰度值占比很大.

1)找到灰度图像f具有的灰度值, 并存储到数组g中.

(4)

5)while(SD(gl)>SD(gl-1)){l=l-1;T=gl;}.

随着碳市场的推进，控排企业的碳排放MRV能力、履约合规意识、碳资产管理能力明显提高，部分企业建立了相应的管理体系，以及通过节能减排使配额富余并通过市场交易获利。与此同时，碳市场带动了碳核查、低碳咨询、节能减排等能源环境相关产业的发展，并吸引了金融资本参与节能减排项目，对应对气候变化及低碳发展聚集了人才、提供了动力。

现设T为SD开始突增时对应的灰度值，P为最小的满足SD>1000的灰度值.设T与P之间(包含)共存在l级灰度值，从小到大依次为t1,t2,…,tl，且t1=T,tl=P.由此，对二值化阈值T做出如下定义：

亲子阅读应让孩子在互动中享受快乐，在快乐中学会阅读，在阅读中慢慢成长，让“悦”读点燃智慧，让亲子共享温暖。

while(SD(gl)>SD(gl-1)){l=l-1;}

4)l←l-1; T=gl;

寻找二值化阈值T的伪代码如下：

3)l←l-1

3 模型评价

图2 数字笔画区域划分及数字2,4的示例 Fig.2 Example of the division of the digital stroke area and the digital 2,4

文献[2]描述的学号图像通过6个基点7个区域构成数字，数字的外接矩形尺寸和位置由6个基点确定，如图2所示.每个学号图像包含9个数字，且每个数字之间的距离(或间隔)相等(见图1(a)).二值化学号图像后，采用中值滤波器去噪(应用MATLAB中的函数medfilt2函数)，然后再进行图像细化(Zhang-Suen算法[6]).然后进入以下识别过程：先对整个学号图像进行行扫描和列扫描确定出9个数字总的矩形区域；由于每个数字之间的距离相等，可分割出9个子矩形区域，然后再对这9个矩形区域分别依次进行行扫描和列扫描以确定出每个数字的最小外接矩形区域.由于细化后的图像笔划宽度都只有一个像素，因此可采用简易的判别方法：对于某个区域，若在该区域的4个五等分点中至少有3处有黑色像素，则判定该区域连通，否则判定为不连通.又由于学生书写的笔画会偏离这些区域，因此在识别程序中需要把寻找黑色像素点的范围适当扩大.

最直观的评价就是学号图像的识别正确率.为此从实际试卷库中选出学号填涂中前景和背景区分度低的100张学号图像依次代入OTSU算法和SD算法，分别计算分割阈值，然后二值化图像，再细化、去除孤立点，最后进行数字识别，计算出识别正确率.

若以OTSU算法实现背景和前景区分度不高的图像的二值化，会导致图像信息的大量损失从而造成后续处理的失效.结合实际应用的时效性要求，需要寻找一种快速、信息损失少、二值化效果好的阈值选取方法.基于文献[2]的应用背景和“学号图像”，本文通过构造距离和指标SD给出分割阈值的算法实现图像的二值化，并选取区分度不高的学号图像，以总识别率和有效识别率作为最后的评价标准加以比较.

表1 18张图片的分割阈值

Tab.1 Segmentation threshold of 18 images

图片编号OTSU阈值SD阈值1204062122301619124133214222362152304221123142211231131198216212201220图片编号OTSU阈值SD阈值2211224102032301821122534213224372082308419324188191240160205219230210228

然后进行二值化和数字识别，并统计识别正确率.其中，每张图片的识别正确率定义为被正确识别的数字个数除以总的数字个数；总识别率定义为所有被正确识别的数字个数除以数字总个数；有效识别率定义为所有数字都识别正确的学号图像数除以总的学号图像数.经计算，在区分度不高的100张学号图中，SD算法的总识别率和有效识别率分别为89.03%和72%，而OTSU算法对应的识别率分别为58.45%和0%.限于篇幅，表2仅给出表1中18张图的识别率细节.

表2 识别正确率比较

Tab.2 Comparison of recognition accuracy comparison

图片编号OTSU算法SD算法16/90/968/99/9162/97/9336/99/9366/97/9426/99/9852/97/91316/98/92125/99/9总识别率56.17%90.12%图片编号OTSU算法SD算法28/99/9107/99/9186/99/9348/99/9372/99/9843/99/9883/99/91604/99/92303/99/9有效识别率0%72.22%

由表2比较可知，针对涂写较淡、笔画较细的学号图片来说，SD算法得到的分割阈值非常有利于二值化后图像的识别.但在实践中，该方法存在一个明显的缺陷，对于不符合SD(T)<1 000的图片，SD算法无法准确找到合适的分割阈值，如上述编号1的图片.这是由于满足SD≤1 000的灰度值占比很大这个特点不具有普遍性.下面给出两种改进思路：首先，从大量已有图片可知，SD与灰度值之间的总体变化趋势是极度相似的，因此可以分别计算出以上100张图片(或更多的学号图片)中满足条件SD≤1 000的所有灰度值在对应学号图像f的L级灰度值中的占比，然后取平均值，并用这个比值作为SD算法寻找二值化阈值的起点P的定位；其次，OTSU算法造成信息损失的直观原因是获得的二值化阈值比需要的值小，因此可以在公式(4)的基础上加入新的约束条件：TOTSU≤TSD.由于在寻找二值化阈值的过程中，只需要SD(P)以及之前的部分，因此只需要计算灰度值从最小到P点之间对应的SD.这意味着其余灰度值对应的突增后的SD值的计算被省略，极大的节约了运算时间，提高了效率.

侵袭性作为胸腺瘤的重要预后指征，重症肌无力、低丙球蛋白血症和红细胞生成不良等其它全身性免疫疾病是侵袭性胸腺瘤常见的伴发疾病[12-13]。有效区分胸腺瘤的侵袭性程度可为临床制定治疗方案提供参考，有效增加胸腺瘤的治愈率[14]。本文研究结果显示，侵袭组与非侵袭组患者的胸腺瘤形态、钙化、囊性变或中心坏死、纵隔脂肪线、均匀增强之间存在统计学差异(P<0.05)。结果表明，侵袭性胸腺瘤与非侵袭性胸腺瘤的CT表现差异性较大，胸腺瘤形态、钙化、囊性变或中心坏死程度等指标可作为临床鉴别胸腺瘤发展程度的依据。此研究结果与文献报道一致[15]。

根据《政府会计准则——基本准则》和《政府会计制度》的规定，结合高等学校实际情况，按照“双功能、双基础、双报告”的要求构建适合高等学校的 “财务会计和预算会计适度分离并相互衔接”会计核算模式，实现基本建设投资与学校“大账”的统一会计核算。笔者认为其中关键点在于多维科目体系的构建和“平行记账”平台的搭建。

为验证SD算法的普适性，一方面比较两种算法生成阈值的平均差异，并定义为平均相对偏差率，即

平均相对偏差率

(5)

随机选取200张填涂区分度正常的学号图像，经计算，两种算法产生的阈值之间平均相对偏差率约为2.25%，作非参数配对样本的Wilcox检验，得到检验p值为0.2057>0.05，说明两种算法产生的阈值没有显著性差异.另一方面，用同样的识别方式统计出两种识别正确率，结果如表3所示.

表3 正常图像的识别正确率

Tab.3 Correct recognition rate of normal image

算法类别OTSU算法SD算法总识别率82.28%80.72%有效识别率45%43%

由表3可知，对正常学号图像而言OTSU算法的识别效果总体上更好一点，但两者并没有明显差异.另外对书写规范、区分度高的学号图像也作了大量实验，结果表明SD算法的有效识别率与OTSU算法一样，均达到100%.

4 结论

经过大量的实证和比较实验表明，SD算法运算速度快；对于书写比较规范、填涂区分度高的学号图像，经其二值化处理后的有效识别率可保证达到100%，与OTSU算法的效果相当；对于填涂区分度不高的学号图像，经其二值化处理后的有效识别率大大高于OTSU算法.因此在实际应用中，可联合使用OTSU和SD算法.对于如何进一步完善和优化SD算法，使之适应性更广泛，将是我们下一步研究的方向.

参考文献：

[1] OTSU N. A threshold selection method from gray2level histograms[J]. IEEE Transactions on Systems, Man and Cybemetics,1979,9(1):62-66.

[2] 吕书龙,刘文丽. 试卷识别码的集成设计与识别算法[J].华侨大学学报(自然科学版),2017,38(3):397-401.

[3] 陈思.基于Otsu算法的车牌图像二值化及其Matlab实现[J].长春师范学院学报(自然科学版),2012,31(3):33-35.

[4] 余樑,王广伟. 二值图像的快速细化算法[J].科技视界,2012(14):111-112，100.

[5] 刘健庄,栗文青.灰度图像色二维Otsu自动阈值分割法[J].自动化学报,1993,19(1):101-105.

[6] ZHANG T Y , SUEN C Y. A fast parallel algorithm for thinning digital patterns[J]. Communications of the ACM,1984,27(3):236-239.

[7] 张明,夏铭.一种改进的文本图像二值化算法[J].科技信息,2009(27):555-556.

[8] 吴丹,蔡晓东,谢月飞,等.基于直方图分析和OTSU算法的文字图像二值化[J].计算机与现代化,2013,1(7):117-119.

[9] ZHANG C, QIU Z D. Simple quality assessment for binary images[J]. Journal of Electronics,2007,24(2):204-208.

作者

郑维，吕书龙，林颖

出处

《闽江学院学报》 2018年第02期

上一篇：基于模糊PID的窗帘自动控制系统设计

下一篇：ZrO2空气焙烧与氮气焙烧对Au/ZrO2水煤气变换催化剂性能的影响

《闽江学院学报》2018年第02期文献

圈图超平面配置的导模及其自由解作者：吴军

强幂幺矩阵与强幂幺指数作者：戴立辉，林大华

基于多项式核函数的曲线型生产前沿面的综合DEA模型作者：龚曲华

基于新NCP函数的非线性互补问题的Jacobian光滑化算法作者：丁小妹，王平，马昌凤

仿射非线性广义系统的动态输出反馈H∞控制作者：贤锋，马合保

开放小区对周围路网的影响作者：郑秀婷，张李钦，刘伟明，王宏健

基于胡克模型绳索内部张力的力学分析作者：李玉良，严凯铃

基于模糊PID的窗帘自动控制系统设计作者：赵雨境，孙建达

基于距离和的二值化算法及其应用作者：郑维，吕书龙，林颖

ZrO2空气焙烧与氮气焙烧对Au/ZrO2水煤气变换催化剂性能的影响作者：张燕杰，陈崇启，詹瑛瑛，林棋，娄本勇，郑国才，郑起

Pt-PbO2/C的制备及其氧还原催化性能研究作者：余培锴，李月婵

高压均质处理对铝合金脱模乳液稳定性的影响研究作者：吴华忠，张于弛

山竹壳粉-聚偏氟乙烯复合膜对中性红的吸附作者：黄晓东，徐清艳

磁性阳离子凝胶对酸性大红吸附的影响作者：张于弛，方润，吴华忠

微波辅助Fenton反应降解日落黄作者：张皓云，陈毅挺，刘丽丽，毕柔，毛婷婷，潘彦

TiO2/MWNTS的制备及可见光催化降解亚甲基蓝染料作者：李艳霞，黄雅丽，缪玲

基于MOFs复合材料构建的生物传感器在凝血酶检测中的应用作者：蒋晓华，胡水生，丁文捷

杂志信息网

基于距离和的二值化算法及其应用

1 OTSU算法及存在的问题

2 距离和SD算法

3 模型评价

4 结论