基于BP神经网络的印刷体汉字识别

2022-11-12

一、绪论

随着信息技术的发展, 信息存储和传播形式的多变使信息处理的难度大大增加, 因此, 怎样高效的去管理及组织日渐增加的信息, 从而实现检索及利用信息的目的已成为如今最大的需求之一。由于传统纸质文档无法长期保存, 并且检索和传播也不方便, 因此使用计算机管理、存储、传播和共享纸质信息成为必然趋势。而要将纸质信息录入计算机, 靠大量人工手动录入是不现实的。目前, 可以通过扫描仪等设备将文档扫描至计算机中。

二、研究现状

为了获取通过扫描仪得到的图像中的信息, 科学研究者们提出了光学字符识别的概念, 即OCR (Optical Character Recognition) 。光学识别技术涉及到多个领域, 包括模式识别、人工智能、等多个学科。在我国, 汉字识别的研究开始较晚, 但是发展比较迅速, 在许多科研人员的努力下, 印刷体汉字识别技术的发展和应用有了长足的进步。进入90年代以来, 印刷体汉字识别进入了更深层次的研究, 旨在提高系统的质量和工作效率, 加强系统对不同文本的适应性, 扩大其使用面。

三、印刷体汉字识别

由于印刷体汉字是个庞大的数据库, 且结构相对复杂, 因此给汉字识别增加了难度。本文通过BP神经网络训练对印刷体汉字进行识别。

对于印刷体汉字的识别, 首先要先得到待识别的印刷体汉字, 本文选取的是3个连续的印刷体汉字。然后需要将此连续的3个汉字进行分割, 然后再对分割后的汉字进行二值化等预处理, 此后需对待识别汉字进行网络训练得到输出特征方便识别, 然后就是根据网络训练的结果对汉字进行识别。整体流程如图1所示。

(一) 图像分割

1. 边缘检测

对于图像分割, 我们可以采用最简单的边缘检测方法, 即对扫描到的图片分别进行行扫描和列扫描, 找到文字的起始列和终止列, 然后根据起始和终止位置进行切割;如果我们知道文字的模板大小, 我们也可以先找到文字的起始位置, 然后根据模板大小进行切割, 这样可以省掉很多时间, 但是适用性不高;此外, 我们还可以利用对图像进行水平投影, 找到文字分割的列, 不过这个方法也有一个缺点, 就是如果一个文字列扫描的时候有分隔的点, 那么切割的时候可能就会将文字分割成多部分。为此我们可以根据汉字的特点, 也就是高宽成一定比例的特点进行辅助切割。本文使用的方法是对图像扫描得到水平投影, 根据投影找到切割点, 然后进行切割。

(二) 预处理

1. 二值化

对于汉字图像来说, 通常由黑字白底构成, 前景与背景内容对比明显。所以从整体来说, 一幅汉字图像的直方图一定会有2个峰, 因此本文采用双峰法来确定二值化阈值。即根据2个局部峰值, 找到两峰值之间的谷值即为所求的阈值T。用此阈值对原图像进行二值化处理:

(三) 图像调整

在实验中, 为方便实验, 本文中将图像统一调整为64*64的大小。在这里, 将对图像按比例进行缩放。

(四) BP神经网络

1. BP神经网络概述

BP网络模型包括其输入输出模型、作用函数模型、误差计算模型和自主学习模型。本文实验中采用节点输出模型。

2. 节点输出模型

隐节点输出模型:

输出节点输出模型:

f-非线形作用函数;q-神经单元阈值。

本实验中网络训练时设置人数为M=1, 样本数为N=3*M, 设置隐层节点数为25, 以此进行网络训练。

四、结果分析

输入的图像数据, 对图像数据进行水平投影计算, 水平投影结果如图2所示。

根据水平投影结果确定分割节点, 得到汉字分割结果, 将分割得到的图片依次导入程序, 依次执行二值化操作、网络训练, 最终得到汉字识别结果。

五、结论

本文中的识别程序是使用matlab建立仿真程序, 对汉字图像依次进行单字分割、二值化、BP神经网络训练后, 再对汉字进行识别操作, 识别流程相较于其他印刷体汉字识别更简单, 识别效果较明显。由于汉字是个庞大的数据库, 本文中只展示了样本汉字的识别。

摘要:本文通过实验, 使用BP神经网络训练对印刷体汉字进行识别。识别流程简单, 且识别效果较理想、识别速度较快。文中分析了对印刷体汉字进行识别时使用的预处理方法, 以及对汉字进行分割算法等。

关键词:BP神经网络,二值化,垂直投影,水平投影

参考文献

[1] N.Liolios, N.Fakotakis, G.Kokkinakis, “Improved document skew detection based on text line connected-component clustering”, 2001 IEEE International Conference on Image Processing, 2001, Vol.1, Pages:1098~1101.

[2] 赵健, 冯乔生, 何娟娟.面向汉字识别的新特征及其提取方法[J].软件, 2015, 03 (3) .

[3] 李彦飞.基于图像处理的字符识别方法研究[J].当代教育实践与教学研究.2016 (1) .

[4] 倪桂博, 张国立.一种快速有效的印刷体汉字识别方法[J].华北电力大学学报, 2008, 35 (3) :107-112.

[5] 李先旺, 李涛, 冷丽琴, 王海兵, 张炜.智能神经网络系统原理在印刷体汉字识别中的应用[J].四川大学学报, 2001 (2) :103.

本文来自 99学术网(www.99xueshu.com),转载请保留网址和出处

上一篇:二硫化钼薄膜可大幅提高海水淡化效率下一篇:抗生素在治疗上的合理应用研究