98000元2023-09-22 18:31:30
OCR技术是在扫描技术的基础上实现字符的自动识别。在获得纸面上反射光信号后,由OCR内部电路识别出字符,并将字符代码输入到计算机中。
预处理包括文字分离、正规化、平滑化、二值化和噪声消除等。预处理的方法是将字符逐个分开,规范成大小一致的图像,经特殊处理和消除噪声,为后续处理创造条件。
如果被识别的是正规的铅印字符,一般可利用与基准图像重合比较的方法来识别字符,不必抽取字符图像中的特征。若是手写字符,则需利用轮廓跟踪法抽取相应的字符特征。抽取的特征是识别的依据,如笔划的长度、角度、端点、笔划分布、四周特征等,它们以多维数据的形式表示。作为识别标准的学习图形,也以多维矢量的形式存放在识别辞典中。
所谓判决就是将事先保存的基准字符特征与抽取的字符特征进行比较,直至找到相应的基准字符为止。
OCR技术在识别数字、英文字符及印刷体汉字方面已获得成功。
除了键盘、鼠标器、扫描仪之外,还有触摸屏、声音识别器等输入设备,在此就不作介绍了。