手写体自动识别与检索系统

基于深度学习的自动识别与信息提取

 

网站--线状书.jpg




关键技术

1、图像的灰度化,目的只是进行汉字识别工作,识别效率与三色度彩色信息并无关系

2、图像的二值化。更加体现背景与汉字的区分度

3、古籍汉字的切分。汉字识别通常是在单个汉字的基础上进行的,因此必须在识别之前进行汉字切分。切分又分为行切分和列切分

4、图像平滑去噪。除噪声进行平滑处理


5、图片归一化。待识别图片尺寸大小以及其它的特性必须与训练集图片相一致


 1-220226224939564.jpg