网站--00.jpg




线装书的特点:

线装书是指以线类进行装订的图书类型,又称古线装。中国古代的纸本书,经历了卷轴和册页两个阶段,线装书也产成于宋代。线装,顾名思义是用线进行装订,是用线把书页连封面装订成册,订线露在外边的装订形式。

线装书识别难度:

清晰度越高识别率越高,清晰度高时识别率可达95%,破损度越低,识别率越高。

线装书识别类型:

文件类型可为JPG、JPEG、PDF、PNG、BMP等,纸张颜色不受限制。

线装书识别的优势:

在古籍识别类型中的占比较大。改进学院,大学和研究机构中的文档处理流程,用易于搜索、读取、管理和处理的数字文档替换传统纸张。

文晟OCR提供了一个全面的撷取工具,能够在撷取文件的时候保持文档类型并不强迫你使用专有的文件类型。文晟OCR撷取超越了扫描。通过我们的文档导入处理器将大量的文件转移到文晟OCR,在过程中读取数据。不需要额外购买第三方应用程序。所有这些撷取组件都是文晟OCR的组成部分,用户可以直接安装使用。

我们可以通过提供可负担的、高效和准确的文档处理来帮助那些需要创新解决方案的机构充分利用有限的资源。现在,这些机构可以显著提高他们的生产力,降低学生、教师和工作人员使用纸张产生的成本。


1-22022622040B24.jpg

      

操作步骤:



1. 将扫描纸张,图像或PDF上传

选择文件,点击上传


2. 切分调整

           

       系统对图片自动切分,用户可以对系统自动切分的错误之处进行调整,调整完成后点击提交即可。如果版面污损严重,文本行倾斜角度不定,系统提供手动辅助修改切分的结果,提高切分准确率,保障后续的识别的精度。

     

3. 图文校对


虽然系统的深度神经网络模型的识别准确率已经比较高,但实际使用中面对不同质量的文献难免出现识别错误,识别结果的检查与校对可以让历史学专业人员介入,从而保障数字化文本的准确性。


4. 识别结果

识别结果为纯文本,用户可将结果复制编辑。








     

5. 大批量的进行可搜索的归档、创建

我们提供强大的基于服务器的解决方案,用于将大量纸张或图像原始文档集中转换为可搜索的存档和存储库。