OCR

OCR(Optical Character Recognition):光学字符识别英语:Optical Character RecognitionOCR)是指对文本资料图像文件进行分析识别处理,获取文字及版面信息的过程。

OCR技术非常专业,一般多是印刷、打印行业 的从业人员使用,可以快速的将纸质资料转换为电子资料。关于中文OCR,目前国内水平较高的有清华文通、汉王、尚书,其产品各有千秋,价格不菲。国外 OCR发展较早,像一些大公司,如IBM、微软、HP等,即使没有推出单独的OCR产品,但是他们的研发团队早已掌握核心技术,将OCR功能植入了自身的 软件系统。

 

OCR识别方法:

 

 Tesseract(Google):

Tesseract是一个光学字符识别引擎,支持多种操作系统。[1]Tesseract是基于Apache许可证自由软件[2],自2006 年起由Google赞助开发[3]。2006年,Tesseract被认为是最精准的开源光学字符识别引擎之一。[2][4] 

Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。

数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。

Tesseract目前已作为开源项目发布,最新的稳定版本是3.05.01,于2017年6月1日发布。最新的3.05源代码可从GitHub上的3.05分支获得。新的基于LSTM的4.0版本的源代码可从GitHub上的主分支获得。请注意,该分支正在积极开发中。

 

Azure(微软):

 

其它大公司的OCR开放平台:

1. Asprise Ocr:商业版本

2.ABBYY FineReader

3.CuneiForm/OpenOCR

….

 

版权声明:本文为merray原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/merray/p/9790044.html