人工智能-图像识别技术-OCR

merray 2021-12-14 原文

OCR

OCR(Optical Character Recognition):光学字符识别（英语：Optical Character Recognition，OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。

OCR技术非常专业，一般多是印刷、打印行业的从业人员使用，可以快速的将纸质资料转换为电子资料。关于中文OCR，目前国内水平较高的有清华文通、汉王、尚书，其产品各有千秋，价格不菲。国外 OCR发展较早，像一些大公司，如IBM、微软、HP等，即使没有推出单独的OCR产品，但是他们的研发团队早已掌握核心技术，将OCR功能植入了自身的软件系统。

OCR识别方法：

Tesseract（Google）:

Tesseract是一个光学字符识别引擎，支持多种操作系统。^[1]Tesseract是基于Apache许可证的自由软件^[2]，自2006 年起由Google赞助开发^[3]。2006年，Tesseract被认为是最精准的开源光学字符识别引擎之一。^[2]^[4]

Tesseract的OCR引擎最先由HP实验室于1985年开始研发，至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而，HP不久便决定放弃OCR业务，Tesseract也从此尘封。

数年以后，HP意识到，与其将Tesseract束之高阁，不如贡献给开源软件业，让其重焕新生－－2005年，Tesseract由美国内华达州信息技术研究所获得，并求诸于Google对Tesseract进行改进、消除Bug、优化工作。

Tesseract目前已作为开源项目发布，最新的稳定版本是3.05.01，于2017年6月1日发布。最新的3.05源代码可从GitHub上的3.05分支获得。新的基于LSTM的4.0版本的源代码可从GitHub上的主分支获得。请注意，该分支正在积极开发中。

Azure（微软）：

其它大公司的OCR开放平台：

1. Asprise Ocr：商业版本

2.ABBYY FineReader

3.CuneiForm/OpenOCR

….

版权声明：本文为merray原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/merray/p/9790044.html

人工智能-图像识别技术-OCR的更多相关文章

随机推荐

win10系统安装之GHOST还原（转+编辑） – PandOne
win10系统安装之GHOST还原（转+编辑）注意*：在以下操作中，你可能需要分区你的原来系统盘，如果是 […]...
python class类的属性应用及init初始化实践 —勇者斗恶龙
　　最近在熟悉python的基础语法，刚好老师布置了个课后作业感觉挺有意思的，就记录下来了学习过程。题目如下 […]...
Python简介
Python简介Python翻译成汉语是蟒蛇的意思，并且Python的logo也是两条缠绕在一起的蟒蛇的样子，然而Python语言和蟒蛇实际上并没有一毛钱关系。 Python语言是由荷兰程序员Guido van Rossum，江湖人称“龟...
基于51单片机智能电子密码锁电路设计（毕设课设）
基于AT89C51单片机的简易六位密码锁输入三次锁定密码输入错误蜂鸣器和LED灯报警可以修改密码【资源 […]...
【渗透实战】记一次艰难的内网漫游第三期_我是如何拿下校园内网最高权限的
/文章作者:Kali_MG1937 CSDN博客:ALDYS4 QQ:3496925334 未经许可,禁止转载 […]...
jdk+tomcat+mysql一键安装脚本
一键部署jdk + tomcat + mysql 最近在搞一个web项目部署，每次都要安装jdk […]...
Windows远程桌面连接的利器-mRemote
mRemoteNG是Windows平台下一款开源的支持多标签、多协议的远程连接管理器。平时我们可能安装N多款管 […]...
JMeter36个内置函数及11个新增函数介绍
JMeter内置了36个函数，这些函数可以通过函数助手进行编辑和测试。了解这些函数，不仅能提高JMeter的使 […]...

展开目录

目录导航