ocr识别 http://www.cnblogs.com/imfunny/archive/2011/11/15/2250032.htmlOCR识别图片的一些实例

lexus 2021-11-11 原文

之前一直想做一个人脸识别的项目，结果最后被调离那个项目组，最后不了了之。最近在家休息，一哥们就让帮忙采集一些数据，因为有效的数据被图片化了，就需要一些简单的数字识别，然后决定用tesseract-ocr来实现。

tesseract-ocr是一个OCR引擎，在1985年到1995年由HP实验室开发，现在在Google。tesseract-ocr 3.0发布，支持中文。开源协议Apache License 2.0，在商业项目中还是可以值得一用的。

OK.废话少说。代码贴上了。简单的测试了下，生产环境下自己封装下。OCR这些对资源的消耗特别严重，并且在现实情况下图片有噪点扭曲，失败的概率有点大,所以穷举的时候要注意对象代的管理。不过京东没有扭曲什么的，识别就简单多了。

运行的结果：

需要玩下的点这里下载项目吧。

OCR小贴士：

什么是OCR,点击这里查看。点击

还存在那些OCR引擎？

答：

主要几个OCR还有Asprise-OCR，不过个人感觉这个识别不大准确，错误率太高。所以放弃了。

微软也有OCR，不过下次再介绍基于微软的Document组件的中文识别吧。tesseract-ocr实际上也是支持中文的。可以自己去看下了解下。

方法概述该方法用一个端到端网络完成文字检测整个过程——除了基础卷积网络（backbone）外，包括两个并行分 […]...

C# OCR识别

C# 识别文字我试验过的有两种，1.使用开源库tesseract，地址：https://github.com/ […]...

随机推荐

js实现只允许输入数字

页面js： function isNumber(value) { //验证是否为数字 var patrn = […]...

影评网站Alpha版本-测试与发布项目发布地址： http://120.78.161.21:8080/zhi […]...

Eclipse简介和使用 Eclipse简介和使用常用快捷键快捷键的配置，常用快捷键：内容提示： Al […]...

云服务器基本设置

服务器到手了，今后准备自己把项目部署到服务器。系统Ubuntu16，感谢阿里帮我按好了。远程连接你的云服务 […]...

有时想找jdk的某个版本并不太好找，在此给出所有链接及对应的api Java SE 1.6各个版本 jdk […]...

java中连接数据库的步骤

JDBC（连接数据库）简单连接数据库的步骤： 1、将mysql的jdbc驱动加载到内存中指定需要连接的数据 […]...

最近在运维项目中遇到了需要用日志服务器来存储防火墙日志，问了好多人都不会搭建，没办法只能自己百度找教程，却没找 […]...

JAVA模块化 – 时间朋友

JAVA模块化今天转载JAVA模块化系列的三篇文章。在过去几年，Java模块化一直是一个活跃的话题。从JS […]...

ocr识别 http://www.cnblogs.com/imfunny/archive/2011/11/15/2250032.htmlOCR识别图片的一些实例的更多相关文章