OCR识别控件LEADTOOLS OCR典型应用：增强Google Drive搜索

charts 2021-09-02 原文

Google Drive是一项非常不错的云储存服务，通过这项服务，用户可以储存，组织和共享文档、照片和视频文件等，但是TIFF和其他光栅图像文件格式却很容易丢失。为了很好地解决文件丢失的问题，开发人员可以使用LEADTOOLS OCR SDK提取文本，然后将文本添加到每个项目的IndexableTextData。接下来，便可以类似方式在基于文本的文档，如DOC或者PDF文件中搜索光栅图像文件。

Google Drive是一项非常不错的云储存服务，通过这项服务，用户可以储存，组织和共享文档、照片和视频文件等，但是TIFF和其他光栅图像文件格式却很容易丢失。为了很好地解决文件丢失的问题，开发人员可以使用LEADTOOLS OCR SDK提取文本，然后将文本添加到每个项目的IndexableTextData。接下来，便可以类似方式在基于文本的文档，如DOC或者PDF文件中搜索光栅图像文件。

例如，我们上传了四个普通TIFF文件到Google Drive，每个文件分别命名为OCR1，OCR2，OCR3和OCR4，因此，仅具有基于文件名的搜索功能完全没有任何帮助。

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

用我们看来，这些图像就是文本，但是对于Google Drive而言，它却将这些图像看作光栅数据，并且在我们试图搜索扫描文档的内部时，无返回。

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

难道谷歌就没有办法搜索你的文档？幸运的是，Google Drive会一直挂起，并且在执行文本搜索时，使用每个文档中可自定义的“IndexableTextData” 元数据。在接下来的例子中，我们一起来看看如何在不修改原始图像的情况下，使用Google Drive查找基于文本内容的TIFF文档。

连接到Google Drive

启动Google Drive API来检索ClientID和ClientSecret。因为，当使用 Google Drive API上传和修改TIFF文档时，需要使用到这些属性。接下来，下载 Google Client Library到引用中。

在本示例中，我们将打开WebBrowser控件中的User Authorization Uri，使用户可以输入自己的用户名和密码。用户登录以后，我们可以从WebBrowser控件的标题中获取授权码，然后我们就可以搜索所有账户中的TIFF文件。

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

使用LEADTOOLS OCR

最后，使用LEADTOOLS OCR 引擎来获取TIFF文件的文本信息。创建IOcrEngine和IOcrDocument后， RecognizeText函数将返回一串从页面中提取的文本字符串，然后更新Google Drive中的IndexableTextData元数据。

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

接下来，在Google Drive中搜索TIFF文档，结果显示如下：

OCR识别控件LEADTOOLS OCR在Google Drive上的应用

版权声明：本文为charts原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/charts/p/3248396.html

OCR识别控件LEADTOOLS OCR典型应用：增强Google Drive搜索的更多相关文章

OCR识别控件LEADTOOLS HTML5应用：整页OCR识别
随着LEADTOOLS HTML5的出现，在移动设备上执行光学字符识别（OCR）变成可能。凭借LEADTOOL […]...

随机推荐

~~核心编程（七）：面向对象——多态~~
进击のpython 多态多态，什么叫多态？多态拆开就是多种状态什么是多种状态呢？姑娘还有两副面孔呢┗| […]...
安装sublime text3 、转化为汉化版、安装SublimeREPL使得在交互条件下运行代码,设置快捷键
一、sublime Sublime Text 3是轻量级的，安装包很小，它的大部分功能是依靠丰富的插件实现的， […]...
小说网站源码（最新开源版小说站源码支持H5手机版并集成全自动采集规则）
小说网站源码是对小说站事务进行监控的在线管理更新系统，“开源版小说站源码”采用HTML、CSS、JAVASCR […]...
Linux内存大页设置
实际环境中，遇到3次由于内存大页设置参数不合理或者错误，导致系统内存不足，或者数据库内存不足的问题。按照如下 […]...
一个简单的socket服务端和客户端程序：客户端发送数据给服务端，服务端接收到数据后再给客户端发送数据 – 青莲蓄池
一个简单的socket服务端和客户端程序：客户端发送数据给服务端，服务端接收到数据后再给客户端发送数据 Vie […]...
maven的安装配置+JDK安装和环境配置——记第一次安装的详细步骤
JDK的安装和环境配置 1 JDK介绍 JDK(Java Development Kit) 是 Java […]...
View Animation 运行原理解析
Android 平台目前提供了两大类动画，在 Android 3.0 之前，一大类是 View Animati […]...
Win10家庭版无法远程桌面连接的解决方法
远程桌面连接服务器，是大家常用的一个桌面功能。在XP、Win7时代，大部分同学都是使用“盗版”操作系统，分分钟 […]...