MOBILE VISION TECHNOLOGY
In August 2015, Google announced the release of Android Mobile Vision API. At that time this API had mainly three components Face Detection, Barcode scanner and ways to capture the tracking of objects in real time. So what is Mobile Vision? Let’s figure it out together.
移动到移动设备不再是组织的财富; 这是任何希望在当今世界保持相关性的企业的要求。 技术进步在我们身边,它们正在以超越时代的速度改变世界。
一个有趣的趋势是,智能手机引入的指数式发展及其现代功能被用于将基于Vision的移动应用程序推向寻求基于移动设备的方法的行业的最前沿。 使用文本识别,人脸识别,增强现实,条形码扫描仪等技术的应用程序将改变我们与周围世界的沟通方式。
在继续使用基于Mobile Vision技术的强大API之前,让我们首先了解计算机视觉和机器学习将如何在移动设备开发的下一阶段发挥关键作用。
移动设备,如智能手机和平板电脑,现在配备了高分辨率相机,功能强大的处理器和智能传感器,可以帮助Spring Mobile Vision应用。 谷歌的Tango项目是令人兴奋的移动视觉技术的完全实现的例子。 它显示该区域的完整三维结构,指向该区域周围的平板电脑! 如此强大的Mobile Vision API将有助于开发使用实时可视化技术可视化可视化数据的高配置应用程序。
移动视觉技术:随时随地了解视觉世界!
许多公司使用移动视觉技术,这些技术适用于移动设备,而不是PC,GPU或硬盘驱动器。 这不仅有助于他们在旅途中解读视觉世界,而且还支持商业模式的灵活性。
什么是Android Mobile Vision API?
有没有想过如何检测Android设备上的脸部,QR码或条形码? 如是; 您可能听说过或使用过FaceDetector。 Android框架的Face API,或OpenCV SDK,或者您可能选择了基于云的解决方案,如Cloud Vision API,它向Web服务器发出请求,获取扫描结果。 但是这个新的Android Mobile Vision API不会向Web服务器发出任何请求。 相反,它会在设备上执行实时图像/视频扫描。 虽然这可能听起来有点无效,但事实并非如此。 Mobile Vision API非常高效,并通过Google Play Services SDK深入集成到Android系统中。 这使得该API比所有其他解决方案更具优势,因为作为开发人员,您无需集成任何第三方SDK来执行媒体分析。 您可能需要做的就是正确整合Google Play服务并开始构建它。 Android Mobile Vision API截至目前执行三种类型的图像/流检测,如下一节所示。
人脸识别使用Mobile Vision API:人脸识别是一种高级API,旨在检测图像和视频中的人脸以进行编辑。 这种智能API甚至可以识别具有不同方向的面部。 此外,还可以在面部部位上找到特定的特征,例如眼睛,鼻子和嘴巴。
Android上的人脸检测
这是最强大的API,因为它具有人脸检测它是适用于任何脸部过滤器或相机应用程序的非常适合的API,因为它在下载包后对设备本身执行分析。 有趣的是,它不仅可以识别脸部,还可以提取脸部的脸部特征,包括眼睛的鼻子和嘴巴等。由于此API目前不支持脸部识别,因此无法识别两个脸部之间的相似性,但仍然可以对 如果眼睛是否开放的特征。 Mobile Vision Face Detection API支持的功能包括:
地标检测:Face API根据地标了解人脸。 通过此API扫描面部时,它会通过地标识别该面部。 简单来说,面部标志是:鼻子,嘴巴,左眼和右眼等。通过使用此API,您实际上可以提取所有这些地标的位置。
分类:此API不仅可以扫描面部,还可以应用一些基本逻辑并识别扫描面部的某些特征。 对于前者 通过此功能,我们可以了解脸部是否睁开眼睛。 此外,我们可以找出那张脸上笑容的概率。
跟踪:这是此API最有趣的功能,您可以通过此API实际跟踪视频序列中的人脸。 Mobile Vision API的此功能可用于识别和跟踪视频中的面部。 再一次,这不是面部识别的应用,而是通过视频中特定面部的移动来跟踪面部。
使用Mobile Vision API进行条形码检测:这是另一个令人兴奋的Mobile Vision API,可以快速,轻松地读取和解码各种条形码类型。 条形码类是一个可识别的条形码及其对应的值。
Android上的条形码和QR码扫描
使用这种用于条形码的Mobile Vision API非常简单,即使支持的格式如此之多。 您需要做的就是编写大约10行代码来解析条形码或QR码。 关于这个API最有趣的事情之一是它还解析它正在扫描的条形码/ QR码的类型。 有关扫描条形码或QR码类型的所有信息都可在扫描条形码旁边的条形码对象的valueFormat字段中找到。
使用Mobile Vision API进行文本识别:此API可用于检测图像和视频流中的文本,然后在设备上实时识别其中存在的文本。
无可否认,Mobile Vision的强大功能可以成为贵公司发展和转型的跳板。 因此,让我们继续讨论terra incognita,并观察视觉对象的强大搜索和描述。