每个图像是由一个个点组成的,而这些点可以表示为像素值的形式。

这篇博客里我们将学会:

  • 访问像素值并修改它们 。
  • 访问图像属性 。
  • 设置感兴趣区域(ROI) 。
  • 分割和合并图像。

对于图像的基本操作我们需要对numpy知识的了解,不需要很多,只知道基本用法即可。这里暂不赘述,读者可查阅其余资料进行学习。

让我们先加载彩色图像:

  1. import numpy as np
  2. import cv2 as cv
  3. img = cv.imread('cat.jpg')

我们可以通过行和列坐标来访问像素值。对于 BGR 图像,它返回一个由蓝色、绿色和红色值组成的数组。而如果是灰度图像的话,它只返回相应的灰度。我们也可以用相同的方式来对像素值进行修改。

  1. # 通过行和列坐标来访问像素值
  2. >>> px = img[100,100]
  3. >>> print( px )
  4. [157 166 200]
  5. # 修改像素值
  6. >>> img[100,100] = [255,255,255]
  7. >>> print( img[100,100] )
  8. [255 255 255]

 

Numpy是用于快速数组计算的优化库。因此,简单地访问每个像素值并对其进行修改将非常慢,因此不建议使用。对于单个像素访问,Numpy数组方法array.item()和array.itemset())被认为更好,但是它们始终返回标量。如果要访问所有B,G,R值,则需要分别调用所有的array.item()。

比如我们可以用下面的方法来进行像素的访问和编辑:

  1. # 访问 RED 值
  2. >>> img.item(10,10,2)
  3. 59
  4.  
  5. # 修改 RED 值
  6. >>> img.itemset((10,10,2),100)
  7. >>> img.item(10,10,2)
  8. 100

图像属性包括行数,列数,通道数,图像数据类型,像素数等等。

图像的形状可通过 img.shape 访问。它返回行,列和通道数的元组(如果图像是彩色的)

注意:如果图像是灰度的,则返回的元组仅包含行数和列数,因此这是检查加载的图像是灰度还是彩色的好方法。

  1. >>> print( img.shape )
  2. (342, 548, 3)

像素总数可通过访问 img.size :

  1. >>> print( img.size )
  2. 562248

图像数据类型通过 img.dtype 获得:

  1. >>> print( img.dtype )
  2. uint8

注意:img.dtype在调试时非常重要,因为OpenCV-Python代码中的大量错误是由无效的数据类型引起的。

有时候,我们不得不处理一些特定区域的图像。比如对于图像中的眼睛检测,首先对整个图像进行人脸检测。在获取人脸图像时,我们只选择人脸区域,搜索其中的眼睛,而不是搜索整个图像。它提高了准确性和性能。

这里我们直接使用numpy的切片即可,比如:

  1. >>> ROI = img[280:340, 330:390]

不规则形状的ROI区域的设置,我们将在以后的文章里再详细阐述。 

4.拆分和合并图像通道

有时我们需要分别处理图像的B,G,R通道。在这种情况下,我们需要将BGR图像拆分为单个通道。我们可以这样做:

  1. >>> b,g,r = cv.split(img) >>> img = cv.merge((b,g,r))

但是cv.split() 是一项耗时的操作(就时间而言)。因此,仅在必要时才这样做。我们一般采用Numpy索引的方法。比如我们要将所有的红色像素都设置为0:

  1. >>> img [:, :, 2] = 0

如果我们要在图像周围创建边框(如相框),那可以使用 cv.copyMakeBorder() 。它在以后对图像进行高级处理的时候,比如卷积运算,零填充等方面将有更多应用。此函数采用以下参数:

  • src – 输入图像
  • top,bottom,left,right 边界宽度(以相应方向上的像素数为单位)
  • borderType – 定义要添加哪种边框的标志。它可以是以下类型:
  • cv.BORDER_CONSTANT – 添加恒定的彩色边框。该值应作为下一个参数给出。
  • cv.BORDER_REFLECT – 边框将是边框元素的镜像,如下所示: fedcba | abcdefgh hgfedcb
  • **cv.BORDER_REFLECT_101**或 **cv.BORDER_DEFAULT**与上述相同,但略有变化,例如: gfedcb | abcdefgh | gfedcba
  • **cv.BORDER_REPLICATE**最后一个元素被复制,像这样: aaaaaa | abcdefgh | hhhhhhh
  • **cv.BORDER_WRAP**看起来像这样: cdefgh | abcdefgh | abcdefg
  • value -边框的颜色,如果边框类型为**cv.BORDER_CONSTANT**

下面我们来看一下各个边框类型在图片显示上的结果。注意因为图像是基于matplotlib一起显示的。所以红色和蓝色通道将会互换。

  1. import cv2 as cv
  2. import numpy as np
  3. from matplotlib import pyplot as plt
  4. BLUE = [255,0,0]
  5. img1 = cv.imread('opencv-logo.png')
  6. replicate = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REPLICATE)
  7. reflect = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT)
  8. reflect101 = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_REFLECT_101)
  9. wrap = cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_WRAP)
  10. constant= cv.copyMakeBorder(img1,10,10,10,10,cv.BORDER_CONSTANT,value=BLUE)
  11. plt.subplot(231),plt.imshow(img1,'gray'),plt.title('ORIGINAL')
  12. plt.subplot(232),plt.imshow(replicate,'gray'),plt.title('REPLICATE')
  13. plt.subplot(233),plt.imshow(reflect,'gray'),plt.title('REFLECT')
  14. plt.subplot(234),plt.imshow(reflect101,'gray'),plt.title('REFLECT_101')
  15. plt.subplot(235),plt.imshow(wrap,'gray'),plt.title('WRAP')
  16. plt.subplot(236),plt.imshow(constant,'gray'),plt.title('CONSTANT')
  17. plt.show()

结果如下:

 

 

 

 

 


版权声明:本文为huangs16原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://www.cnblogs.com/huangs16/p/15206901.html