Python OpenCV 針對圖像細節的不同操作技巧
本系列專欄寫作將采用首創的問答式寫作形式,快速讓你學習到 OpenCV 的初級、中級、高級知識。
6. 在 Python OpenCV 針對圖像細節的不同操作
本篇博客的目標將為你解釋一幅圖像的拆解,包括圖像像素的說明,圖像屬性信息的獲取與修改,
圖像目標區域 ROI 相關內容,以及圖像通道的知識(包括拆分通道和合並通道)
這些內容在知識結構上與 numpy
庫十分緊密,如果從學習的角度出發,建議你儲備一下 numpy
相關知識。
讀取修改圖像的像素值
在之前的博客中,我們已經學到瞭如何讀取一幅圖像,使用 cv2.imread
函數即可,並且掌握瞭該函數的兩個關鍵參數。
讀取圖片之後,我們可以直接使用操作數組的方式獲取圖像任意位置的顏色,一般這個顏色的默認順序是 BGR。
測試代碼如下:
import cv2 import matplotlib.pyplot as plt src = cv2.imread("./6_test.jpg") # 獲取 100 x 100 位置的像素值 print(src[100, 100]) cv2.imshow("src", src) cv2.waitKey()
這裡首先獲取 100 x 100 位置的像素值。
src[100,100]
會獲取到三個值,分別對應的 BGR 通道的值。我們在圖片上標記一個像素點,rows = 250,cols=470 ,接下來修改上述代碼,看獲取到的 BGR 值。
import cv2 import matplotlib.pyplot as plt src = cv2.imread("./6_test.jpg") # 註意獲取像素值的格式為 [cols,rows] print(src[250, 470]) cv2.imshow("src", src) cv2.waitKey()
上文特別註意的就是,獲取像素值的格式為 [cols,rows]
,列在前,行在後。
以上獲取到的是 BGR 值,也可以隻獲取單個通道的值,對應的代碼是 [cols,rows,channel]
,對應到代碼部分,如下所示:
# 獲取藍色通道值 print(src[250, 470, 0])
藍色通道對應 0,綠色通道為 1,紅色通道為 2,超出以上三個值,就會出現如下錯誤:
IndexError: index 3 is out of bounds for axis 2 with size 3
當前如果你直接讀取瞭灰度圖,例如下述代碼,三個通道的值是相同的。
import cv2 import matplotlib.pyplot as plt src = cv2.imread("./6_test.jpg", 0) # 註意獲取像素值的格式為 [cols,rows] print(src[250, 470]) cv2.imshow("src", src) cv2.waitKey()
這個地方還有一個編碼上存在的潛在問題,如果讀取的是四通道圖片,即圖片有透明度,那數組的索引值可以讀取到 3,也就是下述代碼是正確的。
import cv2 import matplotlib.pyplot as plt src = cv2.imread("./test.jpg", -1) # 註意獲取像素值的格式為 [cols,rows] print(src[250, 470, 3]) cv2.imshow("src", src) cv2.waitKey()
src[250, 470, 3]
成功讀取到瞭透明通道的值。
我們可以針對特定的像素點進行值的修改,例如下述代碼
import cv2 import matplotlib.pyplot as plt src = cv2.imread("./6_test.jpg") # 註意獲取像素值的格式為 [cols,rows] src[250, 470] = [255, 255, 255] cv2.imshow("src", src) cv2.waitKey()
註意下圖的紅色箭頭指向的位置,出現一個白色亮點,使用該辦法,可以制造出一個【椒鹽圖片】。
這個地方需要註意的一個潛在 BUG,讀取圖片的通道數,決定瞭你復制時數組元素個數,例如下述代碼將會報錯。
import cv2 import matplotlib.pyplot as plt src = cv2.imread("./6_test.jpg") # 註意獲取像素值的格式為 [cols,rows] src[250, 470] = [255, 255, 255, 255] cv2.imshow("src", src) cv2.waitKey()
錯誤信息都是類似的,提示數組維度不同。
ValueError: cannot copy sequence with size 4 to array axis with dimension 3
最後一點使用以上方式操作圖像的像素點,非常耗時,因為一張圖片的像素點數據是非常大的,一般情況下能用 numpy 集成好的方法,就不要用這種最笨拙的方式。
使用 numpy 獲取通道值,註意該方式獲取的是標量,如果你想獲得所有 BGR 的值,你需要使用 array.item()
依次獲取。
import cv2 import numpy as np src = cv2.imread("./6_test.jpg") print(src[100, 100]) b = src.item(100, 100, 0) g = src.item(100, 100, 1) r = src.item(100, 100, 2) print(b, g, r) cv2.imshow("src", src) cv2.waitKey()
如果希望設置該值,直接使用 itemset
函數即可。
src.itemset((100, 100, 0), 200) print(src[100, 100])
可以任意尋找一張圖片進行對應的測試,運行效果如下:
[ 31 68 118]
31 68 118
[200 68 118]
OpenCV 中圖像屬性常見問題解析
對於一幅圖像,除瞭像素矩陣以外,還有一個非常重要的內容,是圖像的屬性,這些包括行、列、通道、數據類型,像素數量、圖像形狀等內容。
例如,我們經常使用 img.shape
去獲取圖像的形狀,尤其註意的是,返回的內容是行數(rows),列數(cols),以及通道數(channels),並且返回值類型是一個元組。
如果你讀取圖像的時候,設置緊讀取灰度圖,那隻會返回行數和列數,相應的通過這個值很容易能判斷出你加載的圖像類型。
例如下述代碼,通過不同的方式讀取同一張圖片,輸出圖像的不同形狀。
import cv2 import numpy as np # 選擇一個 jpg 圖片,可以讀取到不同的通道 src1 = cv2.imread("./test.jpg", -1) src2 = cv2.imread("./test.jpg", 0) src3 = cv2.imread("./test.jpg") # 四通道,包含透明通道 print(src1.shape) # 灰度圖 print(src2.shape) # 三通道 print(src3.shape)
輸出結果可以快速的讀取出圖像是彩色圖像還是灰度圖像。
(397, 595, 4) (397, 595) (397, 595, 3)
使用 img.size
可以快速返回圖像中像素的合計數目,測試代碼如下:
# 選擇一個 jpg 圖片,可以讀取到不同的通道 src1 = cv2.imread("./test.jpg", -1) src2 = cv2.imread("./test.jpg", 0) src3 = cv2.imread("./test.jpg") # 四通道,包含透明通道 print(src1.shape) print(src1.size) # 灰度圖 print(src2.shape) print(src2.size) # 三通道 print(src3.shape) print(src3.size)
我們依舊三種不同的讀取方式,讀取到的像素數分別如下:
(397, 595, 4) 944860 (397, 595) 236215 (397, 595, 3) 708645
註意,灰度圖像和彩色圖像的像素數不同,它們之前存在如下關系。
灰度圖像的像素數 = 行數 x 列數 = 397 x 595 = 236215
彩色圖像的像素數 = 行數 x 列數 x 通道數 = 944860 (四通道)/ 708645(三通道)
使用 img.dtype
屬性可以獲取到圖像的類型,具體如下:
print(src1.dtype)
這裡讀取到的值,都是相同的 uint8
表示 8 位圖像,這裡可以記住隻要是 uint8
格式,那對應的 BGR 值的范圍就是在 [0,255]
之間。
在操作上述屬性值的時候,會出現如下 BUG,該 BUG 的通用解決方案是排查圖片是否正常讀取,需要特別註意下:
AttributeError: 'NoneType' object has no attribute 'shape'
print(src1.dtype)
這裡讀取到的值,都是相同的 uint8
表示 8 位圖像,這裡可以記住隻要是 uint8
格式,那對應的 BGR 值的范圍就是在 [0,255]
之間。
在操作上述屬性值的時候,會出現如下 BUG,該 BUG 的通用解決方案是排查圖片是否正常讀取,需要特別註意下:
AttributeError: 'NoneType' object has no attribute 'shape'
到此這篇關於Python OpenCV 針對圖像細節的不同操作的文章就介紹到這瞭,更多相關Python OpenCV圖像內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python計算機視覺OpenCV入門講解
- Python詳細講解圖像處理的而兩種庫OpenCV和Pillow
- OpenCV+Python幾何變換的實現示例
- pytho多張圖片的無損拼接的實現示例
- Python圖像運算之圖像點運算與灰度化處理詳解