OpenCV-Python使用分水嶺算法實現圖像的分割與提取
隨著當今世界的發展,計算機視覺技術的應用越來越廣泛。伴隨著硬件設備的不斷升級,構造復雜的計算機視覺應用變得越來越容易瞭。OpenCV像是一個黑盒,讓我們專註於視覺應用的開發,而不必過多的關註基礎圖象處理的具體細節。
圖像分割
瞭解分水嶺算法之前,我們需要瞭解什麼是圖像的分割。
在圖像的處理過程中,經常需要從圖像中將前景對象作為目標圖像分割或者提取出來。例如,在視頻監控中,觀測到的是固定背景下的視頻內容,而我們對背景本身並無興趣,感興趣的是背景中出現的車輛,行人或者其他對象。我們希望將這些對象從視頻中提取出來,而忽略那些沒有對象進入背景的視頻內容。
分水嶺算法
圖像分割是圖像處理過程中一種非常重要的操作。分水嶺算法將圖像形象地比喻為地理學上的地形表面,實現圖像分割,該算法非常有用。
下面,博主對分水嶺算法的相關內容做簡單的介紹。(詳細可以參考岡薩雷斯的《數字圖像處理》一書)
任何一副灰度圖像,都可以被看作是地理學上的地形表面,灰度值越高的區域可以被看成是山峰,灰度值越低的區域可以被看成是山谷。
如果我們向每個山谷中灌註不同顏色的水。那麼隨著水位的不斷升高,不同山谷的水就匯聚到一起。在這個過程中,為瞭防止不同山谷的水交匯,我們需要在水流可能匯合的地方構建堤壩。該過程將圖像分為兩個不同的集合:集水盆地和分水嶺線。我們構建的堤壩就是分水嶺線,也即對原始圖像的分割。這就是分水嶺算法的原理。
不過,一般的圖像都存在著噪聲,采用分水嶺算法時,會經常得到過度分割的結果。為瞭改善圖像分割的效果,人們提出瞭基於掩摸的改進的分水嶺算法。改進的分水嶺算法允許用戶將它認為是同一個分割區域的部分標註出來。這樣,分水嶺算法在處理時,就會將標註的部分處理為同一個分割區域。
如果對於該理論不怎麼瞭解,可以使用軟件PowerPoint中的“刪除背景”功能進行觀察配合理解。
waterShed函數
在OpenCV中,可以使用函數cv2.watershed()函數實現分水嶺算法。不過,具體實現的過程,還需要借助形態學函數,距離變換函數cv2.distanceTransform(),cv2.connectedComponents()來完成圖像分割。
形態學分割
在使用分水嶺算法之前,我們需要對圖像進行簡單的形態學處理。一般情況下,我們都是使用形態學中的開運算,因為開運算是先腐蝕後膨脹的操作,能夠去除圖像內的噪聲。
import cv2 import numpy as np import matplotlib.pyplot as plt img = cv2.imread("36.jpg") k=np.ones((5,5),dtype=np.uint8) e=cv2.erode(img,k) result=cv2.subtract(img,e) plt.subplot(131) plt.imshow(img, cmap="gray") plt.axis('off') plt.subplot(132) plt.imshow(e, cmap="gray") plt.axis('off') plt.subplot(133) plt.imshow(result, cmap="gray") plt.axis('off') plt.show()
回顧一下,我們前面的開運算函數為cv2.erode(),這裡我們首先經過開運算去除噪聲。然後減法運算cv2.subtract()獲取圖像邊界。運行之後,效果如下:
distanceTransform函數
當圖像內的各個子圖沒有連接時,可以直接使用形態學的腐蝕操作確定前景對象,但是如果圖像內的子圖連接在一起時,就很難確定前景對象瞭。這個時候,就需要借助變換函數cv2.distanceTransform()方便地將前景對象提取出來。
cv2.distanceTransform()反應瞭各個像素點與背景(值為0的像素點)的距離關系。通常情況下:
- 如果前景對象的中心距離值為0的像素點距離較遠,會得到一個較大的值。
- 如果前景對象的邊緣距離值為0的像素點較近,會得到一個較小的值。
下面,我們來使用該函數確定一副圖像的前景,並觀察效果。
import cv2 import numpy as np import matplotlib.pyplot as plt img = cv2.imread("36.jpg") gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) k = np.ones((5, 5), dtype=np.uint8) opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, k, iterations=2) distTransform = cv2.distanceTransform(opening, cv2.DIST_L2, 5) ret, fore = cv2.threshold(distTransform, 0.7 * distTransform.max(), 255, 0) plt.subplot(131) plt.imshow(img, cmap="gray") plt.axis('off') plt.subplot(132) plt.imshow(distTransform, cmap="gray") plt.axis('off') plt.subplot(133) plt.imshow(fore, cmap="gray") plt.axis('off') plt.show()
這裡,我們使用cv2.morphologyEx函數進行開運算,同時使用cv2.distanceTransform得到距離圖像,最後在通過cv2.threshold對距離圖像進行閾值處理,確定前景。運行之後,效果如下:
確定未知區域
通過距離函數,我們獲取到瞭圖像的“中心”,也就是“確定前景”。為瞭方便後續的講解,我們將確定前景稱為F。
圖像中有瞭確定前景F和確定背景B,剩下的區域就是未知區域UN瞭。這部分區域正是分水嶺算法要進一步明確的區域。
針對一副圖像0,通過以下關系能夠得到未知區域UN:
未知區域UN=圖像0-確定背景B-確定前景F
由上述公式變換得到:
未知區域UN=(圖像0-確定背景B)-確定前景F
其中(圖像0-確定背景B)就是我們開始的減法操作,通過形態學膨脹得到。也隻需要將上面的代碼添加4行並更改顯示的代碼內容:
bg=cv2.dilate(opening,k,iterations=3) fore=np.uint8(fore) un=cv2.subtract(bg,fore) plt.subplot(221) plt.imshow(img, cmap="gray") plt.axis('off') plt.subplot(222) plt.imshow(bg, cmap="gray") plt.axis('off') plt.subplot(223) plt.imshow(fore, cmap="gray") plt.axis('off') plt.subplot(224) plt.imshow(un, cmap="gray") plt.axis('off') plt.show()
運行之後,效果如下:
左上為原圖
右上為原圖膨脹後得到的圖像bg,其背景圖像是確定背景B。前景圖像是“原始圖像0-確定背景B”
左下為確定前景圖像fore
右下為未知區域圖像UN
ConnectedComponents函數
明確瞭確定前景後,就可以對確定前景進行標註瞭。在OpenCV中,它提供瞭cv2.ConnectedComponents()函數進行標註。
該函數會將背景標註為0,將其他的對象使用從1開始的正整數標註。它隻有一個參數8位單通道的待標註圖像。
返回值有兩個:retval為返回的標註數量,labels為標註的結果圖像。
下面,我們來使用該函數進行標註。代碼如下(同樣更改上面bg下面代碼就行):
bg = cv2.dilate(opening, k, iterations=3) fore = np.uint8(fore) ret, markets = cv2.connectedComponents(fore) unknown=cv2.subtract(bg,fore) markets=markets+1 markets[unknown==255]=0 plt.subplot(131) plt.imshow(img, cmap="gray") plt.axis('off') plt.subplot(132) plt.imshow(fore, cmap="gray") plt.axis('off') plt.subplot(133) plt.imshow(markets, cmap="gray") plt.axis('off') plt.show()
修改上面fore = np.uint8(fore)的代碼,並修改輸出內容。運行之後,我們會得到原圖,前景圖像的中心點圖像fore以及標註後的結果圖像markets。效果如下:
實戰分水嶺算法
經過前文的介紹,我們瞭解瞭使用分水嶺算法進行圖像分割的基本步驟:
- 通過形態學開運算對原始圖像0進行去噪
- 通過腐蝕操作獲取“確定背景B”。需要註意,這裡得到“原始圖像-確定背景”即可
- 利用距離變換函數對原始圖像進行運算,並對其進行閾值處理,得到“確定前景F”
- 計算未知區域UN(UN=0-B-F)
- 利用函數cv2.connectedComponents()對原始圖像0進行標註
- 對函數cv2.connectedComponents()的標註結果進行修正
- 使用分水嶺函數完成圖像分割
完整代碼如下:
import cv2 import numpy as np import matplotlib.pyplot as plt img = cv2.imread("36.jpg") plt.subplot(121) plt.imshow(img, cmap="gray") plt.axis('off') gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) ret, thresh = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY_INV + cv2.THRESH_OTSU) k = np.ones((5, 5), dtype=np.uint8) opening = cv2.morphologyEx(thresh, cv2.MORPH_OPEN, k, iterations=2) distTransform = cv2.distanceTransform(opening, cv2.DIST_L2, 5) ret, fore = cv2.threshold(distTransform, 0.2 * distTransform.max(), 255, 0) bg = cv2.dilate(opening, k, iterations=3) fore = np.uint8(fore) ret, markets = cv2.connectedComponents(fore) unknown = cv2.subtract(bg, fore) markets = markets + 1 markets[unknown == 255] = 0 markets = cv2.watershed(img, markets) img[markets == -1] = [255, 0, 0] plt.subplot(122) plt.imshow(img, cmap="gray") plt.axis('off') plt.show()
運行之後,我們就可以得到分割的圖像:
當然,參數可以調整,可以看到大致的硬幣被完整的分割出來瞭。
到此這篇關於OpenCV-Python使用分水嶺算法實現圖像的分割與提取的文章就介紹到這瞭,更多相關OpenCV圖像分割與提取內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- python中的opencv 圖像分割與提取
- C++中實現OpenCV圖像分割與分水嶺算法
- python OpenCV圖像直方圖處理
- OpenCV學習之圖像的分割與修復詳解
- opencv python簡易文檔之圖像處理算法