詳解Python OpenCV圖像分割算法的實現

前言

圖像分割是指根據灰度、色彩、空間紋理、幾何形狀等特征把圖像劃分成若幹個互不相交的區域。

最簡單的圖像分割就是將物體從背景中分割出來

1.圖像二值化

cv2.threshold是opencv-python中的圖像二值化方法,可以實現簡單的分割功能。

retval, dst = cv2.threshold(src, thresh, maxval, thresholdType[, dst])

•src:原圖像,要求必須是灰度圖像

•dst:結果圖像

•thresh:閾值

•maxVal:結果圖中像素最大值

•thresholdType:二值化類型

然而,threshold用法,有兩個問題:

問題一:

•根據全圖統一的閾值對像素進行判斷,並非在所有情況下效果都好

•例如,如果圖像在不同區域具有不同的光照條件

問題二:

•閾值需要手動設定,不同的圖片合適的閾值可能不同,更換圖片可能就需要調整代碼

針對於全圖統一閾值的問題,可以使用自適應閾值分割法

•自適應閾值分割算法基於像素周圍的局部區域確定像素的閾值

•同一圖像的不同區域具有不同的閾值

•為光照變化的圖像提供更好的分割效果

2.自適應閾值分割算法

dst= cv2.adaptiveThreshold(src, maxValue, adaptiveMethod,thresholdType, blockSize, C, dst=None)

參數解釋如下:

•src:原圖像,它必須是灰度圖像

•maxValue:結果圖中像素的最大值,一般設置為255

•adaptiveMethod:閾值的計算方法,包括以下兩種計算方式:

•thresholdType:二值化方式,例如cv2.THRESH_BINARY、cv2.THRESH_TRUNC、

cv2.THRESH_TOZERO等

•blockSize:局部區域的大小

•C:閾值計算中減去的常數

缺點:blockSize要手動指定,但物體的大小有差異

3.Otsu閾值分割算法

自動根據圖像內容計算閾值:

  • Otsu閾值分割算法
  • 大津法
  • 直方圖技術

retval, dst = cv2.threshold(src, thresh, maxval, thresholdType[, dst])

參數解釋如下:

  • src:原圖像,要求必須是灰度圖像
  • dst:結果圖像
  • thresh:閾值(無作用)
  • maxVal:像素灰度最大值
  • thresholdType:閾值類型,在原有參數值基礎上多傳遞一個參數值,即cv2.THRESH_OTSU
  • 比如cv2.THRESH_BINARY+cv2.THRESH_OTSU

利用固定閾值算法進行分割,適用的圖片較為局限

同一個閾值,在一些圖像上表現好,在其他圖片上效果不佳

如:

利用Otsu閾值算法進行分割,適用的圖片范圍較廣

對每張圖片,Otsu閾值算法自動找到針對性的閾值

如:

4.基於輪廓的字符分離

分割步驟

1. 檢測出圖像中字符的輪廓

2. 得到每一條輪廓的包圍框,根據包圍框坐標提取ROI

4.1輪廓檢測

contours, hierarchy = cv2.findContours(image, mode, method)

參數解釋如下:

contours:返回的輪廓列表,每條輪廓包含構成這條輪廓上的一系列點的坐標

hierarchy:輪廓之間的層級關系

image:原始圖像,需要是二值圖

mode:輪廓的檢索模式

method:輪廓的近似辦法

 4.2輪廓繪制

cv2.drawContours(image, contours, contourIdx, color, thickness)

  • image:指定在哪張圖片上繪制輪廓
  • contours:輪廓列表
  • contourIdx:定繪制輪廓list中的哪條輪廓,如果是-1,則繪制其中的所有輪廓
  • color:輪廓顏色
  • thickness(可選):輪廓寬度
import cv2
img=cv2.imread("D:\\desk\\images\\car_license\\test1.png")
 
#去噪
image=cv2.GaussianBlur(img,(3,3),0)
 
#轉為灰度圖
gray1 = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
 
#Ostu閾值分割
ret, th1 = cv2.threshold(gray1, 127,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
 
'''輪廓檢測與繪制'''
#檢測輪廓(外輪廓)
th1=cv2.dilate(th1,None)      #膨脹,保證同一個字符隻有一個外輪廓
contours,hierarchy=cv2.findContours(th1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
 
#輪廓可視化
th1_bgr=cv2.cvtColor(th1,cv2.COLOR_GRAY2BGR)     #轉為三通道圖
 
cv2.drawContours(th1_bgr,contours,-1,(0,0,255),2)    #輪廓可視化
 
cv2.imshow("th1_bgr",th1_bgr)
 
cv2.waitKey()

4.3包圍框獲取

rect= cv2.boundingRect(points)

  • points:一系列點的坐標
  • rect:能夠包圍住這些點的最小外接矩形信息,格式為(x,y,width,height)

4.4矩形繪制 

cv2.rectangle(img, pt1, pt2, color[, thickness)

  • img:指定要繪制的圖片
  • pt1:矩形的某個頂點的坐標
  • pt2:和pt1相對的頂點坐標
  • color:矩形的顏色
  • thickness(可選):矩形輪廓的寬度

基於輪廓的字符分離完整代碼如下:

import cv2
img=cv2.imread("D:\\desk\\images\\car_license\\test1.png")
 
#去噪
image=cv2.GaussianBlur(img,(3,3),0)
 
#轉為灰度圖
gray1 = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
 
#Ostu閾值分割
ret, th1 = cv2.threshold(gray1, 127,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU)
 
'''輪廓檢測與繪制'''
#檢測輪廓(外輪廓)
th1=cv2.dilate(th1,None)      #膨脹,保證同一個字符隻有一個外輪廓
contours,hierarchy=cv2.findContours(th1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE)
 
#輪廓可視化
th1_bgr=cv2.cvtColor(th1,cv2.COLOR_GRAY2BGR)     #轉為三通道圖
 
# cv2.drawContours(th1_bgr,contours,-1,(0,0,255),2)    #輪廓可視化
 
'''包圍框獲取'''
words=[]         #保存包圍框信息
height,width=th1.shape
for contour in contours:     #對於每一條輪廓
    rest=cv2.boundingRect(contour)       #得到這條輪廓的外接矩陣
    #隻有高寬比在1.5到3.5之間,且高 度比圖片高度大於0.3的矩陣才保留
    if rest[3]/rest[2]>1.5 and rest[3]/rest[2]<3.5 and rest[3]/height>0.3:
        words.append(rest)         #將當前矩形加入矩形列表
        cv2.rectangle(th1_bgr,(rest[0],rest[1]),(rest[0]+rest[2],rest[1]+rest[3]),(0,0,255),3)    #繪制矩形
 
 
 
#顯示
# cv2.imshow("img",img)
cv2.imshow("th1",th1)
cv2.imshow("th1_bgr",th1_bgr)
 
cv2.waitKey()

以上就是詳解Python OpenCV圖像分割算法的實現的詳細內容,更多關於OpenCV圖像分割算法的資料請關註WalkonNet其它相關文章!

推薦閱讀: