詳解Python OpenCV圖像分割算法的實現
前言
圖像分割是指根據灰度、色彩、空間紋理、幾何形狀等特征把圖像劃分成若幹個互不相交的區域。
最簡單的圖像分割就是將物體從背景中分割出來
1.圖像二值化
cv2.threshold是opencv-python中的圖像二值化方法,可以實現簡單的分割功能。
retval, dst = cv2.threshold(src, thresh, maxval, thresholdType[, dst])
•src:原圖像,要求必須是灰度圖像
•dst:結果圖像
•thresh:閾值
•maxVal:結果圖中像素最大值
•thresholdType:二值化類型
然而,threshold用法,有兩個問題:
問題一:
•根據全圖統一的閾值對像素進行判斷,並非在所有情況下效果都好
•例如,如果圖像在不同區域具有不同的光照條件
問題二:
•閾值需要手動設定,不同的圖片合適的閾值可能不同,更換圖片可能就需要調整代碼
針對於全圖統一閾值的問題,可以使用自適應閾值分割法
•自適應閾值分割算法基於像素周圍的局部區域確定像素的閾值
•同一圖像的不同區域具有不同的閾值
•為光照變化的圖像提供更好的分割效果
2.自適應閾值分割算法
dst= cv2.adaptiveThreshold(src, maxValue, adaptiveMethod,thresholdType, blockSize, C, dst=None)
參數解釋如下:
•src:原圖像,它必須是灰度圖像
•maxValue:結果圖中像素的最大值,一般設置為255
•adaptiveMethod:閾值的計算方法,包括以下兩種計算方式:
•thresholdType:二值化方式,例如cv2.THRESH_BINARY、cv2.THRESH_TRUNC、
cv2.THRESH_TOZERO等
•blockSize:局部區域的大小
•C:閾值計算中減去的常數
缺點:blockSize要手動指定,但物體的大小有差異
3.Otsu閾值分割算法
自動根據圖像內容計算閾值:
- Otsu閾值分割算法
- 大津法
- 直方圖技術
retval, dst = cv2.threshold(src, thresh, maxval, thresholdType[, dst])
參數解釋如下:
- src:原圖像,要求必須是灰度圖像
- dst:結果圖像
- thresh:閾值(無作用)
- maxVal:像素灰度最大值
- thresholdType:閾值類型,在原有參數值基礎上多傳遞一個參數值,即cv2.THRESH_OTSU
- 比如cv2.THRESH_BINARY+cv2.THRESH_OTSU
利用固定閾值算法進行分割,適用的圖片較為局限
同一個閾值,在一些圖像上表現好,在其他圖片上效果不佳
如:
利用Otsu閾值算法進行分割,適用的圖片范圍較廣
對每張圖片,Otsu閾值算法自動找到針對性的閾值
如:
4.基於輪廓的字符分離
分割步驟
1. 檢測出圖像中字符的輪廓
2. 得到每一條輪廓的包圍框,根據包圍框坐標提取ROI
4.1輪廓檢測
contours, hierarchy = cv2.findContours(image, mode, method)
參數解釋如下:
contours:返回的輪廓列表,每條輪廓包含構成這條輪廓上的一系列點的坐標
hierarchy:輪廓之間的層級關系
image:原始圖像,需要是二值圖
mode:輪廓的檢索模式
method:輪廓的近似辦法
4.2輪廓繪制
cv2.drawContours(image, contours, contourIdx, color, thickness)
- image:指定在哪張圖片上繪制輪廓
- contours:輪廓列表
- contourIdx:定繪制輪廓list中的哪條輪廓,如果是-1,則繪制其中的所有輪廓
- color:輪廓顏色
- thickness(可選):輪廓寬度
import cv2 img=cv2.imread("D:\\desk\\images\\car_license\\test1.png") #去噪 image=cv2.GaussianBlur(img,(3,3),0) #轉為灰度圖 gray1 = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) #Ostu閾值分割 ret, th1 = cv2.threshold(gray1, 127,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) '''輪廓檢測與繪制''' #檢測輪廓(外輪廓) th1=cv2.dilate(th1,None) #膨脹,保證同一個字符隻有一個外輪廓 contours,hierarchy=cv2.findContours(th1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) #輪廓可視化 th1_bgr=cv2.cvtColor(th1,cv2.COLOR_GRAY2BGR) #轉為三通道圖 cv2.drawContours(th1_bgr,contours,-1,(0,0,255),2) #輪廓可視化 cv2.imshow("th1_bgr",th1_bgr) cv2.waitKey()
4.3包圍框獲取
rect= cv2.boundingRect(points)
- points:一系列點的坐標
- rect:能夠包圍住這些點的最小外接矩形信息,格式為(x,y,width,height)
4.4矩形繪制
cv2.rectangle(img, pt1, pt2, color[, thickness)
- img:指定要繪制的圖片
- pt1:矩形的某個頂點的坐標
- pt2:和pt1相對的頂點坐標
- color:矩形的顏色
- thickness(可選):矩形輪廓的寬度
基於輪廓的字符分離完整代碼如下:
import cv2 img=cv2.imread("D:\\desk\\images\\car_license\\test1.png") #去噪 image=cv2.GaussianBlur(img,(3,3),0) #轉為灰度圖 gray1 = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) #Ostu閾值分割 ret, th1 = cv2.threshold(gray1, 127,255,cv2.THRESH_BINARY+cv2.THRESH_OTSU) '''輪廓檢測與繪制''' #檢測輪廓(外輪廓) th1=cv2.dilate(th1,None) #膨脹,保證同一個字符隻有一個外輪廓 contours,hierarchy=cv2.findContours(th1,cv2.RETR_EXTERNAL,cv2.CHAIN_APPROX_SIMPLE) #輪廓可視化 th1_bgr=cv2.cvtColor(th1,cv2.COLOR_GRAY2BGR) #轉為三通道圖 # cv2.drawContours(th1_bgr,contours,-1,(0,0,255),2) #輪廓可視化 '''包圍框獲取''' words=[] #保存包圍框信息 height,width=th1.shape for contour in contours: #對於每一條輪廓 rest=cv2.boundingRect(contour) #得到這條輪廓的外接矩陣 #隻有高寬比在1.5到3.5之間,且高 度比圖片高度大於0.3的矩陣才保留 if rest[3]/rest[2]>1.5 and rest[3]/rest[2]<3.5 and rest[3]/height>0.3: words.append(rest) #將當前矩形加入矩形列表 cv2.rectangle(th1_bgr,(rest[0],rest[1]),(rest[0]+rest[2],rest[1]+rest[3]),(0,0,255),3) #繪制矩形 #顯示 # cv2.imshow("img",img) cv2.imshow("th1",th1) cv2.imshow("th1_bgr",th1_bgr) cv2.waitKey()
以上就是詳解Python OpenCV圖像分割算法的實現的詳細內容,更多關於OpenCV圖像分割算法的資料請關註WalkonNet其它相關文章!
推薦閱讀:
- OpenCV圖像輪廓的繪制方法
- python OpenCV圖像金字塔
- OpenCV-Python實現輪廓擬合
- Python OpenCV 基於圖像邊緣提取的輪廓發現函數
- Python使用Opencv實現邊緣檢測以及輪廓檢測的實現