Python 第三方opencv庫實現圖像分割處理
前言
所需要安裝的庫有:
pip install opencv-python
pip install matplotlib
Python接口幫助文檔網址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html
本文所用到的圖片素材:
首先,導入所用到的庫:
import cv2 import os,shutil from matplotlib import pyplot as plt
1.加載圖片
註意:這裡在傳入圖像路徑時,路徑中不能包含有中文名,否則會報錯!!!
###1,加載圖片 filepath = './testImage.png' ###圖像路徑,註意:這裡的路徑不能包含有中文名 img = cv2.imread(filepath) cv2.imshow('Orignal img', img) ###顯示圖片 cv2.waitKey(0) ###防止一閃而過,是一個鍵盤綁定函數(0表示按下任意鍵終止)
2.對圖片做灰度處理
###2,將彩色圖片變為灰色(進行灰度處理) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) cv2.imshow('img_gray', img_gray) cv2.waitKey(0)
3.對圖片做二值化處理
thresh=220是自定義設定的閾值(通過分析print(img_gray)的圖像數據大概得到的),像素值大於220被置成瞭0,小於220的被置成瞭255。
maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 閾值一起使用的最大值,可理解是填充色,范圍為(0~255)。
type:參數類型閾值類型( cv2.THRESH_BINARY 大於閾值的部分被置為255,小於部分被置為0(黑白二值) cv2.THRESH_BINARY_INV 大於閾值部分被置為0,小於部分被置為255(黑白二值反轉——白黑) 等其它的類型…… )
###3,將圖片做二值化處理 ''' thresh=220是自定義設定的閾值(通過分析print(img_gray)的圖像數據大概得到的),像素值大於220被置成瞭0,小於220的被置成瞭255 maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 閾值一起使用的最大值,可理解是填充色,范圍為(0~255)。 type:參數類型閾值類型( cv2.THRESH_BINARY 大於閾值的部分被置為255,小於部分被置為0(黑白二值) cv2.THRESH_BINARY_INV 大於閾值部分被置為0,小於部分被置為255(黑白二值反轉——白黑) 等其它的類型...... ) ''' ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV) cv2.imshow('img_inv', img_inv) cv2.waitKey(0)
3.1.自定義閾值
###閾值對比(全局閾值(v = 127),自適應平均閾值,自適應高斯閾值) def threshContrast(): filepath = './testImage.png' img = cv2.imread(filepath) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img_gray = cv2.medianBlur(img_gray, 5) ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY) th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2) th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2) title = ['原始圖像(灰度)','全局閾值(v = 127)','自適應平均閾值','自適應高斯閾值'] images = [img_gray, th1, th2, th3] for i in range(4): plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray') # plt.title(title[i]) ###plt繪圖時不能使用中文 plt.xticks([]), plt.yticks([]) plt.show()
4.提取輪廓
img_inv是尋找輪廓的圖像;
- cv2.RETR_EXTERNAL:表示隻檢索極端外部輪廓;
- cv2.CHAIN_APPROX_SIMPLE:壓縮水平, 垂直和對角線方向的元素,隻保留它們的端點坐標,例如,一個直立的矩形輪廓用 4 個點進行編碼。
###4,提取輪廓 ''' https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html img_inv是尋找輪廓的圖像; cv2.RETR_EXTERNAL:表示隻檢索極端外部輪廓; cv2.CHAIN_APPROX_SIMPLE:壓縮水平, 垂直和對角線方向的元素,隻保留它們的端點坐標,例如,一個直立的矩形輪廓用 4 個點進行編碼。 ''' contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) print(f'檢測出輪廓數量有:{len(contours)}個') print('返回值為各層輪廓的索引:\n', hierarchy)
5.對輪廓畫矩形框
###5,找出每一個輪廓繪畫出的矩形位置 br = [] cntid = 0 for cnt in contours: '''cnt表示輸入的輪廓值,x,y, w, h 分別表示外接矩形的x軸和y軸的坐標,以及矩形的w寬和h高,''' x, y, w, h = cv2.boundingRect(cnt) cntid += 1 print(f'檢測出第{cntid}個輪廓畫出的矩形位置為:x={x},y={y},w={w},h={h}') br.append(cv2.boundingRect(cnt)) '''img表示輸入的需要畫的圖片(這裡就是在原圖上繪制輪廓),cnt表示輸入的輪廓值,-1表示contours中輪廓的索引(這裡繪制所有的輪廓),(0, 0, 255)表示rgb顏色——紅色,2表示線條粗細''' cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2) cv2.imshow('cnt', img) cv2.waitKey(0) br.sort() ###將列表中的每一個元組裡面的進行升序排序(這裡其實想的是按照對應的x軸坐標進行升序)
對每個字符畫輪廓的過程(順序從右到左畫,期間也有可能斷續,如下圖)。
6.分割圖片並保存
###6,分割圖片並保存(這裡對前面處理過的二值化圖片數據(img_inv)進行分割) if not os.path.exists('./imageSplit'): os.mkdir('./imageSplit') else: shutil.rmtree('./imageSplit') os.mkdir('./imageSplit') for x,y,w,h in br: # print(x,y,w,h) # split_image = img_inv[y:y + h, x:x + w] split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###這樣分割感覺好看些 cv2.imshow('split_image', split_image) cv2.waitKey(0) save_filepath = './imageSplit/' filename = f'{x}.jpg' ###這裡由每張圖片對應的x軸坐標命名 cv2.imwrite(save_filepath + filename, split_image) print(f'\033[31m{filename}圖片分割完畢!\033[0m')
這裡是對前面處理過的二值化圖片數據(img_inv)進行一個一個字符分割展示的過程。
這裡是這行代碼的意思,下面的圖是手動繪制的,太醜瞭,哈哈哈!!!
# split_image = img_inv[y:y + h, x:x + w]
7.查看分割圖片
最後,我們在pyplot上來查看我們分割圖片後的效果,也就終於完成瞭。
###7,用pyplot來查看我們分割完成後的圖片 imagefile_list = os.listdir('./imageSplit') imagefile_list.sort(key=lambda x: int(x[:-4])) for i in range(len(imagefile_list)): img = cv2.imread(f'./imageSplit/{imagefile_list[i]}') plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray') plt.title(imagefile_list[i]) plt.xticks([]), plt.yticks([]) plt.show()
8.完整代碼
import cv2 import os,shutil from matplotlib import pyplot as plt ''' 這是使用文檔網址:https://docs.opencv.org/4.5.2/index.html 這是提供的Python接口教程網址:https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html ''' def imageSplit(): ###1,加載圖片 filepath = './testImage.png' ###圖像路徑,註意:這裡的路徑不能包含有中文名 img = cv2.imread(filepath) cv2.imshow('Orignal img', img) ###顯示圖片 cv2.waitKey(0) ###防止一閃而過,是一個鍵盤綁定函數(0表示按下任意鍵終止) ###2,將彩色圖片變為灰色(進行灰度處理) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) cv2.imshow('img_gray', img_gray) cv2.waitKey(0) ###3,將圖片做二值化處理 ''' thresh=220是自定義設定的閾值(通過分析print(img_gray)的圖像數據大概得到的),像素值大於220被置成瞭0,小於220的被置成瞭255 maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 閾值一起使用的最大值,可理解是填充色,范圍為(0~255)。 type:參數類型閾值類型( cv2.THRESH_BINARY 大於閾值的部分被置為255,小於部分被置為0(黑白二值) cv2.THRESH_BINARY_INV 大於閾值部分被置為0,小於部分被置為255(黑白二值反轉——白黑) 等其它的類型...... ) ''' ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV) cv2.imshow('img_inv', img_inv) cv2.waitKey(0) ###4,提取輪廓 ''' https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html img_inv是尋找輪廓的圖像; cv2.RETR_EXTERNAL:表示隻檢索極端外部輪廓; cv2.CHAIN_APPROX_SIMPLE:壓縮水平, 垂直和對角線方向的元素,隻保留它們的端點坐標,例如,一個直立的矩形輪廓用 4 個點進行編碼。 ''' contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) print(f'檢測出輪廓數量有:{len(contours)}個') print('返回值為各層輪廓的索引:\n', hierarchy) ###5,找出每一個輪廓繪畫出的矩形位置 br = [] cntid = 0 for cnt in contours: '''cnt表示輸入的輪廓值,x,y, w, h 分別表示外接矩形的x軸和y軸的坐標,以及矩形的w寬和h高,''' x, y, w, h = cv2.boundingRect(cnt) cntid += 1 print(f'檢測出第{cntid}個輪廓畫出的矩形位置為:x={x},y={y},w={w},h={h}') br.append(cv2.boundingRect(cnt)) '''img表示輸入的需要畫的圖片(這裡就是在原圖上繪制輪廓),cnt表示輸入的輪廓值,-1表示contours中輪廓的索引(這裡繪制所有的輪廓),(0, 0, 255)表示rgb顏色——紅色,2表示線條粗細''' cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2) cv2.imshow('cnt', img) cv2.waitKey(0) br.sort() ###將列表中的每一個元組裡面的進行升序排序(這裡其實想的是按照對應的x軸坐標進行升序) ###6,分割圖片並保存(這裡對前面處理過的二值化圖片數據(img_inv)進行分割) if not os.path.exists('./imageSplit'): os.mkdir('./imageSplit') else: shutil.rmtree('./imageSplit') os.mkdir('./imageSplit') for x,y,w,h in br: # print(x,y,w,h) # split_image = img_inv[y:y + h, x:x + w] split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2] ###這樣分割感覺好看些 cv2.imshow('split_image', split_image) cv2.waitKey(0) save_filepath = './imageSplit/' filename = f'{x}.jpg' ###這裡由每張圖片對應的x軸坐標命名 cv2.imwrite(save_filepath + filename, split_image) print(f'\033[31m{filename}圖片分割完畢!\033[0m') cv2.destroyAllWindows() ###刪除所有窗口 ###7,用pyplot來查看我們分割完成後的圖片 imagefile_list = os.listdir('./imageSplit') imagefile_list.sort(key=lambda x: int(x[:-4])) for i in range(len(imagefile_list)): img = cv2.imread(f'./imageSplit/{imagefile_list[i]}') plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray') plt.title(imagefile_list[i]) plt.xticks([]), plt.yticks([]) plt.show() print('\nperfect!!!') ###閾值對比(全局閾值(v = 127),自適應平均閾值,自適應高斯閾值) def threshContrast(): filepath = './testImage.png' img = cv2.imread(filepath) img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) img_gray = cv2.medianBlur(img_gray, 5) ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY) th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2) th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2) title = ['原始圖像(灰度)','全局閾值(v = 127)','自適應平均閾值','自適應高斯閾值'] images = [img_gray, th1, th2, th3] for i in range(4): plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray') # plt.title(title[i]) ###plt繪圖時不能使用中文 plt.xticks([]), plt.yticks([]) plt.show() if __name__ == '__main__': imageSplit() ###閾值對比 # threshContrast()
到此這篇關於Python 第三方opencv庫實現圖像分割處理的文章就介紹到這瞭,更多相關python圖片處理內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!