Python 第三方opencv庫實現圖像分割處理

Posted on 2022-06-22 by WalkonNet

前言

所需要安裝的庫有：

pip install opencv-python

pip install matplotlib

Python接口幫助文檔網址：https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html

本文所用到的圖片素材：

首先，導入所用到的庫：

import cv2
import os,shutil
from matplotlib import pyplot as plt

1.加載圖片

註意：這裡在傳入圖像路徑時，路徑中不能包含有中文名，否則會報錯！！！

###1，加載圖片
filepath = './testImage.png'  ###圖像路徑，註意：這裡的路徑不能包含有中文名
img = cv2.imread(filepath)
cv2.imshow('Orignal img', img)  ###顯示圖片
cv2.waitKey(0) ###防止一閃而過，是一個鍵盤綁定函數（0表示按下任意鍵終止）

2.對圖片做灰度處理

###2，將彩色圖片變為灰色（進行灰度處理）
img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow('img_gray', img_gray)
cv2.waitKey(0)

3.對圖片做二值化處理

thresh=220是自定義設定的閾值(通過分析print(img_gray)的圖像數據大概得到的)，像素值大於220被置成瞭0，小於220的被置成瞭255。

maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 閾值一起使用的最大值，可理解是填充色，范圍為（0～255）。

type：參數類型閾值類型（ cv2.THRESH_BINARY 大於閾值的部分被置為255，小於部分被置為0（黑白二值） cv2.THRESH_BINARY_INV 大於閾值部分被置為0，小於部分被置為255（黑白二值反轉——白黑）等其它的類型…… ）

###3，將圖片做二值化處理
    '''
        thresh=220是自定義設定的閾值(通過分析print(img_gray)的圖像數據大概得到的)，像素值大於220被置成瞭0，小於220的被置成瞭255
        maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 閾值一起使用的最大值，可理解是填充色，范圍為（0～255）。
        type：參數類型閾值類型（
              cv2.THRESH_BINARY 大於閾值的部分被置為255，小於部分被置為0（黑白二值）
              cv2.THRESH_BINARY_INV 大於閾值部分被置為0，小於部分被置為255（黑白二值反轉——白黑）
              等其它的類型......
              ）
        '''
ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)
cv2.imshow('img_inv', img_inv)
cv2.waitKey(0)

3.1.自定義閾值

###閾值對比（全局閾值（v = 127），自適應平均閾值，自適應高斯閾值）
def threshContrast():
    filepath = './testImage.png'
    img = cv2.imread(filepath)
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    img_gray = cv2.medianBlur(img_gray, 5)
    ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
    th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
    th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
    title = ['原始圖像(灰度)','全局閾值（v = 127）','自適應平均閾值','自適應高斯閾值']
    images = [img_gray, th1, th2, th3]
    for i in range(4):
        plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
        # plt.title(title[i]) ###plt繪圖時不能使用中文
        plt.xticks([]), plt.yticks([])
    plt.show()

4.提取輪廓

img_inv是尋找輪廓的圖像；

cv2.RETR_EXTERNAL：表示隻檢索極端外部輪廓；
cv2.CHAIN_APPROX_SIMPLE：壓縮水平, 垂直和對角線方向的元素，隻保留它們的端點坐標，例如，一個直立的矩形輪廓用 4 個點進行編碼。

###4，提取輪廓
    '''
        https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html
        img_inv是尋找輪廓的圖像；
        cv2.RETR_EXTERNAL：表示隻檢索極端外部輪廓；
        cv2.CHAIN_APPROX_SIMPLE：壓縮水平, 垂直和對角線方向的元素，隻保留它們的端點坐標，例如，一個直立的矩形輪廓用 4 個點進行編碼。
    '''
 contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
 print(f'檢測出輪廓數量有：{len(contours)}個')
 print('返回值為各層輪廓的索引：\n', hierarchy)

5.對輪廓畫矩形框

###5，找出每一個輪廓繪畫出的矩形位置
br = []
cntid = 0
for cnt in contours:
        '''cnt表示輸入的輪廓值，x，y, w, h 分別表示外接矩形的x軸和y軸的坐標，以及矩形的w寬和h高,'''
    x, y, w, h = cv2.boundingRect(cnt)
    cntid += 1
    print(f'檢測出第{cntid}個輪廓畫出的矩形位置為：x={x},y={y},w={w},h={h}')
    br.append(cv2.boundingRect(cnt))
        '''img表示輸入的需要畫的圖片(這裡就是在原圖上繪制輪廓)，cnt表示輸入的輪廓值，-1表示contours中輪廓的索引(這裡繪制所有的輪廓)，(0, 0, 255)表示rgb顏色——紅色，2表示線條粗細'''
    cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2)
    cv2.imshow('cnt', img)
    cv2.waitKey(0)
br.sort() ###將列表中的每一個元組裡面的進行升序排序（這裡其實想的是按照對應的x軸坐標進行升序）

對每個字符畫輪廓的過程（順序從右到左畫，期間也有可能斷續，如下圖）。

6.分割圖片並保存

###6，分割圖片並保存（這裡對前面處理過的二值化圖片數據（img_inv）進行分割）
if not os.path.exists('./imageSplit'):
    os.mkdir('./imageSplit')
else:
    shutil.rmtree('./imageSplit')
    os.mkdir('./imageSplit')
for x,y,w,h in br:
    # print(x,y,w,h)
    # split_image = img_inv[y:y + h, x:x + w]
    split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2]  ###這樣分割感覺好看些
    cv2.imshow('split_image', split_image)
    cv2.waitKey(0)
    save_filepath = './imageSplit/'
    filename = f'{x}.jpg' ###這裡由每張圖片對應的x軸坐標命名
    cv2.imwrite(save_filepath + filename, split_image)
    print(f'\033[31m{filename}圖片分割完畢！\033[0m')

這裡是對前面處理過的二值化圖片數據（img_inv）進行一個一個字符分割展示的過程。

這裡是這行代碼的意思，下面的圖是手動繪制的，太醜瞭，哈哈哈！！！

# split_image = img_inv[y:y + h, x:x + w]

7.查看分割圖片

最後，我們在pyplot上來查看我們分割圖片後的效果，也就終於完成瞭。

###7，用pyplot來查看我們分割完成後的圖片
imagefile_list = os.listdir('./imageSplit')
imagefile_list.sort(key=lambda x: int(x[:-4]))
for i in range(len(imagefile_list)):
    img = cv2.imread(f'./imageSplit/{imagefile_list[i]}')
    plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray')
    plt.title(imagefile_list[i])
    plt.xticks([]), plt.yticks([])
plt.show()

8.完整代碼

import cv2
import os,shutil
from matplotlib import pyplot as plt
'''
    這是使用文檔網址:https://docs.opencv.org/4.5.2/index.html
    這是提供的Python接口教程網址：https://docs.opencv.org/4.5.2/d6/d00/tutorial_py_root.html
'''
def imageSplit():
    ###1，加載圖片
    filepath = './testImage.png'  ###圖像路徑，註意：這裡的路徑不能包含有中文名
    img = cv2.imread(filepath)
    cv2.imshow('Orignal img', img)  ###顯示圖片
    cv2.waitKey(0) ###防止一閃而過，是一個鍵盤綁定函數（0表示按下任意鍵終止）
 
    ###2，將彩色圖片變為灰色（進行灰度處理）
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    cv2.imshow('img_gray', img_gray)
    cv2.waitKey(0)
 
    ###3，將圖片做二值化處理
    '''
        thresh=220是自定義設定的閾值(通過分析print(img_gray)的圖像數據大概得到的)，像素值大於220被置成瞭0，小於220的被置成瞭255
        maxval=與 THRESH_BINARY 和 THRESH_BINARY_INV 閾值一起使用的最大值，可理解是填充色，范圍為（0～255）。
        type：參數類型閾值類型（
              cv2.THRESH_BINARY 大於閾值的部分被置為255，小於部分被置為0（黑白二值）
              cv2.THRESH_BINARY_INV 大於閾值部分被置為0，小於部分被置為255（黑白二值反轉——白黑）
              等其它的類型......
              ）
        '''
    ret, img_inv = cv2.threshold(src=img_gray, thresh=220, maxval=255, type=cv2.THRESH_BINARY_INV)
    cv2.imshow('img_inv', img_inv)
    cv2.waitKey(0)
 
    ###4，提取輪廓
    '''
        https://docs.opencv.org/4.5.2/d4/d73/tutorial_py_contours_begin.html
        img_inv是尋找輪廓的圖像；
        cv2.RETR_EXTERNAL：表示隻檢索極端外部輪廓；
        cv2.CHAIN_APPROX_SIMPLE：壓縮水平, 垂直和對角線方向的元素，隻保留它們的端點坐標，例如，一個直立的矩形輪廓用 4 個點進行編碼。
    '''
    contours,hierarchy = cv2.findContours(img_inv, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
    print(f'檢測出輪廓數量有：{len(contours)}個')
    print('返回值為各層輪廓的索引：\n', hierarchy)
 
    ###5，找出每一個輪廓繪畫出的矩形位置
    br = []
    cntid = 0
    for cnt in contours:
        '''cnt表示輸入的輪廓值，x，y, w, h 分別表示外接矩形的x軸和y軸的坐標，以及矩形的w寬和h高,'''
        x, y, w, h = cv2.boundingRect(cnt)
        cntid += 1
        print(f'檢測出第{cntid}個輪廓畫出的矩形位置為：x={x},y={y},w={w},h={h}')
        br.append(cv2.boundingRect(cnt))
        '''img表示輸入的需要畫的圖片(這裡就是在原圖上繪制輪廓)，cnt表示輸入的輪廓值，-1表示contours中輪廓的索引(這裡繪制所有的輪廓)，(0, 0, 255)表示rgb顏色——紅色，2表示線條粗細'''
        cv2.drawContours(img, [cnt], -1, (0, 0, 255), 2)
        cv2.imshow('cnt', img)
        cv2.waitKey(0)
    br.sort() ###將列表中的每一個元組裡面的進行升序排序（這裡其實想的是按照對應的x軸坐標進行升序）
 
    ###6，分割圖片並保存（這裡對前面處理過的二值化圖片數據（img_inv）進行分割）
    if not os.path.exists('./imageSplit'):
        os.mkdir('./imageSplit')
    else:
        shutil.rmtree('./imageSplit')
        os.mkdir('./imageSplit')
    for x,y,w,h in br:
        # print(x,y,w,h)
        # split_image = img_inv[y:y + h, x:x + w]
        split_image = img_inv[y - 2:y + h + 2, x - 2:x + w + 2]  ###這樣分割感覺好看些
        cv2.imshow('split_image', split_image)
        cv2.waitKey(0)
        save_filepath = './imageSplit/'
        filename = f'{x}.jpg' ###這裡由每張圖片對應的x軸坐標命名
        cv2.imwrite(save_filepath + filename, split_image)
        print(f'\033[31m{filename}圖片分割完畢！\033[0m')
    cv2.destroyAllWindows() ###刪除所有窗口
 
    ###7，用pyplot來查看我們分割完成後的圖片
    imagefile_list = os.listdir('./imageSplit')
    imagefile_list.sort(key=lambda x: int(x[:-4]))
    for i in range(len(imagefile_list)):
        img = cv2.imread(f'./imageSplit/{imagefile_list[i]}')
        plt.subplot(1, len(imagefile_list), i + 1), plt.imshow(img, 'gray')
        plt.title(imagefile_list[i])
        plt.xticks([]), plt.yticks([])
    plt.show()
 
    print('\nperfect！！！')
 
###閾值對比（全局閾值（v = 127），自適應平均閾值，自適應高斯閾值）
def threshContrast():
    filepath = './testImage.png'
    img = cv2.imread(filepath)
    img_gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    img_gray = cv2.medianBlur(img_gray, 5)
    ret1, th1 = cv2.threshold(img_gray, 127, 255, cv2.THRESH_BINARY)
    th2 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, 11, 2)
    th3 = cv2.adaptiveThreshold(img_gray, 255, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, 11, 2)
    title = ['原始圖像(灰度)','全局閾值（v = 127）','自適應平均閾值','自適應高斯閾值']
    images = [img_gray, th1, th2, th3]
    for i in range(4):
        plt.subplot(2, 2, i + 1), plt.imshow(images[i], 'gray')
        # plt.title(title[i]) ###plt繪圖時不能使用中文
        plt.xticks([]), plt.yticks([])
    plt.show()
 
if __name__ == '__main__':
    imageSplit()
 
    ###閾值對比
    # threshContrast()

到此這篇關於Python 第三方opencv庫實現圖像分割處理的文章就介紹到這瞭,更多相關python圖片處理內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Python 第三方opencv庫實現圖像分割處理

目錄

前言

1.加載圖片

2.對圖片做灰度處理

3.對圖片做二值化處理

3.1.自定義閾值

4.提取輪廓

5.對輪廓畫矩形框

6.分割圖片並保存

7.查看分割圖片

8.完整代碼

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

前言

1.加載圖片

2.對圖片做灰度處理

3.對圖片做二值化處理

3.1.自定義閾值

4.提取輪廓

5.對輪廓畫矩形框

6.分割圖片並保存

7.查看分割圖片

8.完整代碼

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆