Python OpenCV 圖像矯正的原理實現

Posted on 2022-07-17 by WalkonNet

題目描述

目錄hw1下的圖像是一些膠片的照片，請將其進行度量矯正。

推薦流程：采用Canny算子，檢測邊緣點；采用Hough直線檢測，根據邊緣點檢測膠片邊緣對應的4條直線；4條直線在圖像平面中的交點為膠片圖像的4個頂點。根據4個頂點與真實世界中膠片的位置（假設膠片圖像長寬比為4:3），得到兩個平面之間的單應變換矩陣，並根據單應變換矩陣實現圖像矯正。

基本思路

使用Canny算子，檢測邊緣點；以邊緣點作為輸入，采用Hough直線檢測，檢測出最多點共線的四條直線，這四條直線的交點就是照片中屏幕的四個頂點；假設膠片圖像長寬比為4:3，那麼此時已知四個匹配的點，可以求解出兩個平面之間的單應變換矩陣；從而可以使用原圖像、單應變換矩陣，對原圖像進行變換，即可實現圖像矯正。實現日志

Canny邊緣檢測：Python OpenCV Canny邊緣檢測算法的原理實現詳解

Hough直線檢測：Python OpenCV Hough直線檢測算法的原理實現

在具體實現時，發現對於給定的圖像，幾乎不可能通過調整閾值的方式，使得Hough檢測到的直線剛好是屏幕邊框。經過多輪調整，在下界為180、上界為260時取得瞭較為理想的結果，

如下圖所示：

對於三張圖像，經過實驗，最終選擇的最佳閾值為：

correct('images/1.jpeg', 180, 260)
correct('images/2.jpeg', 30, 100)
correct('images/3.jpeg', 100, 160)

但即便是最佳閾值，也無法做到僅檢測出四條線。思考過後，決定加入一步人工篩選。

有兩種可行的技術方案：

人工篩選直線
人工篩選交點

考慮到如果篩選交點的話，工作量明顯比篩選直線更大，所以選擇人工篩選直線。後面有時間的話考慮加入圖形化界面，目前因時間原因，選擇專註於算法本身，暫不考慮可視化編程。

直接顯示出下圖用於篩選：

這裡符合條件的直線id為2、3、6、7。

求解得到的交點：

我們假設目標圖像是4：3的，也就是其大小為(800, 600)，從而我們可以確定目標圖像中四個關鍵點位置為[0, 0], [800, 0], [0, 600], [800, 600]。為瞭保證交點與目標點一一對應，最為高效的解決方案是，我們篩選圖像的時候，按照上、左、下、右的順序即可。

核心代碼

def correct(image_path, threshold1, threshold2):
    # 讀取圖像並轉換為灰度圖像
    image = cv2.imread(image_path)
    gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
    # 使用Canny算子檢測邊緣
    edges = canny_detect(gray, threshold1, threshold2, show=False)
    # 使用Hough檢測直線
    lines = hough_detect(image, edges, show=False)
    # 手動篩選
    for id, line in enumerate(lines):
        rho, theta = line[0]
        x1, y1, x2, y2 = convert_polar_to_two_points(rho, theta)
        temp_image = image.copy()
        cv2.line(temp_image, (x1, y1), (x2, y2), (255, 0, 0), 7)
        plt.subplot(5, 5, id + 1)
        plt.imshow(temp_image)
        plt.title('{}'.format(id))
        plt.xticks([])
        plt.yticks([])
    plt.show()
    choose = input('請輸入您選擇的直線的id，以空格分隔：').split(' ')
 
    # 求解交點
    crossover_points = []
    assert len(choose) == 4
    for i in range(4):
        for j in range(i+1, 4):
            rho1, theta1 = lines[int(choose[i])][0]
            rho2, theta2 = lines[int(choose[j])][0]
            # 如果角度差太小，認為它們是平行線
            if abs(theta2 - theta1) > np.pi / 8 and abs(theta2 - theta1) < np.pi * 7 / 8:
                crossover_points.append(cal_crossover(rho1, theta1, rho2, theta2))
    # 確定變換前後的坐標
    before = np.float32(crossover_points)
    after = np.float32([[0, 0], [800, 0], [0, 600], [800, 600]])
    # 單應變換
    h = cv2.getPerspectiveTransform(before, after)
    result = cv2.warpPerspective(image, h, (800, 600))
    cv2.imwrite(image_path.split('.')[0] + '_correct.jpeg', result)
    return result

矯正結果：

到此這篇關於Python OpenCV 圖像矯正的原理實現的文章就介紹到這瞭,更多相關Python OpenCV 圖像矯正內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Python OpenCV 圖像矯正的原理實現

目錄

題目描述

基本思路

核心代碼

推薦閱讀：

發佈留言取消回覆

近期文章

目錄

題目描述

基本思路

核心代碼

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆