python中的opencv 圖像梯度

圖像梯度

圖像梯度計算的是圖像變化的速度。對於圖像的邊緣部分,其灰度值變化較大,梯度值也較大;相反,對於圖像中比較平滑的部分,其灰度值變化較小,相應的梯度值也較小。圖像梯度計算需要求導數,但是圖像梯度一般通過計算像素值的差來得到梯度的近似值(近似導數值)。(差分,離散)

Sobel算子、Scharr算子和Laplacian算子的使用。

Sobel理論基礎

Sobel算子是一種離散的微分算子,該算子結合瞭高斯平滑和微分求導運算。該算子利用局部差分尋找邊緣,計算所得的是一個梯度的近似值。

濾波器通常是指由一幅圖像根據像素點(x, y)臨近的區域計算得到另外一幅新圖像的算法。

濾波器是由鄰域及預定義的操作構成的,濾波器規定瞭濾波時所采用的形狀以及該區域內像素值的組成規律。濾波器也被稱為“掩模”、“核”、“模板”、“窗口”、“算子”等。一般信號領域將其稱為“濾波器”,數學領域將其稱為“核”。

線性濾波器: 濾波的目標像素點的值等於原始像素值及其周圍像素值的加權和。這種基於線性核的濾波,就是所熟悉的卷積。

計算水平方向偏導數的近似值

將Sobel算子與原始圖像src進行卷積計算,可以計算水平方向上的像素值變化情況。

例如,當Sobel算子的大小為3×3時,水平方向偏導數Gx的計算方式為:

計算垂直方向偏導數的近似值

當Sobel算子的大小為3×3時,垂直方向偏導數Gy的計算方式為:

Sobel算子及函數使用

使用函數cv2.Sobel()實現Sobel算子運算,其語法形式為:

dst = cv2.Sobel( src, ddepth, dx, dy[, ksize[, scale[, delta[, borderType]]]] ) 
  • dst代表目標圖像
  • src代表原始圖像
  • ddepth代表輸出圖像的深度

  • dx代表x方向上的求導階數。
  • dy代表y方向上的求導階數。
  • ksize代表Sobel核的大小。該值為-1時,則會使用Scharr算子進行運算。
  • scale代表計算導數值時所采用的縮放因子,默認情況下該值是1,是沒有縮放的。
  • delta代表加在目標圖像dst上的值,該值是可選的,默認為0。
  • borderType代表邊界樣式。

註意點:參數ddepth

在函數cv2.Sobel()的語法中規定,可以將函數cv2.Sobel()內ddepth參數的值設置為-1,讓處理結果與原始圖像保持一致。但是,如果直接將參數ddepth的值設置為-1,在計算時得到的結果可能是錯誤的。

在實際操作中,計算梯度值可能會出現負數。如果處理的圖像是8位圖類型,則在ddepth的參數值為-1時,意味著指定運算結果也是8位圖類型,那麼所有負數會自動截斷為0,發生信息丟失。為瞭避免信息丟失,在計算時要先使用更高的數據類型cv2.CV_64F,再通過取絕對值將其映射為cv2.CV_8U(8位圖)類型。

通常要將函數cv2.Sobel()內參數ddepth的值設置為“cv2.CV_64F”。要將偏導數取絕對值,以保證偏導數總能正確地顯示出來。在OpenCV中,使用函數cv2.convertScaleAbs()對參數取絕對值,

該函數的語法格式為:

dst = cv2.convertScaleAbs( src [, alpha[, beta]] )
  • dst代表處理結果。
  • src代表原始圖像。
  • alpha代表調節系數,該值是可選值,默認為1。
  • beta代表調節亮度值,該值是默認值,默認為0。

該函數的作用是將原始圖像src轉換為256色位圖,其可以表示為:

dst=saturate(src*alpha+beta)

式中,saturate()表示計算結果的最大值是飽和值,例如: 當“src*alpha+beta”的值超過255時,其取值為255。

**例子:**使用函數cv2.convertScaleAbs()對一個隨機數組取絕對值。

import cv2
import numpy as np 
img=np.random.randint(-256,256, size=[4,5], dtype=np.int16)
rst=cv2.convertScaleAbs(img)
print("img=\n", img)
print("rst=\n", rst)

方向

在函數cv2.Sobel()中,參數dx表示x軸方向的求導階數,參數dy表示y軸方向的求導階數。參數dx和dy通常的值為0或者1,最大值為2。如果是0,表示在該方向上沒有求導。當然,參數dx和參數dy的值不能同時為0。

參數dx和參數dy可以有多種形式的組合,主要包含:

  • 計算x方向邊緣(梯度):dx=0, dy=1。
  • 計算y方向邊緣(梯度):dx=1, dy=0。
  • 參數dx與參數dy的值均為1:dx=1, dy=1。
  • 計算x方向和y方向的邊緣疊加:通過組合方式實現。

例子

“dx=1, dy=0”。當然,也可以設置為“dx=2, dy=0”。此時,會僅僅獲取垂直方向的邊緣信息,

此時的語法格式為:

dst = cv2.Sobel( src , ddepth , 1 , 0 ) 

“dx=0, dy=1”。當然,也可以設置為“dx=0, dy=2”。此時,會僅僅獲取水平方向的邊緣信息,

此時的語法格式為:

dst = cv2.Sobel( src , ddepth , 0 , 1 ) 

“dx=1, dy=1”,也可以設置為“dx=2, dy=2”,或者兩個參數都不為零的其他情況。此時,會獲取兩個方向的邊緣信息,

此時的語法格式為:

dst = cv2.Sobel( src , ddepth , 1 , 1 )

計算x方向和y方向的邊緣疊加

如果想獲取x方向和y方向的邊緣疊加,需要分別獲取水平方向、垂直方向兩個方向的邊緣圖,然後將二者相加。

dx= cv2.Sobel( src , ddepth , 1 , 0 )
dy= cv2.Sobel( src , ddepth , 0 , 1 )
dst=cv2.addWeighted( src1 , alpha , src2 , beta , gamma )

例子:

使用函數cv2.Sobel()獲取圖像水平方向的完整邊緣信息

將參數ddepth的值設置為cv2.CV_64F,並使用函數cv2.convertScaleAbs()對cv2.Sobel()的計算結果取絕對值。

import cv2
o = cv2.imread('Sobel4.bmp', cv2.IMREAD_GRAYSCALE)
Sobelx = cv2.Sobel(o, cv2.CV_64F,0,1)
Sobelx = cv2.convertScaleAbs(Sobelx)
cv2.imshow("original", o)
cv2.imshow("x", Sobelx)
cv2.waitKey()
cv2.destroyAllWindows()

計算函數cv2.Sobel()在水平、垂直兩個方向疊加的邊緣信息。

import cv2
o = cv2.imread('Sobel4.bmp', cv2.IMREAD_GRAYSCALE)
Sobelx = cv2.Sobel(o, cv2.CV_64F,1,0)
Sobely = cv2.Sobel(o, cv2.CV_64F,0,1)
Sobelx = cv2.convertScaleAbs(Sobelx)
Sobely = cv2.convertScaleAbs(Sobely)
Sobelxy =  cv2.addWeighted(Sobelx,0.5, Sobely,0.5,0)
cv2.imshow("original", o)
cv2.imshow("xy", Sobelxy)
cv2.waitKey()
cv2.destroyAllWindows()

Scharr算子及函數使用

在離散的空間上,有很多方法可以用來計算近似導數,在使用3×3的Sobel算子時,可能計算結果並不太精準。

OpenCV提供瞭Scharr算子,該算子具有和Sobel算子同樣的速度,且精度更高。

可以將Scharr算子看作對Sobel算子的改進,其核通常為:

OpenCV提供瞭函數cv2.Scharr()來計算Scharr算子,其語法格式如下:

dst = cv2.Scharr( src, ddepth, dx, dy[, scale[, delta[, borderType]]] ) 
  • dst代表輸出圖像。
  • src代表原始圖像。
  • ddepth代表輸出圖像深度。該值與函數cv2.Sobel()中的參數ddepth的含義相同
  • dx代表x方向上的導數階數。
  • dy代表y方向上的導數階數。
  • scale代表計算導數值時的縮放因子,該項是可選項,默認值是1,表示沒有縮放。
  • delta代表加到目標圖像上的亮度值,該項是可選項,默認值為0。
  • borderType代表邊界樣式。

在函數cv2.Sobel()中,如果ksize=-1,則會使用Scharr濾波器。

如下語句:

dst=cv2.Scharr(src, ddepth, dx, dy)

dst=cv2.Sobel(src, ddepth, dx, dy, -1)

是等價的。函數cv2.Scharr()和函數cv2.Sobel()的使用方式基本一致。參數ddepth的值應該設置為“cv2.CV_64F”,並對函數cv2.Scharr()的計算結果取絕對值,才能保證得到正確的處理結果。

具體語句為:

dst=Scharr(src, cv2.CV_64F, dx, dy)
dst= cv2.convertScaleAbs(dst)

在函數cv2.Scharr()中,要求參數dx和dy滿足條件:

  • dx >= 0 && dy >= 0 && dx+dy == 1
  • 和Sobel 不同, Scharr 的dx+dy 必須為1

參數dx和參數dy的組合形式有:

  • 計算x方向邊緣(梯度):dx=0, dy=1。
  • 計算y方向邊緣(梯度): dx=1, dy=0。
  • 計算x方向與y方向的邊緣疊加:通過組合方式實現。

例子

計算x方向邊緣(梯度):dx=1, dy=0

dst=Scharr(src, ddpeth, dx=1, dy=0) 

計算y方向邊緣(梯度):dx=0, dy=1

dst=Scharr(src, ddpeth, dx=0, dy=1)

計算x方向與y方向的邊緣疊加

將兩個方向的邊緣相加

dx=Scharr(src, ddpeth, dx=1, dy=0) 
dy=Scharr(src, ddpeth, dx=0, dy=1)
Scharrxy=cv2.addWeighted(dx,0.5, dy,0.5,0)

參數dx和dy的值不能都為1

Sobel算子和Scharr算子的比較

Sobel算子的缺點是,當其核結構較小時,精確度不高,而Scharr算子具有更高的精度。

Sobel算子和Scharr算子的核結構:

Laplacian算子及函數使用

Laplacian(拉普拉斯)算子是一種二階導數算子,其具有旋轉不變性,可以滿足不同方向的圖像邊緣銳化(邊緣檢測)的要求。

通常情況下,其算子的系數之和需要為零。

一個3×3大小的Laplacian算子

Laplacian算子類似二階Sobel導數,需要計算兩個方向的梯度值。

計算結果的值可能為正數,也可能為負數。所以,需要對計算結果取絕對值,以保證後續運算和顯示都是正確的。

在OpenCV內使用函數cv2.Laplacian()實現Laplacian算子的計算,該函數的語法格式為:

dst = cv2.Laplacian( src, ddepth[, ksize[, scale[, delta[, borderType]]]] ) 
  • dst代表目標圖像。
  • src代表原始圖像。
  • ddepth代表目標圖像的深度。
  • ksize代表用於計算二階導數的核尺寸大小。該值必須是正的奇數。
  • scale代表計算Laplacian值的縮放比例因子,該參數是可選的。默認情況下,該值為1,表示不進行縮放。
  • delta代表加到目標圖像上的可選值,默認為0。
  • borderType代表邊界樣式。

該函數分別對x、y方向進行二次求導,具體為:

上式是當ksize的值大於1時的情況。當ksize的值為1時,Laplacian算子計算時采用的3×3的核如下:

通過從圖像內減去它的Laplacian圖像,可以增強圖像的對比度,此時其算子為:

例子: 使用函數cv2.Laplacian()計算圖像的邊緣信息。

import cv2
o = cv2.imread('Laplacian.bmp', cv2.IMREAD_GRAYSCALE)
Laplacian = cv2.Laplacian(o, cv2.CV_64F)
Laplacian = cv2.convertScaleAbs(Laplacian)
cv2.imshow("original", o)
cv2.imshow("Laplacian", Laplacian)
cv2.waitKey()
cv2.destroyAllWindows()

算子總結

Sobel算子、Scharr算子、Laplacian算子都可以用作邊緣檢測

Sobel算子和Scharr算子計算的都是一階近似導數的值。通常情況下,可以將它們表示為:

  • Sobel算子= |左-右| 或 |下-上|
  • Scharr算子=|左-右| 或 |下-上|

Laplacian算子計算的是二階近似導數值,可以將它表示為:

  • Laplacian算子=|中-左| + |中-右| + |中-下| + |中-上|

到此這篇關於python中的opencv 圖像梯度的文章就介紹到這瞭,更多相關python opencv 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: