Python詳細講解圖像處理的而兩種庫OpenCV和Pillow
一、簡介
實現計算機視覺任務的過程中,不可避免地需要對圖像進行讀寫操作以及圖像預處理操作,下面介紹兩個常用的Python圖像處理庫:OpenCV和Pillow。
OpenCV全稱是由英特爾公司資助的開源計算機視覺庫。
- 它由一系列C函數和少量C++類所組成,實現圖像處理和計算機視覺方面的很多通用算法,例如特征檢測與跟蹤、運動分析、目標分割與識別以及3D重建等。
- OpenCV作為基於C/C++語言編寫的跨平臺開源軟件,可以運行在Linux、Windows、Android和MacOS操作系統上,同時提供瞭Python、Ruby、MATLAB等語言的接口,實現瞭圖像處理和計算機視覺方面的很多通用算法。
1.1 圖像處理-OpenCV
OpenCV是模塊結構的,有以下主要模塊。
- 【core】–核心功能模塊,包含內容有:OpenCV基本數據結構、動態數據結構、繪圖函數、數組操作相關函數、輔助功能與系統函數和宏、與OpenGL的互操作。
- 【imgproc】–圖像處理模塊,包含內容有:線性和非線性的圖像濾波、圖像的幾何變換、圖像轉換、直方圖相關、結構分析和形狀描述、運動分析和對象跟蹤、特征檢測、目標檢測等內容。
- 【features2D】–2D功能模塊,包含以下內容:特征檢測和描述、特征檢測器、描述符提取器等內容。
- 【highGUI】–高層GUI圖形用戶界面,包含:媒體的I/O輸入輸出、視頻捕捉、圖像和視頻的編碼解碼、圖形交互界面的接口等內容。
1.2 圖像處理- PIL和Pillow
作為Python2的第三方圖像處理庫是Pillow的前身。隨著Python3的更新,PIL移植到Python3更名為Pillow。與OpenCV一樣,Pillow也是模塊結構,主要包括以下結構。
- 【Image】–圖像功能模塊,包含內容有:讀寫圖像、圖像混合、圖像放縮、圖像裁切、圖像旋轉。
- 【ImageFilter】–圖像濾波功能模塊,包含內容有:各類圖像濾波核。
- 【ImageEnhance】–圖像增強功能模塊,包含內容有:色彩增強、亮度增強、對比度增強、清晰度增強。
- 【ImageDraw】–圖像繪畫功能模塊,包含內容有:繪制幾何形狀、繪制文字。
二、常用圖像類型
2.1 二值圖像
二值圖像隻有黑白兩種顏色,如圖所示。圖像中的每個像素隻能是黑或白,沒有中間的過渡。因此二值圖像的像素值隻能為0或1,0表示黑色,1表示白色。
2.2 灰度圖像
- 灰度圖像隻表達圖像的亮度信息沒有顏色信息,如(a)圖所示。
- 灰度圖像的每個像素點上隻包含一個量化的灰度級(即灰度值)。
- 像素點的亮度水平如(b)圖所示,通常使用1字節(8位二進制數)來存儲灰度值,因此用正整數表示灰度值的范圍是0~255。
2.3 RGB圖像
- RGB(Red、Green、Blue)圖像如(a)圖,可以看成是由多個RGB像素點組成。
- 每個彩色像素點分別由R、G、B三種顏色空間組成如(b)圖,本質是3維數組。
- 在RGB顏色空間中,任意色光都可以用R、G、B三色不同分量的相加混合而成。
2.4 常用顏色空間簡介
實際應用中常用的顏色空間很多,通常使用3個獨立的變量對顏色進行描述,例如RGB、HSV、YUV等。
一個圖像的不同的顏色空間是可以轉換的,cv2.cvtColor可以實現顏色的轉換。
• cv2.COLOR_BGR2GRAY
• cv2.COLOR_BGR2RGB
• cv2.COLOR_BGR2HSV
• cv2.COLOR_BGR2YUV
• cv2.COLOR_BGR2HLS
三、OpenCV圖像讀寫與顯示
通過OpenCV庫對數字圖像進行處理時,涉及到的基礎操作包括讀取、顯示、寫出圖像文件。
在OpenCV庫中,圖像數據是以NumPy數組的形式存在。
3.1 讀入圖像
在python的OpenCV中,通過cv2.imread()函數讀入圖像數據,其基本使用格式如下。cv2.imread(filename, flags)
在默認情況下通過cv2.imread()
函數讀入圖像數據為3通道的彩色圖,像素值為8位的非負整數,圖像數據以NumPy中ndarray的方式存在。
如果定義瞭cv2.imread()讀入模式為cv2.IMREAD_GRAYSCALE那麼讀入圖像為單通道的灰度圖。
需要註意的是,通過OpenCV讀入彩色圖像數據的顏色通道順序為BGR(藍、綠、紅)並非常用的RGB(紅、綠、藍)順序。
在OpenCV中,讀取到的圖像數組維度可以表示為:
(高,寬,通道數)即(height, width, channel)。OpenCV圖像坐標與常規的數學坐標有區別,左上角位置為坐標原點。
• 在Windows【畫圖】工具中,帽簷紅點坐標為(248, 102),但在OpenCV中像素位置應為(102, 248)。
• X軸 == 列位置 == 圖像寬
• Y軸 == 行位置 == 圖像高
3.2 顯示圖像
- 在OpenCV中,通過cv2.imshow()函數顯示圖像數據,其基本使用格式如下。
- cv2.imshow(winname, img)
- 在OpenCV中,通過cv2.waitKey()函數設置圖片窗口顯示時長,其基本使用格式如下。
- cv2.waitKey([,delay])
- waitKey作用是圖像顯示時等待用戶按鍵觸發,如果用戶按鍵觸發或時間超過瞭設置的時間則退出圖片展示。
- cv2.waitKey(0)的作用是令程序一直停留在顯示圖像的狀態。如果沒有增加cv2.waitKey(0),那麼程序運行完畢後,圖像顯示窗口會自動關閉,即一閃而逝。
3.3 寫出圖像
- 在OpenCV中,通過cv2.write()函數保存圖像數據,其基本使用格式如下。
- cv2.imwrite(filename, img)
import cv2 import matplotlib.pyplot as plt import numpy # 讀寫圖像 img = cv2.imread(filename='lena.jpg', flags=cv2.IMREAD_GRAYSCALE) img.shape # (377, 373) img.dtype # dtype('uint8') # 圖像展示 cv2.imshow(winname='lena', mat=img) cv2.waitKey(0) # 圖像保存 cv2.imwrite(filename='test_img.jpg', img=img)
四、圖像幾何變換
4.1 圖像平移
圖像平移變換將一幅圖像中的所有像素點都按照給定的偏移量在水平方向(沿x軸方向)或垂直方向(沿y軸方向)移動,是圖像幾何變換中較為簡單的一種變換。
圖像平移原理示意圖如下圖所示。
假設對點P_0 (x_0,y_0 )進行平移後得到點P(x,y),其中x方向的平移量為∆x,y方向的平移量為∆y ,則點P(x,y)的坐標如下式。
利用齊次坐標表示圖像平移變換前後點P_0 (x_0,y_0 )到點P(x,y)的關系如下式所示。
實現步驟:
1. 定義平移變換矩陣: 例如:np.float32([[1,0,50], [0,1,100]])
• [1,0,50]表示在x軸方向移動50個單位
• [0,1,100]表示在y軸方向移動100個單位
2. 執行轉換:cv2.warpAffine (src, M, dsize)
通過OpenCV實現圖像平移操作,結果如下圖所示,(a)為原圖和(b)為平移後圖像。
import cv2 import matplotlib.pyplot as plt import numpy as np img = cv2.imread('lena.jpg') height, width, channel = img.shape # 圖像平移 # 1、定義平移變換矩陣 M = np.float32([[1,0,50], [0,1,100]]) # 2、執行平移變換 img_tran = cv2.warpAffine(src=img, M=M, dsize=(height, width)) cv2.imshow('image translation', img_tran) cv2.waitKey(0)
4.2 圖像旋轉
圖像旋轉(Rotation)是指圖像以某一點為中心旋轉一定的角度形成一幅新的圖像的過程。通常是以圖像的中心為圓心旋轉,將圖像中的所有像素點都旋轉一個相同的角度。
圖像旋轉原理如圖所示,將點(x_0,y_0)繞原點o順時針旋轉至點(x_1,y_1 ),其中a為旋轉角,r為點(x_0,y_0 )到原點的距離, b為原點o到點(x_0,y_0 )的線段與x軸之間的夾角。在旋轉過程中, r保持不變。
設旋轉前,x_0、y_0的坐標分別為x_0=r cosb、y_0=r sinb,當旋轉a角度後,坐標x_1、y_1的值分別如下式所示。
上式的矩陣的形式如下式所示。
實現步驟:
1. 計算旋轉變換矩陣: cv2.getRotationMatrix2D (center, angle, scale)
2. 執行轉換:cv2.warpAffine (src, M, dsize)
通過OpenCV實現圖像旋轉,得到的效果如圖所示。
# 圖像旋轉 # 1、定義旋轉變換矩陣 M = cv2.getRotationMatrix2D(center=(height*0.5, width*0.5), # 旋轉的中心位置坐標 angle=45, # 旋轉的角度 scale=0.8 # 縮放比例 ) # 2、執行旋轉變換 img_rotation = cv2.warpAffine(img, M, dsize=(height,width)) cv2.imshow('image_rotation', img_rotation) cv2.waitKey(0)
4.3 圖像縮放
圖像比例縮放是指將給定的圖像在x軸方向按比例縮放f_x倍,在y軸方向按比例縮放f_y倍,從而獲得一幅新的圖像。如果f_x=f_y,即x軸方向和y軸方向縮放的比率相同,此比例縮放為圖像的全比例縮放。如果f_x≠f_y,那麼圖像的比例縮放會改變原始圖像的像素間的相對位置,產生幾何畸變。
在OpenCV中cv2.resize(src, dsize, fx, fy, interpolation)可以實現圖像縮放。
具體實現圖像縮放有多種插值方法,OpenCV的resize函數提供瞭如下5種常見方法。
• 最鄰近插值:cv2.INTER_NEAREST
• 雙線性插值:cv2.INTER_LINEAR
• 區域插值:cv2.INTER_AREA
• 三次樣條插值:cv2.INTER_CUBIC
• Lanczos插值:cv2.INTER_LANCZOS4
# 圖像縮放 # 1、直接指定縮放大小 img_res = cv2.resize(img, dsize=(244,244)) img_res.shape # (244, 244, 3) cv2.imshow('image_resize', img_res) cv2.waitKey(0) # 2、最近鄰插值 img_near = cv2.resize(img, dsize=None, fx=1.5, fy=1, interpolation=cv2.INTER_NEAREST) cv2.imshow('img_near', img_near) cv2.waitKey(0)
到此這篇關於Python詳細講解圖像處理的而兩種庫OpenCV和Pillow的文章就介紹到這瞭,更多相關Python圖像處理內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- OpenCV+Python幾何變換的實現示例
- 使用OpenCV為圖像加水印的教程
- Python+OpenCV實現六種常用圖像特效
- 如何使用Python的OpenCV庫處理圖像和視頻
- OpenCV+Imutils實現圖像的旋轉操作