python計算機視覺OpenCV入門講解

前言

本專欄將非常細致的講解相關與計算機視覺OpenCV的相關知識即操作,非常的簡單易懂。本文主要講解相關與計算機視覺的相關入門內容,關於圖像處理的相關簡單操作,包括讀入圖像、顯示圖像及圖像相關理論知識。

一、什麼是計算機視覺

計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等機器視覺,並進一步做圖形處理,使電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。作為一個科學學科,計算機視覺研究相關的理論和技術,試圖建立能夠從圖像或者多維數據中獲取‘信息’的人工智能系統。這裡所指的信息指Shannon定義的,可以用來幫助做一個“決定”的信息。因為感知可以看作是從感官信號中提取信息,所以計算機視覺也可以看作是研究如何使人工系統從圖像或多維數據中“感知”的科學。
視覺是各個應用領域,如制造業、檢驗、文檔分析、醫療診斷,和軍事等領域中各種智能/自主系統中不可分割的一部分。由於它的重要性,一些先進國傢,例如美國把對計算機視覺的研究列為對經濟和科學有廣泛影響的科學和工程中的重大基本問題,即所謂的重大挑戰(grand challenge)。計算機視覺的挑戰是要為計算機和機器人開發具有與人類水平相當的視覺能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統應該把所有這些處理都緊密地集成在一起。

我們目前如果是在校學生,對於計算機視覺和機器學習的相關知識的學習是非常有用的,無論是對於自己的工作前景還是相關論文的撰寫都是非常有用的,而且目前對於計算機的相關知識已經設計到瞭各個專業領域,其中包括醫學領域(計算機視覺分析CT成像)、電學領域(使用matlab及相關領域畫圖)、人臉識別和車牌識別等等。而且有想要做交叉學科的對於計算機可以和任意領域及進行無障礙交叉。
由於我這個理工男的語文功底並不好,語言組織能力不強,所以我們今天就囉嗦到這裡,總結一下就是計算機視覺及機器學習等和計算機相關的東西特別重要!

二、圖片處理基礎操作

首先我們來看一段簡單的計算機視覺相關代碼:

import cv2
img=cv2.imread('path')#path指圖片相關路徑
cv2.imshow('Demo',img)
cv2.nameWindow('Demo')
cv2.waitKey(0)
cv2.destroyAllWindows()

這段代碼就可以在計算機中顯示出img的相關圖像。接下來我們講解一下每一步的相關操作。

圖片處理:讀入圖像

相關函數:image=cv2.imread(文件名相關路徑[顯示控制參數])
文件名:完整的路徑。
其中參數包括:
cv.IMREAD_UNCHANGED :表示和原圖像一致
cv.IMREAD_GRAYSCALE : 表示將原圖像轉化為灰色圖像。
cv.IMREAD_COLOR:表示將原圖像轉化為彩色圖像。
例如:
cv2.imread(‘d:\image.jpg’,cv.IMREAD_UNCHANGED)

圖片處理:顯示圖像

相關函數:None=cv2.imshow(窗口名,圖像名)
例如:cv2.imshow(“demo”,image)
但是在OpenCV中我們圖像顯示還是要加上相關約束:
retval=cv2.waitKey([delay])
如果沒有這個限制,那麼顯示的圖像就會一閃而過,就會發生錯誤。
其中delay參數包括:
dealy=0,無限等待圖像顯示,直到關閉。也是waitKey的默認數值。
delay<0,等待鍵盤點擊結束圖像顯示,也就是說當我們敲擊鍵盤的時候,圖像結束顯示。
delay>0,等待delay毫秒後結束圖像顯示。
最後我們還需要顯示
cv2.destroyAllWindows()
把圖像從內存中徹底刪除。

圖片處理:圖像保存

相關函數:retval=cv2.imwrite(文件地址,文件名)
例如:
cv2.imwrite(‘D:\test.jpg’,img)
將img保存到瞭路徑D:\test.jpg

三、圖像處理入門基礎

圖像成像原理介紹

首先我們第一個要深深深深的刻在腦子裡的概念就是:

圖片是由像素點構成的:

生動一點表示就是這樣:

這樣就可以完美的展示出計算機圖像的成像原理,就是用一個個有顏色的像素點拼接而成的。

圖像分類

圖像一般分為三類:
一、二值圖像
二值圖像表示的意思就是每一個像素點隻由0和1構成,0表示黑色,1表示白色,而且這裡的黑色和白色是純黑和純白。所以我們看到的圖像也就是這個樣子。我們以官網麗娜為例子。

四、灰度圖像

灰度圖像就是一個8位的位圖。什麼意思呢?就是說00000001一直到11111111,這就是二進制表示。如果表示成我們常用的十進制就是0-255。其中0就表示純黑色,255就表示純白色,中間就是處於純黑色到純白色的相關顏色。我們還是以麗娜為例。

灰度圖像一塊像素點:

五、彩色圖像(RGB)

計算機中所有的顏色都可以由R(紅色通道)、G(綠色通道)、B(藍色通道)來組成,其中每一個通道都有0-255個像素顏色組成。比如說R=234,G=252,B=4就表示黃色。顯示出來的也是黃色。所以說彩色圖像由三個面構成,分別對應R,G,B。我們還是以麗娜為例子:

所以說我們就可以知道復雜程度排序的話就是:彩色圖像-灰度圖像-二值圖像。所以我們在進行人臉項目或者是車牌識別項目中最最最常用的操作就是將彩色圖像轉化為灰度圖像,然後將灰度圖像轉為最簡單的二值圖像。

六、像素處理操作

讀取像素

相關函數:返回值=圖像(位置參數) 我們先以灰度圖像,返回灰度值:
p=img[88,142]
print§
這裡我們就可以返回圖片坐標[88,142]處的灰度值。
然後我們以彩色圖像為例子:
我們知道彩色圖像由BGR三個通道的值構成。那麼我們需要返回三個數值:
blue=img[78,125,0]
green=img[78,125,1]
red=img[78,125,2]
print(blue,green,red)
這樣我們就返回瞭這三個數值。

修改像素

直接暴力修改。
對於灰度圖像, img[88,99]=255
對於彩色圖像,
img[88,99,0]=255
img][88,99,1]=255
img[88,99,2]=255這裡也可以寫成
img[88,99]=[255,255,255]等同於上方。
改動多個像素點
例如還是以彩色圖像為例子:
i[100:150,100:150]=[255,255,255]
意思也就是將圖像橫坐標100到150和縱坐標100到150的這個區間全部用白色替代。

使用python中的numpy修改像素點

讀取像素:

相關函數:返回值=圖像.item(位置參數)
我們以灰度圖像為例:
o=img,item(88,142)
print(o)
對於彩色圖像我們還是:
blue=img.item(88,142,0)
green=img.item(88,142,1)
red=img.item(88,142,2)
然後print(blue,green,red)

修改像素:

圖像名.itemset(位置,新的數值)
我們以灰度圖像為例子:
img.itemset((88,99),255)
對於BGR圖像:
img.itemset((88,99,0),255)
img.itemset((88,99,1),255)
img.itemset((88,99,2),255)

import cv2
import numpy as np 
i=cv2.imread('path',cv2.IMREAD_UNCHANGED)
print(i.item(100,100))
i.itemset((100,100),255)
print(i,item(100,100))

通過這段代碼我們就可以看得出來像素的更改。
對於彩色圖像也是一樣。

七、獲取圖像屬性

形狀

shape可以獲取圖像的形狀,返回值包含行數、列數通道數的元組。
灰度圖像返回行數列數
彩色圖像返回行數、列數、通道數。

import cv2
img1=cv2.imread('灰度圖像')
print(img1.shape)

像素數目

size可以獲取圖像的像素數目。
灰度圖像:行數列數
彩色圖像:行數列數*通道數

圖像類型

dtype返回的是圖像的數據類型

import cv2
img=cv2.imread('圖像名稱')
print(img.dtype)

八、圖像ROI

ROI(region of interest)表示感興趣區域

從被處理的圖像中以方框、圓、橢圓或者不規則多邊形等方式勾勒出需要處理的區域。可以通過各種算子(operator)和函數來求ROI,並進行下一步操作。

import cv2
import numpy as np
a=cv2.imread('path')
b=np.ones((101,101,3))
b=a[220:400,250:350]
a[0:101,0:101]=b
cv2.imshow('o',a)
cv2.waitKey()
cv2.destroyAllWindows()

我們還可以將感興趣的圖像加入到別的圖像當中。

九、通道的拆分與合並

拆分

import cv2
img=cv2.imread('圖像名')
b = img[ : , : , 0 ]
g = img[ : , : , 1 ]
r = img[ : , : , 2 ]

我們在OpenCV中有專門拆分通道的函數:
cv2.split(img)

import cv2
import numpy as np
a=cv2.imread("image\lenacolor.png")
b,g,r=cv2.split(a)
cv2.imshow("B",b)
cv2.imshow("G",g)
cv2.imshow("R",r)
cv2.waitKey()
cv2.destroyAllWindows()

合並

import cv2
import numpy as np
a=cv2.imread("image\lenacolor.png")
b,g,r=cv2.split(a)
m=cv2.merge([b,g,r])
cv2.imshow("merge",m)
cv2.waitKey()
cv2.destroyAllWindows()

我們將上方的拆分圖像進行merge合並就可以得到以下結果:

到此這篇關於python計算機視覺OpenCV入門講解的文章就介紹到這瞭,更多相關python OpenCV 內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: