Python生成字符視頻的實現示例
一、前言
在之前也寫過生成字符視頻的文章,但是使用的是命令行窗口輸出,效果不是很好,而且存在卡頓的情況。於是我打算直接生成一個mp4的字符視頻。大致思路和之前一樣:Python20行代碼實現視頻字符化。
下面來看一個效果圖:
二、OpenCV的操作圖像
我們先來看一些基本操作。首先我們需要安裝OpenCV,執行下面語句:
pip install opencv-python
之後就可以使用瞭。
2.1、讀取和顯示
我們直接看代碼:
import cv2 # 讀取圖片 img = cv2.imread("1.jpg") # 顯示圖片 cv2.imshow("img", img) cv2.waitKey() cv2.destroyAllWindows()
其中waitKey是等待輸入的函數,因為imshow之後顯示一瞬間,所以我們需要調用它。而destroyAllWindows是釋放窗口。
2.2、灰度轉換
灰度轉換就是將圖片轉換成黑白圖片(灰色),這樣可以方便我們處理像素。代碼如下:
import cv2 img = cv2.imread("1.jpg") # 灰度轉換 gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
我們還可以直接以灰度形式讀入:
import cv2 # 以灰度形式讀入 img = cv2.imread("1.jpg", 0)
2.4、獲取圖片尺寸並修改尺寸
我們直接看代碼:
import cv2 img = cv2.imread("1.jpg", 0) # 獲取圖片的高寬 h, w = img.shape # 縮放圖片 res = cv2.resize(img, (w//2, h//2))
因為img的shape屬性是一個元組,所以我們可以直接自動拆包。
然後調用cv2.resize函數,第一個參數傳入圖片,第二個參數傳入修改後的尺寸。
2.5、繪制文字
繪制文字我們需要調用cv2.putText函數,代碼如下:
import cv2 img = cv2.imread('1.jpg') # 繪制文字 cv2.putText( # 背繪制的圖片 img, # 要繪制的文字 'Hello', # 文字左下角的坐標 (100, 500), # 字體 cv2.FONT_HERSHEY_SIMPLEX, # 字體大小縮放 20, # 文字顏色 (0, 0, 0), # 文字粗細 10 )
我們隻需要註意這些參數就好瞭。
2.6、讀取視頻
讀取視頻的操作一般是通用的,代碼如下:
import cv2 # 讀取視頻 cap = cv2.VideoCapture('1.mp4') # 獲取視頻的幀率 fps = cap.get(cv2.CAP_PROP_FPS) # 循環讀取圖片的每一幀 while True: # 讀取下一幀 ret, frame = cap.read() if not ret: break else: pass cap.release()
上面我們獲取的視頻的幀,在寫入視頻的時候我們需要用到。
2.7、寫入視頻
寫入視頻的操作也是常規代碼:
import cv2 fourcc = cv2.VideoWriter_fourcc(*'mp4v') writer = cv2.VideoWriter('11.mp4', fourcc, fps, (w, h)) # 寫入視頻 writer.write(frame) *** write.release()
有瞭這些知識,我們就可以開始下一步工作瞭。
三、像素映射成字符
對於隻有一個通道的圖片,我們可以把它當成一個矩形,這個矩形最小單位就是一個像素。而字符化的過程就是用字符替代像素點的過程。所以我們要遍歷圖像的每個像素點,但是我們應該用什麼字符取代呢?
我們顏色有一個參照表,而opencv將這個參數表切割成256份,代表不同的程度,我們也可以做一個參照表,不過表中的內容不是顏色,而是字符。
上圖為顏色表,我們可以使顏色表和字符表建立映射關系。假如字符表如下:
mqpka89045321@#$%^&*()_=||||}
我們可以得到下列公式:
經過變換可以求得相應顏色對應字符表中的字符:
這個公式不理解也沒關系,隻需要會用即可。下面就是我們像素轉字符的代碼:
def pixel2char(pixel): char_list = "@#$%&erytuioplkszxcv=+---. " index = int(pixel / 256 * len(char_list)) return char_list[index]
這個字符表是可以自己定義的。
四、生成字符圖片
現在我們隻需要將像素逐個轉換成字符就好瞭,代碼如下:
def get_char_img(img, scale=4, font_size=5): # 調整圖片大小 h, w = img.shape re_im = cv2.resize(img, (w//scale, h//scale)) # 創建一張圖片用來填充字符 char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255 font = cv2.FONT_HERSHEY_SIMPLEX # 遍歷圖片像素 for y in range(0, re_im.shape[0]): for x in range(0, re_im.shape[1]): char_pixel = pixel2char(re_im[y][x]) cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0)) return char_img
這裡我們使用瞭一個np.ones函數,它的作用我們理解為生成一個黑色圖片。
生成的尺寸我們先除瞭scale,如何再乘font_size。scale是原圖的縮小程度,因為像素有很多,所以我們需要先把圖片縮小。而為瞭讓我們的字體顯示更清楚,我們需要把生成的字符圖片放大。
因此需要註意,雖然我們生成的圖片看起來單調,但是當font_size設置為5時,得到的圖片已經比較大瞭。因此當你生成長時間的視頻時,會花費比較多的時間,生成的視頻也比較大。
我們來測試一下上面的函數:
import cv2 import numpy as np def pixel2char(pixel): char_list = "@#$%&erytuioplkszxcv=+---. " index = int(pixel / 256 * len(char_list)) return char_list[index] def get_char_img(img, scale=4, font_size=5): # 調整圖片大小 h, w = img.shape re_im = cv2.resize(img, (w//scale, h//scale)) # 創建一張圖片用來填充字符 char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255 font = cv2.FONT_HERSHEY_SIMPLEX # 遍歷圖片像素 for y in range(0, re_im.shape[0]): for x in range(0, re_im.shape[1]): char_pixel = pixel2char(re_im[y][x]) cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0)) return char_img if __name__ == '__main__': img = cv2.imread('dl.jpg', 0) res = get_char_img(img) cv2.imwrite('d.jpg', res)
效果如下:
可以看到效果還是很不錯的。
五、生成字符視頻
有瞭上面的代碼,我們就可以對整個視頻進行轉換瞭。將視頻轉換成字符視頻的代碼如下:
def generate(input_video, output_video): # 1、讀取視頻 cap = cv2.VideoCapture(input_video) # 2、獲取視頻幀率 fps = cap.get(cv2.CAP_PROP_FPS) # 讀取第一幀,獲取轉換成字符後的圖片的尺寸 ret, frame = cap.read() char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4) # 創建一個VideoWriter,用於保存視頻 fourcc = cv2.VideoWriter_fourcc(*'mp4v') writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0])) while ret: # 讀取視頻的當前幀,如果沒有則跳出循環 ret, frame = cap.read() if not ret: break # 將當前幀轉換成字符圖 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) char_img = get_char_img(gray, 4) # 轉換成BGR模式,便於寫入視頻 char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR) writer.write(char_img) writer.release()
下面是卡卡西經典戰役的字符視頻片段:
完整代碼如下:
import cv2 import numpy as np def pixel2char(pixel): char_list = "@#$%&erytuioplkszxcv=+---. " index = int(pixel / 256 * len(char_list)) return char_list[index] def get_char_img(img, scale=4, font_size=5): # 調整圖片大小 h, w = img.shape re_im = cv2.resize(img, (w//scale, h//scale)) # 創建一張圖片用來填充字符 char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255 font = cv2.FONT_HERSHEY_SIMPLEX # 遍歷圖片像素 for y in range(0, re_im.shape[0]): for x in range(0, re_im.shape[1]): char_pixel = pixel2char(re_im[y][x]) cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0)) return char_img def generate(input_video, output_video): # 1、讀取視頻 cap = cv2.VideoCapture(input_video) # 2、獲取視頻幀率 fps = cap.get(cv2.CAP_PROP_FPS) # 讀取第一幀,獲取轉換成字符後的圖片的尺寸 ret, frame = cap.read() char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4) # 創建一個VideoWriter,用於保存視頻 fourcc = cv2.VideoWriter_fourcc(*'mp4v') writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0])) while ret: # 讀取視頻的當前幀,如果沒有則跳出循環 ret, frame = cap.read() if not ret: break # 將當前幀轉換成字符圖 gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY) char_img = get_char_img(gray, 4) # 轉換成BGR模式,便於寫入視頻 char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR) writer.write(char_img) writer.release() if __name__ == '__main__': generate('in.mp4', 'out.mp4')
我們隻需要修改generate的參數就好瞭。完整效果視頻如下:
到此這篇關於Python生成字符視頻的實現示例的文章就介紹到這瞭,更多相關Python生成字符視頻內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 如何使用Python的OpenCV庫處理圖像和視頻
- 利用Python字符畫生成甜心教主
- Python 代碼制作動態鞭炮
- python 基於opencv操作攝像頭
- 基於Python+OpenCV制作屏幕錄制工具