Python生成字符視頻的實現示例

Posted on 2021-05-18 by WalkonNet

一、前言

在之前也寫過生成字符視頻的文章，但是使用的是命令行窗口輸出，效果不是很好，而且存在卡頓的情況。於是我打算直接生成一個mp4的字符視頻。大致思路和之前一樣：Python20行代碼實現視頻字符化。

下面來看一個效果圖：

在這裡插入圖片描述

二、OpenCV的操作圖像

我們先來看一些基本操作。首先我們需要安裝OpenCV，執行下面語句：

pip install opencv-python

之後就可以使用瞭。

2.1、讀取和顯示

我們直接看代碼：

import cv2
# 讀取圖片
img = cv2.imread("1.jpg")
# 顯示圖片
cv2.imshow("img", img)
cv2.waitKey()
cv2.destroyAllWindows()

其中waitKey是等待輸入的函數，因為imshow之後顯示一瞬間，所以我們需要調用它。而destroyAllWindows是釋放窗口。

2.2、灰度轉換

灰度轉換就是將圖片轉換成黑白圖片（灰色），這樣可以方便我們處理像素。代碼如下：

import cv2
img = cv2.imread("1.jpg")
# 灰度轉換
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

我們還可以直接以灰度形式讀入：

import cv2
# 以灰度形式讀入
img = cv2.imread("1.jpg", 0)

2.4、獲取圖片尺寸並修改尺寸

我們直接看代碼：

import cv2
img = cv2.imread("1.jpg", 0)
# 獲取圖片的高寬
h, w = img.shape
# 縮放圖片
res = cv2.resize(img, (w//2, h//2))

因為img的shape屬性是一個元組，所以我們可以直接自動拆包。

然後調用cv2.resize函數，第一個參數傳入圖片，第二個參數傳入修改後的尺寸。

2.5、繪制文字

繪制文字我們需要調用cv2.putText函數，代碼如下：

import cv2
img = cv2.imread('1.jpg')
# 繪制文字
cv2.putText(
    # 背繪制的圖片
    img, 
    # 要繪制的文字
    'Hello',
    # 文字左下角的坐標
    (100, 500),
    # 字體
    cv2.FONT_HERSHEY_SIMPLEX,
    # 字體大小縮放
    20, 
    # 文字顏色
    (0, 0, 0),
    # 文字粗細
    10
)

我們隻需要註意這些參數就好瞭。

2.6、讀取視頻

讀取視頻的操作一般是通用的，代碼如下：

import cv2
# 讀取視頻
cap = cv2.VideoCapture('1.mp4')
# 獲取視頻的幀率
fps = cap.get(cv2.CAP_PROP_FPS)
# 循環讀取圖片的每一幀
while True:
    # 讀取下一幀
    ret, frame = cap.read()
    if not ret:
        break
    else:
        pass
cap.release()

上面我們獲取的視頻的幀，在寫入視頻的時候我們需要用到。

2.7、寫入視頻

寫入視頻的操作也是常規代碼：

import cv2
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
writer = cv2.VideoWriter('11.mp4', fourcc, fps, (w, h))
# 寫入視頻
writer.write(frame)
***
write.release()

有瞭這些知識，我們就可以開始下一步工作瞭。

三、像素映射成字符

對於隻有一個通道的圖片，我們可以把它當成一個矩形，這個矩形最小單位就是一個像素。而字符化的過程就是用字符替代像素點的過程。所以我們要遍歷圖像的每個像素點，但是我們應該用什麼字符取代呢？

我們顏色有一個參照表，而opencv將這個參數表切割成256份，代表不同的程度，我們也可以做一個參照表，不過表中的內容不是顏色，而是字符。

在這裡插入圖片描述

上圖為顏色表，我們可以使顏色表和字符表建立映射關系。假如字符表如下：

mqpka89045321@#$%^&*()_=||||}

我們可以得到下列公式：

在這裡插入圖片描述

經過變換可以求得相應顏色對應字符表中的字符：

在這裡插入圖片描述

這個公式不理解也沒關系，隻需要會用即可。下面就是我們像素轉字符的代碼：

def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]

這個字符表是可以自己定義的。

四、生成字符圖片

現在我們隻需要將像素逐個轉換成字符就好瞭，代碼如下：

def get_char_img(img, scale=4, font_size=5):
    # 調整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創建一張圖片用來填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img

這裡我們使用瞭一個np.ones函數，它的作用我們理解為生成一個黑色圖片。

生成的尺寸我們先除瞭scale，如何再乘font_size。scale是原圖的縮小程度，因為像素有很多，所以我們需要先把圖片縮小。而為瞭讓我們的字體顯示更清楚，我們需要把生成的字符圖片放大。

因此需要註意，雖然我們生成的圖片看起來單調，但是當font_size設置為5時，得到的圖片已經比較大瞭。因此當你生成長時間的視頻時，會花費比較多的時間，生成的視頻也比較大。

我們來測試一下上面的函數：

import cv2
import numpy as np


def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]


def get_char_img(img, scale=4, font_size=5):
    # 調整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創建一張圖片用來填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img


if __name__ == '__main__':
    img = cv2.imread('dl.jpg', 0)
    res = get_char_img(img)
    cv2.imwrite('d.jpg', res)

效果如下：

在這裡插入圖片描述

可以看到效果還是很不錯的。

五、生成字符視頻

有瞭上面的代碼，我們就可以對整個視頻進行轉換瞭。將視頻轉換成字符視頻的代碼如下：

def generate(input_video, output_video):
    # 1、讀取視頻
    cap = cv2.VideoCapture(input_video)

    # 2、獲取視頻幀率
    fps = cap.get(cv2.CAP_PROP_FPS)

    # 讀取第一幀，獲取轉換成字符後的圖片的尺寸
    ret, frame = cap.read()
    char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)

    # 創建一個VideoWriter，用於保存視頻
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
    while ret:
        # 讀取視頻的當前幀，如果沒有則跳出循環
        ret, frame = cap.read()
        if not ret:
            break
        # 將當前幀轉換成字符圖
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        char_img = get_char_img(gray, 4)

        # 轉換成BGR模式，便於寫入視頻
        char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
        writer.write(char_img)
    writer.release()

下面是卡卡西經典戰役的字符視頻片段：

在這裡插入圖片描述

完整代碼如下：

import cv2
import numpy as np


def pixel2char(pixel):
    char_list = "@#$%&erytuioplkszxcv=+---.     "
    index = int(pixel / 256 * len(char_list))
    return char_list[index]


def get_char_img(img, scale=4, font_size=5):
    # 調整圖片大小
    h, w = img.shape
    re_im = cv2.resize(img, (w//scale, h//scale))
    # 創建一張圖片用來填充字符
    char_img = np.ones((h//scale*font_size, w//scale*font_size), dtype=np.uint8)*255
    font = cv2.FONT_HERSHEY_SIMPLEX
    # 遍歷圖片像素
    for y in range(0, re_im.shape[0]):
        for x in range(0, re_im.shape[1]):
            char_pixel = pixel2char(re_im[y][x])
            cv2.putText(char_img, char_pixel, (x*font_size, y*font_size), font, 0.5, (0, 0, 0))
    return char_img


def generate(input_video, output_video):
    # 1、讀取視頻
    cap = cv2.VideoCapture(input_video)

    # 2、獲取視頻幀率
    fps = cap.get(cv2.CAP_PROP_FPS)

    # 讀取第一幀，獲取轉換成字符後的圖片的尺寸
    ret, frame = cap.read()
    char_img = get_char_img(cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY), 4)

    # 創建一個VideoWriter，用於保存視頻
    fourcc = cv2.VideoWriter_fourcc(*'mp4v')
    writer = cv2.VideoWriter(output_video, fourcc, fps, (char_img.shape[1], char_img.shape[0]))
    while ret:
        # 讀取視頻的當前幀，如果沒有則跳出循環
        ret, frame = cap.read()
        if not ret:
            break
        # 將當前幀轉換成字符圖
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        char_img = get_char_img(gray, 4)

        # 轉換成BGR模式，便於寫入視頻
        char_img = cv2.cvtColor(char_img, cv2.COLOR_GRAY2BGR)
        writer.write(char_img)
    writer.release()


if __name__ == '__main__':
    generate('in.mp4', 'out.mp4')

我們隻需要修改generate的參數就好瞭。完整效果視頻如下：

到此這篇關於Python生成字符視頻的實現示例的文章就介紹到這瞭,更多相關Python生成字符視頻內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Python生成字符視頻的實現示例

一、前言

二、OpenCV的操作圖像

2.1、讀取和顯示

2.2、灰度轉換

2.4、獲取圖片尺寸並修改尺寸

2.5、繪制文字

2.6、讀取視頻

2.7、寫入視頻

三、像素映射成字符

四、生成字符圖片

五、生成字符視頻

推薦閱讀：

發佈留言取消回覆

近期文章

一、前言

二、OpenCV的操作圖像

2.1、讀取和顯示

2.2、灰度轉換

2.4、獲取圖片尺寸並修改尺寸

2.5、繪制文字

2.6、讀取視頻

2.7、寫入視頻

三、像素映射成字符

四、生成字符圖片

五、生成字符視頻

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆