Python3.7 + Yolo3實現識別語音播報功能

一、利用Python調用系統win10的文字轉語音

首先下載需要用到的庫:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/

接下來直接上代碼:

import win32com.client as win

# SpVoice類是支持語音合成(TTS)的核心類。通過SpVoice對象調用TTS引擎,從而實現朗讀功能
speak = win.Dispatch("SAPI.SpVoice")
# 完成將文本信息轉換為語音並按照指定的參數進行朗讀。
# 該方法有Text和Flags兩個參數,分別指定要朗讀的文本和朗讀方式(同步或異步等)。
speak.Speak("come on")
speak.Speak("你好")

最後運行代碼,就會聽到系統傳出來的聲音,讀出瞭 come on 和 你好。

二、開始使用Yolo識別,利用語音播報返回出來

開始之前我們先得解析出來Yolo3的代碼,從而獲取到被識別出來的物體標簽。

首先我們找到一個coco_classes.txt,發現裡面有很多的英文單詞,這些就是準備識別匹配的標簽瞭。

在這裡插入圖片描述

然後我們在找到yolo.py,發現的我們的coco_classes.txt被傳入進來瞭

在這裡插入圖片描述

關鍵的來瞭,我們通過Ctrl + F 搜索一下classes_path這個Key,發現這幾行代碼

在這裡插入圖片描述

這裡就是讀取瞭存放標簽的那個文本,進行瞭處理,並且返回瞭名字。

最後找到這一行代碼,此處代碼就是一開始進行識別的時候,我們的控制臺打印出來的代碼。

在這裡插入圖片描述

運行代碼的時候發現,打印的這個label,就是識別出的物體的標簽瞭。

這個時候我們就可以將我們的語音播報的代碼添加進行,把label傳入進去,就會發現識別出來的物體就會通過語音返回。

在這裡插入圖片描述

Time~

到此這篇關於Python3.7 + Yolo3識別 語音播報的文章就介紹到這瞭,更多相關Python識別語音內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!

推薦閱讀: