Python3.7 + Yolo3實現識別語音播報功能
一、利用Python調用系統win10的文字轉語音
首先下載需要用到的庫:pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/
接下來直接上代碼:
import win32com.client as win # SpVoice類是支持語音合成(TTS)的核心類。通過SpVoice對象調用TTS引擎,從而實現朗讀功能 speak = win.Dispatch("SAPI.SpVoice") # 完成將文本信息轉換為語音並按照指定的參數進行朗讀。 # 該方法有Text和Flags兩個參數,分別指定要朗讀的文本和朗讀方式(同步或異步等)。 speak.Speak("come on") speak.Speak("你好")
最後運行代碼,就會聽到系統傳出來的聲音,讀出瞭 come on 和 你好。
二、開始使用Yolo識別,利用語音播報返回出來
開始之前我們先得解析出來Yolo3的代碼,從而獲取到被識別出來的物體標簽。
首先我們找到一個coco_classes.txt
,發現裡面有很多的英文單詞,這些就是準備識別匹配的標簽瞭。
然後我們在找到yolo.py,發現的我們的coco_classes.txt
被傳入進來瞭
關鍵的來瞭,我們通過Ctrl + F 搜索一下classes_path
這個Key,發現這幾行代碼
這裡就是讀取瞭存放標簽的那個文本,進行瞭處理,並且返回瞭名字。
最後找到這一行代碼,此處代碼就是一開始進行識別的時候,我們的控制臺打印出來的代碼。
運行代碼的時候發現,打印的這個label,就是識別出的物體的標簽瞭。
這個時候我們就可以將我們的語音播報的代碼添加進行,把label傳入進去,就會發現識別出來的物體就會通過語音返回。
Time~
到此這篇關於Python3.7 + Yolo3識別 語音播報的文章就介紹到這瞭,更多相關Python識別語音內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!
推薦閱讀:
- 關於多種方式完美解決Python pip命令下載第三方庫的問題
- PIP安裝python包出現超時問題的解決
- Python中安裝庫的常用方法介紹
- python語音識別的轉換方法
- 沒有安裝Python的電腦運行Python代碼教程