Python3.7 + Yolo3實現識別語音播報功能

Posted on 2021-12-25 by WalkonNet

一、利用Python調用系統win10的文字轉語音

首先下載需要用到的庫：pip install pyttsx3 -i https://mirrors.aliyun.com/pypi/simple/

接下來直接上代碼：

import win32com.client as win

# SpVoice類是支持語音合成(TTS)的核心類。通過SpVoice對象調用TTS引擎，從而實現朗讀功能
speak = win.Dispatch("SAPI.SpVoice")
# 完成將文本信息轉換為語音並按照指定的參數進行朗讀。
# 該方法有Text和Flags兩個參數，分別指定要朗讀的文本和朗讀方式（同步或異步等）。
speak.Speak("come on")
speak.Speak("你好")

最後運行代碼，就會聽到系統傳出來的聲音，讀出瞭 come on 和你好。

二、開始使用Yolo識別，利用語音播報返回出來

開始之前我們先得解析出來Yolo3的代碼，從而獲取到被識別出來的物體標簽。

首先我們找到一個coco_classes.txt，發現裡面有很多的英文單詞，這些就是準備識別匹配的標簽瞭。

在這裡插入圖片描述

然後我們在找到yolo.py，發現的我們的coco_classes.txt被傳入進來瞭

在這裡插入圖片描述

關鍵的來瞭，我們通過Ctrl + F 搜索一下classes_path這個Key，發現這幾行代碼

在這裡插入圖片描述

這裡就是讀取瞭存放標簽的那個文本，進行瞭處理，並且返回瞭名字。

最後找到這一行代碼，此處代碼就是一開始進行識別的時候，我們的控制臺打印出來的代碼。

在這裡插入圖片描述

運行代碼的時候發現，打印的這個label，就是識別出的物體的標簽瞭。

這個時候我們就可以將我們的語音播報的代碼添加進行，把label傳入進去，就會發現識別出來的物體就會通過語音返回。

在這裡插入圖片描述

Time~

到此這篇關於Python3.7 + Yolo3識別語音播報的文章就介紹到這瞭,更多相關Python識別語音內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet！

Python3.7 + Yolo3實現識別語音播報功能

一、利用Python調用系統win10的文字轉語音

二、開始使用Yolo識別，利用語音播報返回出來

推薦閱讀：

發佈留言取消回覆

近期文章

一、利用Python調用系統win10的文字轉語音

二、開始使用Yolo識別，利用語音播報返回出來

推薦閱讀：

發佈留言 取消回覆

近期文章

標籤

發佈留言取消回覆