淺談盤點5種基於Python生成的個性化語音方法

    小編在很小的時候就特別喜歡搞怪,模仿別人的聲音,尤其是老頭老太太模仿的那是一個出神入化。

    今天小編就帶大傢模仿一下個性化的聲音,不過不是用小編的嘴,而是用程序,看它們都是怎麼被模仿出來的。

1、gtts模塊

    這是一款語音模塊,它可以將任意文字轉換為音頻文件,格式為mp3。下面我們一起來看看它的用法:

一、安裝並導入:

pip install gtts
from gtts import gTTS

二、配置gtts客戶端

tts = gTTS(text=text, lang='zh-tw')

text:音頻內容
lang: 音頻語言

三、保存音頻文件

tts.save("XXX.mp3")

2、baidu-aip

    通過在百度開放開發者平臺申請語音合成賬號來生成音頻文件。

 

# 下載baidu-aip模塊並導入
from aip import AipSpeech
""" 你的 APPID AK SK """
APP_ID = '你的 App ID'
API_KEY = '你的 Api Key'
SECRET_KEY = '你的 Secret Key'
client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) #配置百度語音客戶端
res=client.synthesis(text,lang,1,options={
spd:語速,取值0-9,默認為5中語速,
pit:音調,取值0-9,默認為5中語調,
vol:音量,取值0-15,默認為5中音量,
per:發音人選擇, 0為女聲,1為男聲, 3為情感合成-度逍遙,4為情感合成-度丫丫,默認為普通女
}) #配置個性化語音
with open('XX.mp3','wb') as f: #打開文件流
f.write(res)  #寫入文件

3、pyttsx3

這也是一款優秀的文字轉語音的模塊,它生成的音頻文件也比較具有個性化。

下載pyttsx3模塊並導入:

pip install pyttsx3
import pyttsx3

初始化:

pp = pyttsx3.init()

添加語音文本:

pp.say('Hello World')

運行:

pp.runAndWait()

當然它還可以調整聲音的音量,頻率,變聲,當然設置方法都差不多,都是先拿到它對應功能的值然後在進行加減。

比如說音量調節:

vol=pp.getProperty('volume')
pp.setProperty('vol',vol+0.5)

對於發音,頻率,變聲則為 vioce,rate,vioces,是不是很好理解瞭?當然,如果你想讓它循環播放,隻需加一個事件驅動循環即可:

pp.startLoop()

4、pywin32

操作window dll的庫,它可以實現很多功能,十分強大。

安裝並且導入:

pip install pywin32
import win32com.client

配置客戶端接口:

speaker = win32com.client.Dispatch("SAPI.SpVoice")

生成音頻:

speaker.Speak("hello")

由於對中文支持不友好,所以基本用的不多。

5、speech

也是一款強大的語音模塊,依賴於pywin32,而且它最適合做語音啟動程序瞭。

下載並導入:

pip install speech
import speech

生成音頻:

speech.say('hello')

這麼多音頻模塊,你瞭解多少瞭,到底哪一個才是你的菜呢?

到此這篇關於淺談盤點5種基於Python生成的個性化語音方法的文章就介紹到這瞭,更多相關Python生成個性化語音內容請搜索WalkonNet以前的文章或繼續瀏覽下面的相關文章希望大傢以後多多支持WalkonNet!