(我選擇使用python sdk 進行開發)
兩個方法都行:
若安裝了pip:
pip install baidu-aip
若安裝了setuptools:
python setup.py install
若在python 環境下import aip
沒有報錯,即說明sdk 安裝成功。
aipspeech是語音合成的python sdk 客戶端,為使用語音合成的開發人員提供了一系列的互動方法。
from aip import aipspeech
api_key =
'你的 api key'
secret_key =
'你的 secret key'
若大家需要配置aipspeech的網路請求引數(一般不需要配置),可以在構造aipspeech之後呼叫介面設定引數,目前只支援以下引數:
介面說明
setconnectiontimeoutinmillis
建立連線的超時時間(單位:毫秒)
setsockettimeoutinmillis
通過開啟的連線傳輸資料的超時時間(單位:毫秒)
合成一段語音檔案:
result = client.synthesis(
,'zh',1
,)# 識別正確返回語音二進位制 錯誤則返回dict 參照下面錯誤碼
ifnot
isinstance
(result,
dict):
with
open
('auido.***'
,'wb'
)as f:
f.write(result)
引數
型別描述
是否必須
texstring
合成的文字,使用utf-8編碼,請注意文字長度必須小於1024位元組
是cuid
string
使用者唯一標識,用來區分使用者,填寫機器 mac 位址或 imei 碼,長度為60以內
否spd
string
語速,取值0-9,預設為5中語速
否pit
string
音調,取值0-9,預設為5中語調
否vol
string
音量,取值0-15,預設為5中音量
否per
string
發音人選擇, 0為女聲,1為男聲,3為情感合成-度逍遙,4為情感合成-度丫丫,預設為普通女
否若成功合成語音,則result
就是一段代表語音資訊的二進位制資料流,否則就是一段錯誤資訊(可列印出來檢視)
合成之後我們就可以把這段二進位製流寫到乙個.***
檔案中
)若是系統無法區分我們想要其發出的音調,例如「重心」
和「重慶」
,這個「重」
很明顯是發不同的音的,這就需要我們在合成語句的text 中進行說明:
result = client.synthesis(
'我愛重(chong2)慶'
,'zh',1
,)
利用百度AI 合成語音2
文字合成語音 coding utf 8 from aip import aipspeech from playsound import playsound 20232679 api key bzcwdbzfnlynja63iuc6jdxk secret key w0dexqbht0e3ifvphhv...
百度AI開放平台,共建AI生態
以下為劉倩老師演講實錄 各地開發者將ai能力應用在各行各業 120多項場景化能力與解決方案,幫助各行業快速實現ai公升級 多項能力永久免費,全面普惠開發者 定製訓練平台,快速轉化企業定製化需求 ai開放平台最底層是paddlepaddle,既然有了定製化訓練平台,那為什麼還有paddlepaddle...
csharp 百度語音合成
public string api id 3333 你的id public string api record null public string api record format null public string api record hz null public string api k...