**濁音的聲帶振動基本頻率(fundamental frequency)稱為基音頻率。
濁音的基音頻率(pitch):**???????????
語音生成系統和語音感知系統
語音頻號生成的數學模型
語音頻號的特性分析
語音頻號處理是以語音語言學和數字訊號處理為基礎的綜合性學科,是用數字訊號處理技術對語音頻號進行處理的一門學科。
說話人識別(聲紋識別)和語種識別是語音識別的兩種特殊形式。說話人識別力求找出包含在語音頻號中說話人的個性因素,強調不同人之間的特徵差異。語種識別則要從乙個語音片段中判別是哪個語種,所以要盡可能找出不同語種間的差異。
語音轉換是保持語義資訊不變,僅改變乙個說話人的語音個性特徵,使其聽起來像liangyige另乙個人的語音個性特徵。
抗雜訊技術有三類解決方法:語音增強演算法,尋找穩健的語音特徵,基於模型引數適應化的雜訊補償演算法。解決雜訊問題的根本是實現雜訊和語音的自動分離。
語音頻號處理的理論和研究包含兩個方面:從語音的產生和感知來對其進行研究;將語音作為一種訊號來處理。
語音(speech)是聲音(acoustic)和語言(language)的組合體
語音學:語音中各個音的物理特徵和分類的研究。包括發音語音學,聲學語音學,聽覺語音學。y
人的說話過程分為5個階段:想說階段,說出階段,傳送階段,接受階段,理解階段
語音特徵:
音節:說話時一次發出的,具有乙個響亮的中心,並被明顯感覺到的語音片段
音素:語音發音的最小單位
母音:當聲帶振動發出的聲音氣流從喉腔、咽腔進入口腔從唇腔出去時,這些聲腔完全開放,氣流順利通過。(母音是音節的主幹)
子音:子音撥出的是聲流,通路的一部分封閉起來或受到阻礙。(出現在音節的前端或後端或前後兩端)
濁子音:發子音時聲帶振動
清子音:發子音時聲帶不振動
半母音:聲道基本暢通,但某處聲道比較狹窄,引起輕微的摩擦聲
母音和子音的區別:
產生母音條件:
決定母音音色的主要因素是舌頭的形狀及位置,口型。
共振峰/共振峰頻率:母音的重要聲學特性,當母音激勵進入聲道時會引起共振特性,產生一組共振頻率。常用三個共振峰,f1, f2, f3
調音點:子音發音時的阻礙位置
調音方式:子音發音時的阻礙方法
根據調音方式不同分為:
超高音特徵:音高,音強,音長。(表現說話人感情的重要特徵)
漢語的聲母和韻母
21個聲母,36個韻母
漢語音節的一般結構
過渡段:
漢語聲母的結構人的發音器官:肺,氣管,喉,咽,鼻,口
聲門:喉的部分
聲道:聲門到嘴唇的呼吸通道
音調週期:聲帶每開啟和閉合一次的時間
音調頻率:音調週期的倒數
調音:聲道各器官對語音的作用
同時掩蔽:同時存在的乙個弱訊號和強訊號頻率接近時,強訊號會提高弱訊號的聽閥。
短時掩蔽:兩個聲音不同時存在。後向掩蔽,前向掩蔽。
激勵模型
濁音激勵: 間歇脈衝波類似於斜三角模型(二階低通),斜三角波形串相當於乙個加權了單位脈衝串激勵單個斜三角模型的結果。
清音激勵: 模擬隨機白雜訊。
聲道模型
聲管模型:聲道視為多個等長的不同截面積的管子串聯
共振峰模型:聲道視為乙個共振腔
共振峰模型分為級聯型,併聯型,混合型
級聯型:認為聲道時一組串聯的二階諧振器,對於一般母音,採用全極點模型。(腔體共振)
併聯型:非一般母音和大部分子音,必須考慮零極點模型。(腔體產生**振)
混合型:根據語音,自動切換
輻射模型
輻射引起的能量消耗正比於輻射阻抗的實部,輻射模型是一階高通濾波器。
第乙個是【∫】,表現為亂紋,能量小
第乙個是【ʌ】,表現為橫槓,能量大
語音頻號的預處理
2014年09月05日 綜合 共 1116字 字型大小 小 中 大 回顧上兩次的內容 上次主要說了音訊檔案的讀取 主要是matlab和c語言 感覺有幾個概念有點混淆 語音 音訊 語音英文是speech,音訊是audio,是music。據我的理解是音訊包括語音和 不知道這麼理解對不?此外,讀取音訊其實...
語音頻號處理共振峰
首先,什麼是語譜圖。最通常的,就是語音短時傅利葉變換的幅度畫出的2d圖。之所以是通常的,是因為可以不是傅利葉變換。窄帶 顧名思義,頻寬小,則時寬大,則短時窗長,窄帶語譜圖就是長窗條件下畫出的語譜圖。寬頻 正好相反。至於 橫豎條紋 窄帶語譜圖的帶寬窄,那麼在頻率上就 分得開 即能將語音各次諧波 看得很...
語音頻號處理概述及流程
一 語音頻號處理的三個主要方向。1,語音合成。語音合成的是為了讓計算機產生高質量的 高自然度的連續語音。計算機語音合成系統又稱文語轉換系統 tts 主要是將文字輸出語音。發展過程 共振峰合成 lpc合成 psola技術。2,語音編碼。在語音頻號傳輸過程中,頻率資源的合理使用,顯得很珍貴,所以在傳輸之...