pcm語音編碼
主要過程是將語音等模擬訊號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四捨五入取整量化,同時將抽樣值按一組二進位製碼來表示抽樣脈衝的幅值。也就是說語音頻號最終以脈衝形式編碼。
有一定電子基礎的都知道感測器採集音訊訊號是模擬量,而我們實際傳輸過程中使用的是數字量。而這就涉及到模擬轉數字的過程,下面將進行介紹。
1 pcm編碼原理
pcm 脈衝編碼調製是pulse code modulation的縮寫。脈衝編碼調製是數字通訊的編碼方式之一。主要過程是將話音、影象等模擬訊號每隔一定時間進行取樣,使其離散化,同時將抽樣值按分層單位四捨五入取整量化,同時將抽樣值按一組二進位製碼來表示抽樣脈衝的幅值。
模擬訊號數位化必須經過三個過程,即抽樣、量化和編碼。
1.1抽樣
抽樣是把模擬訊號以其訊號頻寬2倍以上(來奎斯特取樣定理)的頻率提取樣值(取樣率),變為在時間軸上離散的抽樣訊號的過程。
取樣率:每秒從連續訊號中提取並組成離散訊號的取樣個數,用赫茲(hz)來表示。
sample:
如音訊訊號取樣率為8000hz。
可以理解上圖取樣對應圖中 那段電壓隨時間變化的曲線 為1秒 那下面那個1 2 3 …10那就因該有1-8000個點,即將1秒均分為8000份,依次取出來那8000個點時間 對應的電壓值。
1.2 量化
抽樣訊號雖然是時間軸上離散的訊號,但仍然是模擬訊號,其樣值在一定的取值範圍內,可有無限多個值。必須採用「四捨五入」的方法把樣值分級「取整」,使一定取值範圍內的樣值由無限多個值變為有限個值。這一過程稱為量化。
取樣位數:指的是描述數碼訊號所使用的位數。
8位(8bit)代表2的8次方=256,16 位(16bit)則代表2的16次方=65536;
sample:
如音訊感測器採集到的電壓範圍為0-3.3v,取樣位數為8bit(位)
即我們把3.3v/ 2^8 = 0.0128 即為量化精度。
我們把3.3v分成0.0128為步進的y軸,如圖3中的1 2 …8就變成了0 0.0128 0.0256 …..3.3 v
比如某個取樣點的電壓值為1.652v(128*0.128 與 129*0.128之間) 我們對它四捨五入就為1.65v 對應 量化等級為128 。
1.3 編碼
量化後的抽樣訊號就轉化為按抽樣時序排列的一串十進位制數字碼流,即十進位制數碼訊號。簡單高效的資料系統是二進位製碼系統,因此,應將十進位制數字**變換成二進位制編碼。根據十進位制數字**的總個數,可以確定所需二進位制編碼的位數,即字長(取樣位數)。這種把量化的抽樣訊號變換成給定字長的二進位製碼流的 過程稱為編碼。
sample:
接著上面的1.65v 對應 量化等級為128 。對應的2進製為10000000 。即該取樣點編碼後結果為10000000 。當然這是沒有考慮正負值情況下的編碼方式,而且編碼方式種類非常多,需要具體問題具體分析。(pcm音訊格式編碼為a律13折線編碼)
2 pcm音訊編碼
pcm訊號未經過任何編碼和壓縮處理(無失真壓縮)。與模擬訊號比,它不易受傳送系統的雜波及失真的影響。動態範圍寬,可得到音質相當好的效果。
2.1 pcm編碼
編碼上採用了的是a律13折線編碼。
具體可參考:
2.2 聲道:
單聲道聲音檔案,取樣資料為八位的短整數(short int 00h-ffh);
雙聲道立體聲聲音檔案,每次取樣資料為乙個16位(取樣位數仍是8bit)的整數(int),高八位(左聲道)和低八位(右聲道)分別代表兩個聲道。
pcm的每個樣本值包含在乙個整數i中,i的長度為容納指定樣本長度所需的最小位元組數。
首先儲存低有效位元組,表示樣本幅度的位放在i的高有效位上,剩下的位置為0,這樣8位和16位的pcm波形樣本的資料格式如下所示。
2.3 取樣頻率
人對頻率的識別範圍是 20hz - 20000hz, 如果每秒鐘能對聲音做 20000 個取樣, 回放時就足可以滿足人耳的需求.
8000hz 為**取樣。
22050 的取樣頻率是常用的。
44100已是cd音質, 超過48000的取樣對人耳已經沒有意義。
一般情況下,一幀pcm是由2048次取樣組成的。
2.4 取樣位數
每個取樣資料記錄的是振幅, 取樣精度取決於儲存空間(取樣位數)的大小:
1 位元組(也就是8bit) 只能記錄 256 個數, 也就是只能將振幅劃分成 256 個等級
2 位元組(也就是16bit) 可以細到 65536 個數, 這已是 cd 標準了;
4 位元組(也就是32bit) 能把振幅細分到 4294967296 個等級, 實在是沒必要了
如果是雙聲道(stereo), 取樣就是雙份的, 檔案也差不多要大一倍.
2.5 位元率
位元速率是指經過編碼後的音訊資料每秒鐘需要用多少個位元來表示
2.6 有損和無損
對於我們最常說的「無損音訊」來說,一般都是指傳統cd格式中的16bit/44.1khz取樣率的檔案格式,而知所以稱為無失真壓縮,也是因為其包含了20hz-22.05khz這個完全覆蓋人耳可聞範圍的頻響頻率而得名。
物理搬磚問題 搬磚姿勢 風法
1 前言 這個角色在男魔法裡面應該是最快的了,不管是技能範圍,還是技能釋放時間,都是又大又快的,加上有兩個跑圖技能,能夠更加的流暢搬磚,也不怎麼吃裝備,所以一直以來,都深受搬磚玩家的熱愛,那麼這個角色該如何搬磚呢,請看下面 2 裝備 稱號 海洋霸主 買今年年套稱號或者去年的國慶稱號,那個便宜買那個 ...
搬磚 動態規劃
小易有n塊磚塊,每一塊磚塊有乙個高度。小易希望利用這些磚塊堆砌兩座相同高度的塔。為了讓問題簡單,磚塊堆砌就是簡單的高度相加,某一塊磚只能使用在一座塔中一次。小易現在讓能夠堆砌出來的兩座塔的高度盡量高,小易能否完成呢。輸入描述 輸入包括兩行 第一行為整數n 1 n 50 即一共有n塊磚塊 第二行為n個...
ros 簡介(搬磚)
今天開始入坑ros 1977年9月,intel公司創始人羅伯特 諾伊斯撰文預言 計算機將走進千家萬戶。四十年過去了,我們有目共睹,這個預言早就變成了現實!2007年1月,比爾 蓋茨在 科學美國人 上撰文預言 機械人即將重複個人電腦崛起的道路,走進千家萬戶。十年過去了,我們有目共睹,這個預言正將變成現...