音訊資訊處理技術主是多**技術的主要組成之一。本文主要介紹音訊資訊處理技術的基本原理和應用。
音訊(audio),指人耳可以聽到的聲音頻率在20hz~20khz之間的聲波。
模擬音訊:在時間和幅度上都是連續變化的。
數字音訊:在時間和幅度上都是離散、不連續的。
計算機中使用的是數字音訊。自然界的聲音一般都是模擬音訊,所以在計算機中需要對模擬訊號進行數位化。具體過程包括取樣、量化、編碼。
取樣率音質頻率範圍
8khz
**0~4khz
11.025khz
低於am廣播
0~5.512khz
22.05khz
接近於am廣播
0~11.025khz
32khz
優於於fm廣播
0~16khz
44khz
cd-da
0~22khz
48khz
標準***
0~24khz
96khz
高階***
0~48khz
量化位數
音質量化等級
動態範圍
8bit
**256
48db
16bit
cd65,536
96db
24bit
***16,777,216
144db
32bit
頂級4,294,967,296
192db
這種方法通過用脈衝編碼量化後的值來代表模擬訊號的幅度,即用二進位制的大小來代表模擬訊號的幅度。在接收端再將這些編碼的二進位制數還原為原來的模擬訊號。
%%
clear
close all
clc
%% dt = 0.00001; %時間間隔
f = 20;%訊號頻率
t = 1/f;%週期
t = 0:dt:3*t;%顯示3個週期
w = 2*pi/t;%
a = 2 ;
vt = a*(cos(w*t)+1)+a*(cos(0.5*w*t)+1);%產生原始訊號,隨便寫的
figure;
plot(t,vt);%顯示原始函式
%%fs = 100;%取樣頻率 fs>= 2*f
t1 = 0:1/fs:3*t;%顯示3個週期
vs = a*(cos(w*t1)+1)+a*(cos(0.5*w*t1)+1);
hold on;
stem(t1,vs,'r');%顯示取樣
hold on;
plot(t1,vs,'b');%顯示取樣後的函式
%%m=15; %0~15 4bit
pcm=round(m*vs/m);
hold on;
plot(t1,pcm,'g');%pcm資料
一段pcm資料是需要幾個引數配合使用:
dm是繼pcm後出現的又一種模擬訊號數位化的方法。
(1)在位元率較低時,增量調製的量化訊雜比高於pcm的量化訊雜比;
(2)增量調製的抗誤碼效能好。能工作於誤位元速率為10−
210^
10−2
~ 10−3
10^10
−3的通道中,而pcm要求誤位元率通常為10−
410^
10−4
~ 10−6
10^10
−6;(3)增量調製的編解碼器比pcm簡單。
增量調製是用一位二進位製碼表示相鄰抽樣值相對大小的一種a/d轉換方式。它對當前訊號瞬時值與前乙個抽樣值的差值進行量化,並且是對這個差值的符號進行編碼,而不是對差值的大小進行編碼。
對輸入對相鄰樣本之差編碼而不是對樣本本身編碼,由於相鄰樣本之差比實際樣本幅度小,所以表示差訊號需要較小的位數。
一種效能比較好的波形編碼。它的核心想法是:1.利用自適應改變量化階的大小,即使用小的量化階去編碼小的差值,使用大的量化階去編碼大的差值。2.使用過去的樣本值估算下乙個輸入樣本的**值,使實際樣本也**值之間的差值總是最小。
##常見編碼格式
音訊技術學習筆記
音訊技術學習筆記 全稱 mpeg audio layer 3。cd 全稱 compact discs。沒有壓縮過的數字音訊訊號非常的大,一秒鐘的雙聲道cd質量的訊號需要1.4m的儲存空間。知覺編碼技術 perceptual coding techniques 編碼技術是德國fraunhofer ii...
介紹一種音訊訊號分類方法
能用來區分語音和 訊號的音訊特徵有很多種,如感覺特性 能量 功率譜和mel頻標倒譜 mfcc 係數,能量 平均過零率 基頻和功率譜峰值等。以下介紹一種基於子帶音調個數比與頻譜傾斜度相結合的區分方法。一 基本原理 不同型別的音訊,其音調分量在各個子帶的分布有所不同。語音的音調分量絕大部分分布在低頻處,...
電子設計大賽音訊訊號分析儀
摘要 根據競賽題目要求和現有條件的條件,本作品完成了以通用計算機的為核心的音訊訊號分析儀。本儀器系統組成為 被測物件 感測器 訊號調理 資料採集 虛擬儀器軟體和計算機軟體系統平台。被測訊號首先經感測器轉化為電訊號,然後由訊號調理器進行去噪 濾波及前級放大等預處理,然後通過整合晶元進行音訊訊號的採集和...