kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度(beamangle),乙個聲源角度(soundsourceangle)。波束角度是把100度分成10分,分別為50,40,30,20,10,0,-10,-20,-30,-40,-50這11個值,只要在相應的範圍內,取樣就不會重新進行,比如現在在kinect for windows的0度方向,大體上在-5或5的範圍內,波束角度都不會更新。聲源角度就不一樣了,只要聲音達到一定的分貝,它就採信,同時它還跟隨著乙個可信度的值,為0~1之間,1是最可信的,就是聲音的**確定性是最可信的。我們可以通過這兩個引數結合骨骼定位能就kinect for windows周圍的人進行較為準確的定位。
同時,kinect物件有乙個audiosource的屬性,它有乙個start方法,可以返回錄音的資料流。我們對這些資料進行處理就可以。
建立乙個winform
現在看後台**:
publicpartial
class
form1 : form
kinectsensor kinectsensor =
null
; private
void
form1_shown(
object
sender, eventargs e)
} } private
void
form1_formclosing(
object
sender, formclosingeventargs e)
} private
void
audioreadingthread()
audiostream.close();
} stream.close();
} //讓錄音按鈕生效
startrecord_but.enabled =
true
; }
//波束角度採集方法
private
void
audiosourcebeamchanged(
object
sender, beamanglechangedeventargs e)
//聲源角度和可信度採集方法
private
void
audiosourcesoundsourceanglechanged(
object
sender, soundsourceanglechangedeventargs e)
private
thread readingthread;
///
/// 整型轉陣列
///
private
static
void
longtointbinary(
long
val,
byte
array,
intoffset)
///
/// 位元組轉短整型
///
private
static
void
bytetoshortbinary(
byte
val,
byte
array,
intoffset)
///
/// 將超過0x7fff的short型別儲存為int型別。本方法提供了將有符號short型別轉換儲存在位元組陣列中,佔據兩個位元組
///
private
static
void
toshortbinary(
intval,
byte
array,
intoffset)
private
void
startrecord_but_click(
object
sender, eventargs e)
}
語音資料(Audio Data)
kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度 beamangle 乙...
語音資料(Audio Data)
kinect for windows有四個麥克風,組成乙個麥克風陣列,可以採集外部傳來的聲單,不但可以收集,還可以除噪,識別。kinect for windows可以識別正前主100度範圍的聲單。kinect for windows通過兩組陣列來定位聲單的方向,乙個是波束角度 beamangle 乙...
C 語音識別(文字to語音 語音to文字)
最近打算研究一下語音識別,但是發現網上很少有c 的完整 就把自己的學習心得放上來,和大家分享一下。1 speechsdk51.exe 67.0 mb 2 speechsdk51langpack.exe 81.0 mb 文字to語音 這個相當的簡單。1 在com選項卡裡面的microsoft spee...