rgb 取值範圍 RGB W 當視覺遇上無線

2021-10-12 18:12:52 字數 2009 閱讀 9830

**筆記

**:《rgb-w: when vision meets wireless 》

年份:2015

在影象資訊上加上深度資訊(rgb-d)有助於室內人類行為的分析,但裝置難以部署。已經被部署的單目攝像頭又難以獲取深度資訊,還有自遮擋的問題。所以作者選擇w,即來自手機的無線訊號(藍芽,wi-fi,beacon)作為補充影象(rgb)的感官,包括接受訊號強度(rss)和mac位址。

因為rgb和w是互補的:

作者的解決方案就是將rgb和w在統一框架下整合起來

為了利用w資料,作者提出一系列表示使得w與rgb融合。

對第i個帶w的個體,在時間t收集到如下訊號

其中​

是第j個天線收到的訊號強度,在沒有雜訊的情況下,

​代表到第j個天線的距離。

其中 ​和​

在已知參考點被校準,​

是路徑損失指數。

作者取​

為1m(距離天線),​

為3.5(應當在2到4之間)

事實上,rss訊號是有雜訊且各向異性的

上圖是誤差情況,左圖是未進行修正的情況,右圖是修正後的情況。

作者使用了乙個時間視窗內所有j個天線,所有天線都可以驗證其他天線是否有誤差,作者使用分類器來識別給出結果一致的天線。

例如上圖中三個黑色天線給出的結果能吻合,而紅色的因為雜訊而不能與黑色的天線給出的結果吻合,作者需要找出這樣紅色的天線。

令​ 為t時刻從第j天線給出的正確半徑,令

其中​

為天線數量,​

對所有天線都是常量,而

​是變數,當

​與ground truth相距1.5m時令

​,然後在​

樣本上訓練svm。這樣可以將誤差減小到0.2m。

令​ 為下界,​

為下界,給出​

取值範圍

作者使用支援向量回歸來確定上下界。於是就能在影象上定位了。

作者的目的是從rss資料和單幅相機影象推測出個體的位置,作者將其構造成最佳子集選擇的問題

其中x表示離散化的分布於地平面的點,b是給定時間內的觀測資料,a是每個x期望的觀測點的字典,n為雜訊等級,作者希望找到乙個稀疏的x能重建b。

作者為了表示每個人在地平面上點的理想觀測構造了乙個字典。其中每一列(或者說元素),代表期望的前景影象和環圖。字典大小為

,其中n是元素的大小,m是地平面的大小。

因為前景影象和環圖都沒有更細節的資訊,所以都可以被無損的縮小到

字典有如下性質

元素的線性:前景圖是沒有線性的,環圖是有線性的,可以加起來去匹配觀測資料。

不完整的元素:w是稀疏的,只有一部分人會發出訊號,只有一部分天線會被使用。對每個地平面的點會對應有多列

最後i+3列是單純由前景剪影組成的

觀測向量b表達為

(6)式是np難題,作者希望使用資料的多模態,特別是w模態來簡化它。

其中​是稀疏度和保真度的權衡。

作者將(8)看作是套索問題,稀疏度由於id是已知的。但無法解出不傳送訊號的點。

int long long long取值範圍

unsigned int 0 4294967295 int 2147483648 2147483647 unsigned long 0 4294967295 long 2147483648 2147483647 long long的最大值 9223372036854775807 long long的...

型別取值範圍

ieee754浮點數的表示方法。c語言裡對float型別資料的表示範圍為 3.4 10 38 3.4 10 38。double為 1.7 10 308 1.7 10 308,long double為 1.2 10 4932 1.2 10 4932.型別位元 位 數 有效數字 數值範圍 float 6...

int 取值範圍

參考 目錄原碼 最高位為符號位 0表示正,1表示負 反碼 對於乙個帶符號的數來說,正數的反碼與其原碼相同,負數的反碼為其原碼除符號位以外的各位取反 補碼 正數的補碼與其原碼相同,負數的補碼為其反碼在最低為加1 計算機中採用補碼形式儲存資料,0的補碼表示只有一種 c 中int佔4個位元組,32位 最大...