作者:zhixian yan——瑞士epfl
摘要:
gps軌跡收集極其普遍,如何收集、整理、檢索、挖掘這些資料成為了研究的熱點。但是,大多數工作都基於軌跡的時空特性展開,沒有充分開發高層的軌跡語義特性。本文通過結合語義概念和統計學方法來進行軌跡資料分析:主要包含如下三個方面:軌跡模型、軌跡計算和軌跡資料探勘。
主要內容:
同時,軌跡挖掘領域挖掘出的具有語義特性的知識(大多數也是基於軌跡的時空屬性展開的,資料處理量大,費時),也可以看作一種語義軌跡,但是這種知識距離使用也很遠。
2、 本文工作:a、由上至下(top-down)的軌跡模型(同時包含集合屬性和語義屬性);b、軌跡計算:由下至上(down-top)將原始gps軌跡通過計算(設計軌跡預處理、分段、停點挖掘演算法)轉化為語義軌跡(移動,停止模型,並結合現實世界的語義知識);c、基於語義軌跡,設計軌跡模式挖掘演算法(不同於基於原始資料的方法)。
則:軌跡的語義表示方式如下:(注:為了支援自動推理,文中提出了本體庫)
語義軌跡的表示方法:起點,移動,停點,終點。
5、 語義軌跡挖掘:同傳統挖掘演算法的差別是,輸入為語義軌跡(起始、終點,重要的停點等)大大降低了資料量。
語義軌跡資料分析 一種概念和計算方法
作者 zhixian yan 瑞士epfl 摘要 gps軌跡收集極其普遍,如何收集 整理 檢索 挖掘這些資料成為了研究的熱點。但是,大多數工作都基於軌跡的時空特性展開,沒有充分開發高層的軌跡語義特性。本文通過結合語義概念和統計學方法來進行軌跡資料分析 主要包含如下三個方面 軌跡模型 軌跡計算和軌跡資...
資料分析(一)基本模型與概念
主要概念 能力延伸 在本系列中所談及的資料分析主要是指比較基礎常見的技術操作,以及與文字挖掘 自然語言處理等的交叉部分 能力延伸部分是本人近日在準備春招過程中,參照不同企業的招聘需求和筆試題列舉出的部分考查點。疏漏之處請各位大佬指出。這系列的第一篇是作為字典使用的,總結本系列 現的基礎模型和主要概念...
資料分析寫作 程式設計師的另外一種輸出
辛苦做了三年的資料分析軟體,沒人知道我,寫了兩篇文章,倒引來了大量的關注。寫文章的目的 寫文章的理由可能有很多,對我來說,內外擴充套件交際圈,提高個人知名度的重要手段。對內能鍛鍊文筆,完善邏輯思維能力,從而能形成完整閉環。只不過寫文章對我來說,真沒那麼輕鬆,從構思到提筆,到最後的修訂,每個步驟都需要...