IGAL九期班學習筆記 袁曉茹

2021-09-26 02:44:41 字數 2953 閱讀 3934

本篇部落格用於記錄**袁曉茹老師在igal九期班中課程的學習筆記,其題目為《從易用到自動,大資料視覺化的下乙個十年》。袁老師從歷史中的視覺化的經典圖案出發,通過不同的古代視覺化有關的經典影象結合目前視覺化的上的研究與不足來講解,為我們講解了視覺化的作用與可繼續做研究的發展空間。

《從易用到視覺化的下乙個十年》——袁曉茹

計算機學科中的三匹馬:artifical intelligence、big data、computing power

1、視覺化的早期形態

視覺化/可視分析:

視覺化對事物建立心理模型或者心理影象

視覺化的早期形態 古代地圖 西元前天水放馬圖

引申到現在:很多視覺化的東西未必是地圖的形式但可以借助地圖這個例子來隱喻

實驗室的研究:dmap-把資訊的擴散把它看做乙個地圖,比如我在這我發了一條資訊,然後周圍或則

說朋友圈的人**了我的訊息,然後他的朋友又進行了**,這個就像是傳染病的擴散,也很像地圖上河流的

流淌等。那我們對於這樣乙個資訊的擴散也可以建立乙個地圖。

再比如事件,剛開始在討論事件本身,在然後討論事件對國家的影響,再往後討論將來可發生的0事件,像這樣

虛擬的事件也可以展現成地圖樣式的延伸。

倫敦霍亂地圖——>水井跟人類的關係——>人們從剛開始的單一只用地圖來記錄地理資訊到用地圖來記錄展現更多更複雜的

的資訊——>今天很多的研究都做了地理資訊,但都不太完善很大的發展空間。

2、視覺化系統

基於計算機的視覺化系統通過提供對資料的視覺表達形式來幫助人們更有效地完成特定任務

視覺化中人的因素:

*當可信的全自動解決方案存在時,不需要視覺化

*現實:許多分析問題不明確

不知道提前要問什麼問題

*可能性

*對於資料的互動清洗、理解

*給終端使用者長期使用

*展示已知的結果

*在開發模型之前更好地理解需要的墊腳石

*幫助開發人員完成對自動解決方案的細化/除錯,確定引數

*幫助終端使用者自動解決方案的驗證,建立信任

為什麼使用外部表達?

........

可以通過聲音來考慮怎樣加強視覺化的東西

視覺化構造的設計空間

在構造設計的空間巨大

不同的顏色可以產生不同的組合

3、視覺化發展之「史」前時代

在十九世紀計算機還沒問世時就有相當多的視覺化圖形問世建立

上世紀初建立出了統計圖表

美國的全國人口調查,需要用大量的圖表,進而推**表的發展

**********==手動作圖***********************************=

1980-2023年:視覺化的發展創始時代

2006-now:視覺化發展之 分析|大眾時代

d3、vgea、人工智慧等大大的提高了資料視覺化的推廣

美歐奧可視分析合作國際

美國陸軍-《2016-2023年新興科技趨勢報告》

we need better visualization techniques that allow human decision-makers to understand patterns

in complex,multi-dimensional data sets.

視覺化被例如2023年美國商務部工業安全部署技術出口管制

網頁中搜尋出的視覺化介面千篇一律

從vast challenge 2017中對視覺化認識視覺化:

以紅冠藍雀為背景來用視覺化的方法來研究其紅冠藍雀減少的原因。

進出保護區的人員各種記錄資料量巨大,通過視覺化的方法來發現可疑進出人員以及類似可能的「犯罪嫌疑人」

做的工作:

視覺化檢視包括:

左側列表為頻繁序列列表用於表示出入最為頻繁的人和車

然後是車輛列表、標籤檢視

中間是投影檢視:用聚類演算法將經常去的地點的車輛進行聚類

左下角是時間檢視

左半部分是空間檢視和車輛列表,空間檢視用來展示在車輛列表中選中的車輛然後在空間檢視

中展示車輛進入保護區的路線。

*基礎資訊的展示:

*空間資訊

*路網與監測站

*車輛軌跡

*時間資訊

*時間分布與週期規律

*序列資訊

*軌跡的監測站序列

*遇到的難題:

基礎檢視:難當大任

*資料量大,不可能逐一查閱

*難以找到分析的切入口

*頻繁序列挖掘

*頻繁子串行:常見的交通路線

*經過同一路線的車輛

*基於相似性的排序

其中的一些處理經過

資料轉換

1、將檢測站看做維度

2、統計每輛車通過監測站的次數

3、形成40*18708的高維資料

降維投影

採用t-sne加強聚類效果

展現車輛行為的相似性

得到的結果:

十個明顯的主要聚類

若干個小型聚類

發現問題:

通過交通路線圖發現一些問題:有一些車輛繞行->為何要繞行?

通過發現這一問題找出了護林員車輛和違禁車輛

然後在t-sne聚類上標識顏色表示

通過時間和影響的聯絡發現排出廢品的車輛

用該案列來介紹視覺化解決問題的乙個過程

隕石撞擊深海的影響與研究ieee vis 2018

多變數對做視覺化的問題:

how to make visualization easy to use ?

怎樣讓視覺化易於使用?如製作周期長要容易去產生、受很多訓練才能解決問題

解決好容易去產生和易用就能解決這個問題

提高它的應用性

剝離、著色、擦除

容易去實現和研發:

介紹工具:d3、jigsaw高維資料可是分析、視覺化的快速構建工具ivisdesigner、

interaction+:

視覺化發展之智慧型時代(2018-)

視覺化的智慧型分析

python基礎班學習筆記

編寫部落格 筆記 思維導圖 思考 不斷練習 dir列出目錄內檔案 md建立 rd刪除目錄 cd進入指定 cd 返回上一級 cd 返回根目錄 del刪除檔案 exit 退出解釋型 速度較快 跨平台性較差 x 原始碼 編譯 y 編譯後的機器碼 編譯型 相對較慢 跨平台性較好 x 原始碼 直譯器 解釋執行...

學習筆記(九)

字元處理只針對c n d t string型別,不做型別轉換,都按照c型別處理,也可以處理這些型別構成的結構體,有專門的字串比較 定位操作 concatenate first name last name into first name separated by separate.write fir...

大資料八斗九期學習

經過了幾個月的學習 功力大增 開學典禮 常見業務架構 整體結構 mapreduce pyweb 文字相似度.中文分詞 中文分詞 推薦演算法 分類演算法 nb 分類演算法 邏輯回歸 分類演算法 多分類 推薦系統demo 推薦系統 簡歷面試 yarn hdfs yarn spark spark實踐 hi...