從零開始Tableau 資料與字段型別

2021-08-30 13:31:15 字數 2850 閱讀 4687

tableau對資料和字段有著特定的定義方式,弄清楚他們的具體含義,將有助於理解tableau的工作方式,從而更好的讓tableau為我所用。本節內容包括:

資料型別

維度與度量

離散與連續

資料型別

資料型別分類

資料來源的所有欄位在tableau中都會被分配乙個資料型別,同時 tableau還會在各字段前加上乙個特定的標識,用以直觀提示該字段是哪一種資料型別,tableau中的資料型別主要有文字值、日期值、日期和時間值、數字值、布林值、地理值六類。

資料型別調整

每乙個欄位都有著屬於自己的資料型別圖示,當然,tableau分配給字段的資料型別並不總是準確的,是可以根據實際分析需求進行調整的。比如,它可能會將日期字段「年-月-日」(如2017-10-09)解釋為文字,但我們需要用該字段進行時間分析,則必須將其調整為日期型別;比如,它可能會將地理位置字段「 省市」(如深圳、湖南)解釋為文字,但我們需要用該字段匹配地理位置,這就必須將其調整為地理值型別。

圖:資料型別調整示例

需要注意的是,有的字段的資料型別圖示前面,多了乙個「=」,這錶名該字段是tableau中的自定義資料型別,如「=#」表示自定義的數字值欄位,「=abc」表示自定義的文字值欄位,「=t|f」表示自定義的布林值字段。這些字段一般都是通過「計算字段」功能獲取。

維度與度量

維度和度量是tableau中非常重要的字段型別,進入工作表工作區後,資料視窗中就直接顯示了維度和度量兩個區域,資料來源中的各字段被tableau智慧型分配字段型別後,逐一分配到這兩個區域中,可以說,維度和度量是使用tableau開展資料分析時,需要掌握的最基本概念。

圖:維度和度量區域示例

維度維度是觀察資料的角度以及對資料的描述,維度可以用文字、時間表示,也可以用數值表示,簡單理解,excel首行字段中,非數值型的字段就可以看作是維度。資料來源匯入後,tableau會將離散分類資訊的所有字段(比如值為字串、布林值的字段)分配到維度區域。

圖:excel首行字段示例

將「維度」欄位拖到列或行功能區後,tableau就會將該字段以座標軸的橫軸或縱軸標題形式,體現在圖表中。

圖:維度欄位在圖表中的示例

度量度量通常是數值資訊,資料來源匯入後,tableau會將數值型的所有字段分配到度量區域。將「度量」欄位拖到列或行功能區後,tableau會在檢視區顯示為軸。通常,維度欄位在拖到列行功能區後,一般會預設進行聚合計算。

軸是乙個顯示最小值和最大值之間的值的度量線。

圖:度量字段示例

轉換儘管大部分情況,tableau能夠自動並且準確地將各個字段劃入到「維度」或「度量」區域,但有的時候,它也會出錯,或者說它的劃分與我們的實際想法有出入。

再舉個例子,產品的「**」欄位是數字型,tableau也會將其劃入到「度量」,可以對產品**進行求和、求平均等計算,但如果希望統計各個**或某**區間的產品銷量,作為「度量」欄位的「**」顯然不能滿足分析需要,這時就需要將「**」欄位從「度量」轉換為「維度」。

圖:"**"字段轉換為維度示例

需要注意的是,通常情況下,維度欄位是藍色,度量欄位是綠色,可以作為區分維度和度量的直觀依據,但依靠顏色來判別乙個欄位是維度還是度量並不可靠,如果在行列工作區直接將乙個度量字段轉換為維度,雖然該欄位取消了聚合運算狀態,但其顏色仍然是綠色,並沒有變為藍色。因此,辨別檢視中的字段是度量還是維度的依據在於該欄位是否已聚合,聚合的是度量,未聚合的是維度。

圖:度量轉換為維度示例

離散與連續

離散與連續是另一種資料角色分類,辨別檢視中的字段是離散還是連續的依據在字段顏色,藍色是離散字段,綠色是連續字段。

離散在數學上,「離散」指「各自分離且不同」。在tableau中將欄位從資料視窗的「維度」區域拖到列行功能區時,tableau會預設該字段為離散字段,並將該字段的每乙個值在檢視中顯示為行或列的標題。

需要注意的是,離散欄位在檢視中只是標題,並不是軸,如下圖中,根據「**」字段建立的標題展示了「**」欄位中的每乙個**值,這裡只能使用散點圖、條形圖等圖形,不能使用折線圖。

圖:離散字段示例

連續在數學上,「連續」是指「構成乙個不間斷的整體,沒有中斷」。在tableau中,連續欄位被拖到列行功能區時,tableau會建立軸,軸上是連續刻度。

與離散字段不同,連續字段建立的軸,是乙個範圍值,如下圖中,「**」字段建立的軸的刻度表示在0-110元之間,是連續的,因此可以使用折線圖。

圖:連續字段示例

從零開始tableau

從零開始tableau 1.連線到資料來源 從零開始tableau 2.資料整合 從零開始tableau 3.工作表工作區 從零開始tableau 4.資料與字段型別 從零開始tableau 5.欄位排序 從零開始tableau 6.分層與分組 從零開始tableau 7.集 從零開始tableau...

從零開始學習 從零開始學習資料結構 雜湊桶

雜湊桶的本質是雜湊表,雜湊表的本質是 k v,k v 不就是 map,那麼這樣一層一層學習下來,就能理解的更為透徹,學習程式設計一定要有追根刨底的好奇心,這樣你的進步會非常快。1 桶 就是可以存放資料的結構 在這裡我認為桶就是結構體!在雜湊表的改進之上,雜湊表當時自己的做法是 表中存放的是指標,而不...

Django 從零開始

方法1 pip install django 1.6.5 測試是否安裝成功 python import django 1,6,5,final 0 django 使用了 python 標準的 distutils 安裝法,在 linux 平台可能包括如下步驟 tar xzvf django tar.gz...