原文:
《bi那點兒事》資料流轉換——百分比抽樣、行抽樣
百分比抽樣和行抽樣可以從資料來源中隨機選擇一組資料。這兩種task都可以產生兩組輸出,一組是隨機選擇的,另一組是沒有被選擇的。可以將這些選擇出的資料傳送到開發或者測試伺服器上。這個task的最合適的應用是建立資料探勘模型然後,使用這些抽樣資料來驗證這個模型。
編輯這種task,選擇要抽取的行數或者 百分比,如圖。百分比抽樣按百分比從資料來源中隨機選擇資料,行抽樣從資料來源中隨機選擇具體的行數。可以對選中的資料和未被選擇的資料命名。最後乙個選擇項是隨機取樣的引數。如果選擇乙個固定的引數,每次輸出的結果是一樣的,如果保持預設設定,就是不選擇,每次將輸出不同的資料。
百分比抽樣:
行抽樣:
《BI那點兒事》資料流轉換 透視
原文 bi那點兒事 資料流轉換 透視 這個和t sql中的pivot和unpivot的作用是一樣的。資料透視轉換可以將資料規範或使它在報表中更具可讀性。通過透視列值的輸入資料,透視轉換將規範的資料集轉變成規範程度稍低 但更為簡潔的版本。例如,在列有客戶名稱 產品和購買數量的規範的 orders 資料...
《BI那點兒事》資料流轉換 透視
這個和t sql中的pivot和unpivot的作用是一樣的。資料透視轉換可以將資料規範或使它在報表中更具可讀性。通過透視列值的輸入資料,透視轉換將規範的資料集轉變成規範程度稍低 但更為簡潔的版本。例如,在列有客戶名稱 產品和購買數量的規範的 orders 資料集中,任何購買多種產品的客戶都有多行,...
《BI那點兒事》資料流轉換 字詞查詢轉換
原文 bi那點兒事 資料流轉換 字詞查詢轉換 字詞查詢轉換將從轉換輸入列的文字中提取的字詞與引用表中的字詞進行匹配,然後計算出查詢表中的字詞在輸入資料集中出現的次數,並將計數與引用表中的此字詞一併寫入轉換輸出的列中。此轉換對於建立基於輸入文字並帶有詞頻統計資訊的自定義詞列表很有用。用於查詢的表 cr...