對新資料進行總覽,檢視是否存在缺失資料
用統計學指標快速描述數值型屬性的概要。
空值處理。可能因為忘記填寫或者保密等等原因,相關字段出現了空值,將其填充為not provide
異常值處理。將捐款金額<=0的資料刪除
新建一列為各個候選人所在黨派party
檢視party這一列中有哪些不同的元素
統計party列中各個元素出現次數
檢視各個黨派收到的政治獻金總數contb_receipt_amt
檢視具體每天各個黨派收到的政治獻金總數contb_receipt_amt
將表中日期格式轉換為』yyyy-mm-dd』。
檢視老兵(捐獻者職業)disabled veteran主要支援誰
——————————————————————————
資料分析學習筆記
資料分析的常規步驟 1.確定問題 2.分解問題 3.評估問題 4.制定相應的決策 用一句話概括就是 現有的資料能否解決現在的問題,分析問題的瓶頸所在,評估分析的方式方法,找到最合理的資料分析方案進行實施。資料分析的模型沒有統一的模型,每乙個公司都有自己的業務線跟使用者群裡,使用者的屬性不同,行為軌跡...
資料分析學習筆記
row number over partition by col1 col2 order by col1 asc desc col2 asc desc 函式說明 可以用於開窗,排序,計數,返回當前視窗的排序值。引數說明 partition by col1 col2.指定開視窗的列。order by ...
資料分析 學習模組筆記
目錄 了解資料分析 業務理解與學習 分析基礎 統計學機器學習 資料庫技能 sqlhadoop hive 分析工具運用 python excel 筆試面試 業務理解與學習部落格 精益資料分析 書中筆記 本子筆記 區分定類 定序 定距 定比變數 假設檢驗 u檢驗 t檢驗 卡方檢驗 f檢驗 書 a4紙機器...