利用Pthon進行資料分析資料規劃化

1 ) 內連線

內聯接使用比較運算子根據每個表共有的列的值匹配兩個表中的行。例如，檢索 students和courses表中學生標識號相同的所有行。

2 ) 外連線

使用merge函式進行合併

沒有指定要用那個列進行連線,merge就會將列名相同的列當做鍵. 也可以顯示指定

pd.merge(df1, df2, on='key')

如果兩個物件的列名不同, 也可以分別進行知道那個

pd.merge(df3, df4, left_on='lkey', right_on='rkey')

2 ) 連線方式

merge預設情況下是內連線, 結果中的鍵是交集,其他方式還有 "left", "right" 以及 "outer" . 外連線求取的是鍵的並集, 組合了左連線和右連線的效果.

指定連線方式:

pd.merge(df1, df2, how='outer')

( 3 ) merge引數

left 參與合併的左側dataframe

right 參與合併的右側dataframe

how "inner", "outer", "left", "right" 其中之一, 預設為" inner"

on 用於連線的列名,必須存在左右兩個dataframe物件中. 如果未指定, 且其他連線鍵也未指定,則以left和right列名的交集作為連線鍵

left_on 左側dataframe中用作連線鍵的列

right_on 右側dataframe中用作連線鍵的列

left_index 將左側的行索引用作其連線鍵

right_index 類似於left_index

sort 類似連線鍵對合併後的資料進行排序, 預設為true. 有時在處理大資料集時, 禁用該選吸納個可獲得更好的效能.

suffixes 字串值元組, 用於追加到重疊列名的末尾, 預設為('_x','_y"). 例如, 如果左右兩個dataframe物件都有 "data", 則結果中就會出現 "data_x" 和 "data_y"

copy 設定為false, 可以在某些特殊情況下避免將資料複製到結果資料結構中. 預設總是複製.

利用python進行資料分析

目錄 10 minutes to pandas 翻譯 pandas中loc iloc ix的區別 pandas dropna函式 pandas中dataframe的stack unstack 和pivot 方法的對比 pandas中關於set index和reset index的用法 python匿...

利用python進行資料分析

利用python進行資料分析，需要了解一些基本的方法，比如掌握回歸分析的方法，通過線性回歸和邏輯回歸，其實你就可以對大多數的資料進行回歸分析，並得出相對精確地結論。這部分需要掌握的知識點如下回歸分析線性回歸邏輯回歸基本的分類演算法決策樹隨機森林樸素貝葉斯基本的聚類演算法 k mean...

《利用Python進行資料分析》筆記

之前的筆記一直記在我的印象筆記上，今天突然想到不如直接記在部落格上，印象筆記只記錄生活上的事，這樣也分工明確一些。同時也能和大家分享，也許可以幫助到別人。由於這個學習筆記系列主要還是用於個人學習總結用，所以會比較凌亂，望大家理解！2017 9 23 p151 pd.dropna thresh 其中...

利用Pthon進行資料分析 資料規劃化

利用python進行資料分析

利用python進行資料分析

《利用Python進行資料分析》筆記

相關推薦

利用Pthon進行資料分析資料規劃化