import pandas as pdimport numpy as np
s = pd.series([1,2,3,4,np.nan,9,9])
s2 = pd.date_range('20181201',periods=6)#periods週期
import pandas as pd1.索引預設從0開始import numpy as np
#(1)建立二維矩陣
df = pd.dataframe([[1,2,3],[4,5,6],[7,8,9]],columns=list('abc'),index=data_index)
#(2)建立二維矩陣自動生成
df1 = pd.dataframe(np.arange(1,10).reshape(3,3),columns=list('abc'),index=data_index)
df1#(3)字典的方式
data_index = pd.date_range('20181016',periods=3)
df2 = pd.dataframe(,index=data_index)
df2
2.索引被替換為字串或時間
import pandas as pdimport numpy as np
#重置索引
df2.iloc[1,2] = np.nan
df2
#判斷df2.isna()
#填充資料
df3 = df2.fillna(value='bb')#替換,把空值得資料替換成bb,不操控原陣列,
df3
#刪除有空值的資料,整行都刪除
df2.dropna()
#當陣列索引資料都為空的時候才刪除資料
df2.dropna(how='all')
df2
#刪除有空值的資料,整行都刪除,原陣列不變
xx = df2.dropna(how='any')
xx
未完待續~~~~~
panda資料分析
1.將離散變數進行one hot編碼 在作為示例的租房資料中,分類變數 neighborhood 可以對應三個值 運用 scikit learn 中的 dictvectorizer 函式,我們將以上租房資料的分類變數轉換為 one hot 形式 可以通過呼叫 getfeaturenames 函式,來...
python資料分析筆記中panda 3
1 按照空格將一列的內容分為兩列 1 from pandas import series 2from pandas import dataframe 3from pandas import read csv 45 欄位的拆分 按照固定的字元 拆分已有的字串 6 函式 splite sep,n.exp...
python資料分析
以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...