知識清單:
series和dataframe這兩個核心的資料結構,分別代表一維和二維的表結構。基於這兩種資料結構可以對資料進行匯入,清洗。處理,統計和輸出。
series:series是個定長的字典序列。兩個基本屬性:index和values。預設是0,1,2....當然也可以自己指定索引。
刪除dataframe不必要的行或列drop()函式
重新命名列名columns
去掉重複的值drop_duplicates()
格式問題astype()
pandas和numpy一樣遇到空值nan就會自動排除。
乙個dataframe是乙個資料表多個dataframe資料表的合併就相當於多個資料庫的表的合併。
指定列的連線:eg:基於名字的連線;df3 = pd.merge(df1,df2,on='name')
inner連線:預設是merge基於名字
left左連線:以第乙個為主第二個為補充。df3=pd.merge(df1,df2,how='left')
right右連線:以第二個為主第乙個為補充。df3=pd.merge(df1,df2,how='right')
outer連線:求兩個dataframe的並集
python科學計算 numpy
畢設的程式設計中使用了python來處理資料,主要使用的是numpy包,網上大部分對numpy進行介紹的教程比較老舊,想要使用的功能不太容易找到。因此,寫這篇文章來對現有的一些資源就行整理,當然想要更全面的了解numpy的使用還是從訪問官方手冊開始。win下 pip isntall numpy當然最...
用Python做科學計算
python是一種物件導向的 動態的程式語言,具有非常簡潔而清晰的語法,既可以用於快速開發程式指令碼,也可以用於開發大規模的軟體,特別適合於完成各種高層任務。隨著numpy,scipy,matplotlib,enthought librarys等眾多程式庫的開發,python越來越適合於做科學計算。...
Python 科學計算基礎 (整理)
python是一種物件導向的 動態的程式語言,具有非常簡潔而清晰的語法,既可以用於快速開發程式指令碼,也可以用於開發大規模的軟體,特別適合於完成各種高層任務。隨著numpy scipy matplotlib ets等眾多程式庫的開發,python越來越適合於做科學計算。與科學計算領域最流行的商業軟體...