python是進行資料分析的一種很不錯的語言,主要是因為以資料為中心的庫非常適合。 pandas是其中的一種,使匯入和分析資料更加容易。 在本文中,我使用了來分析斯坦福**的公共資料集中的country data.csv檔案中的資料。
安裝
安裝pandas:
pip install pandas
在pandas中建立dataframe通過使用pd.series方法將多個series傳遞到dataframe類中來完成資料幀的建立。 在這裡,它在兩個series物件中傳遞,s1作為第一行,s2作為第二行。
例子:輸出:
用pandas匯入資料
第一步是讀取資料。資料儲存為逗號分隔值或csv檔案,其中每行用換行分隔,每列用逗號(,)分隔。為了能夠使用python中的資料,需要將csv檔案讀取到pandas dataframe中。dataframe是表示和處理**資料的一種方式。
例子:
import pandas as pd
df = pd.read_csv("ind_data.csv")
df.head()
df.shape
輸出:
29,10
用pandas索引dataframes可以使用pandas.dataframe.iloc方法建立索引。iloc方法允許按位置檢索多達行和列。
例子:
df.iloc[0:5,:]
df.iloc[:,:]
df.iloc[5:,:5]
在pandas中使用標籤建立索引可以使用pandas.dataframe.loc方法對標籤進行索引,該方法允許使用標籤而不是位置進行索引。
例子:
df.loc[0:5,:]
df = df.loc[5:,:]
上面的內容實際上與df.iloc [0:5 ,:]並沒有太大區別。這是因為儘管行標籤可以採用任何值,但我們的行標籤與位置完全匹配。但是,列標籤可以使處理資料時變得更加容易。例子:
dataframe math與pandas資料幀的計算可以通過使用pandas工具的統計功能來完成。
例子:
df.describe()
pandas圖
這些示例中的圖是使用用於引用matplotlib api的標準約定製作的,該api提供了pandas的基礎知識,可輕鬆建立美觀地圖。
例子:
import the required module
在這裡還是要推薦下我自己建的python學習群:721195303,群裡都是學python的,如果你想學或者正在學習python ,歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有python軟體開發相關的),包括我自己整理的乙份2021最新的python高階資料和零基礎教學,歡迎高階中和對python感興趣的小夥伴加入!
手把手教你進行pip換源
學習python,最重要的是我們需要的各樣第三方資源包,比如爬蟲,有requests,xpath,爬蟲界的扛把子scrapy web有django,flask,restframework 視覺化pyqt有pyqt5,pyqt5.qtwidgets,skimage,cv2資料視覺化屆的扛把子dlib,...
python 詞云手把手 手把手教你生成炫酷的詞云
前言 話說,在這個大資料時代,獲取資訊顯得極為容易,可正是如此,我們想要對資訊進行直觀地了解難度就大了。excel是乙個很好的資料視覺化方法,不過有時候我們的資料 可能並不是一張或者多張excel 這樣子的話如果我們想利用excel進行資料視覺化就顯得不是那麼容易。首先我們需要逐個將資料匯入到exc...
教程 手把手教你使用Git
前言 公司從17年漸漸從svn 轉向git 版本控制系統,以下是平時使用過程中的總結。一,git 是什麼?git 是目前世界上最先進的的分布式版本控制系統。二,svn 和git 的最主要的區別 svn是集中式版本控制系統,版本庫是集中放在 伺服器的,而幹活的時候,用的都是自己的電腦,所以首先要從 伺...