手把手教你使用Python進行資料分析和視覺化

2021-10-21 13:54:04 字數 2568 閱讀 2559

python是進行資料分析的一種很不錯的語言,主要是因為以資料為中心的庫非常適合。 pandas是其中的一種,使匯入和分析資料更加容易。 在本文中,我使用了來分析斯坦福**的公共資料集中的country data.csv檔案中的資料。

安裝

安裝pandas:

pip install pandas
在pandas中建立dataframe通過使用pd.series方法將多個series傳遞到dataframe類中來完成資料幀的建立。 在這裡,它在兩個series物件中傳遞,s1作為第一行,s2作為第二行。

例子:輸出:

用pandas匯入資料

第一步是讀取資料。資料儲存為逗號分隔值或csv檔案,其中每行用換行分隔,每列用逗號(,)分隔。為了能夠使用python中的資料,需要將csv檔案讀取到pandas dataframe中。dataframe是表示和處理**資料的一種方式。

例子:

import pandas as pd 

df = pd.read_csv("ind_data.csv")

df.head()

df.shape

輸出:

29,10
用pandas索引dataframes可以使用pandas.dataframe.iloc方法建立索引。iloc方法允許按位置檢索多達行和列。

例子:

df.iloc[0:5,:] 

df.iloc[:,:]

df.iloc[5:,:5]

在pandas中使用標籤建立索引可以使用pandas.dataframe.loc方法對標籤進行索引,該方法允許使用標籤而不是位置進行索引。

例子:

df.loc[0:5,:] 

df = df.loc[5:,:]

上面的內容實際上與df.iloc [0:5 ,:]並沒有太大區別。這是因為儘管行標籤可以採用任何值,但我們的行標籤與位置完全匹配。但是,列標籤可以使處理資料時變得更加容易。例子:

dataframe math與pandas資料幀的計算可以通過使用pandas工具的統計功能來完成。

例子:

df.describe() 

pandas圖

這些示例中的圖是使用用於引用matplotlib api的標準約定製作的,該api提供了pandas的基礎知識,可輕鬆建立美觀地圖。

例子:

import the required module 

在這裡還是要推薦下我自己建的python學習群:721195303,群裡都是學python的,如果你想學或者正在學習python ,歡迎你加入,大家都是軟體開發黨,不定期分享乾貨(只有python軟體開發相關的),包括我自己整理的乙份2021最新的python高階資料和零基礎教學,歡迎高階中和對python感興趣的小夥伴加入!

手把手教你進行pip換源

學習python,最重要的是我們需要的各樣第三方資源包,比如爬蟲,有requests,xpath,爬蟲界的扛把子scrapy web有django,flask,restframework 視覺化pyqt有pyqt5,pyqt5.qtwidgets,skimage,cv2資料視覺化屆的扛把子dlib,...

python 詞云手把手 手把手教你生成炫酷的詞云

前言 話說,在這個大資料時代,獲取資訊顯得極為容易,可正是如此,我們想要對資訊進行直觀地了解難度就大了。excel是乙個很好的資料視覺化方法,不過有時候我們的資料 可能並不是一張或者多張excel 這樣子的話如果我們想利用excel進行資料視覺化就顯得不是那麼容易。首先我們需要逐個將資料匯入到exc...

教程 手把手教你使用Git

前言 公司從17年漸漸從svn 轉向git 版本控制系統,以下是平時使用過程中的總結。一,git 是什麼?git 是目前世界上最先進的的分布式版本控制系統。二,svn 和git 的最主要的區別 svn是集中式版本控制系統,版本庫是集中放在 伺服器的,而幹活的時候,用的都是自己的電腦,所以首先要從 伺...