概率論課程的作業要求編寫python程式實現對資料集的特徵圖形化分析
從阿里雲天池裡down了乙個疫苗流向的資料集
拿到手,開啟jupyter notebook
匯入 pandas
down的資料集有多個csv檔案,因此首先把多個csv檔案合併為乙個
import pandas as pd
import os
# 將該資料夾下的所有檔名存入列表
csv_name_list = os.listdir('e:\jupyternotebook_space\yimiaodatas')
# 獲取列表的長度
length = len(csv_name_list)
# 讀取第乙個csv檔案幷包含表頭,用於後續的csv檔案拼接
f= open(csv_name_list[0],encoding = "utf-8")
df = pd.read_csv( f)
# 讀取第乙個csv檔案並儲存
df.to_csv( "e:\jupyternotebook_space\alldatas.csv",index=false)
# 迴圈遍歷列表中各個csv檔名,並完成檔案拼接
for i in range(0,length):
f= open(csv_name_list[i],encoding = "utf-8")
df = pd.read_csv( f )
df.to_csv("e:\jupyternotebook_space\alldatas.csv",index=false, header=false, mode='a+')
接下來就是對合併的csv檔案進行資料分析 pandas合併多個csv檔案
import pandas as pd importos 檔案路徑注意用 inputfilepath c users administrator aaa bbb outputfilepath c users administrator aaa df filename file 8 27 11 19....
使用pandas庫對csv檔案進行篩選和儲存
這個操作現在看來真沒啥難的,但是我找相關的資料真的找了好久。多數大佬都是直接pandas官網甩我臉上,然後舉乙個入門級的例子。首先匯入pandas庫 import pandas as pd然後使用read csv來開啟指定的csv檔案 df pd.read csv ip2location.csv e...
Pandas 通過追加方式合併多個csv
通常用pandas進行資料拼接 合併的方法有 pandas.merge pandas.concat 還有一種方式就是通過 pd.to csv 中的追加寫入方式 import pandas as pd for inputfile in os.listdir inputfile dir pd.read ...