指令碼背景:提取了不同類別下的購買手機號碼,由於資料量巨大,需要對資料進行分組,得到不同類別下的手機號碼,同時自動拆分檔案,按照乙個特定類別輸出檔案。
import pandas as pd
#read data from csv
df=pd.read_csv('c:\\users\\administrator\\documents\\haomabao.csv',sep=',',engine='python',header=[1,2])
#get the columns of df
df.columns=['telephone','cc']
c=list(df.columns)
print(c[1:2])
grouped=df.groupby(c[1:2]) #according different categories to group by the df
#delete duplicated data
ind_frame=df.drop_duplicates(subset=['cc'], keep='first')
print(ind_frame.cc)
print(range(len(ind_frame)))
for name in ind_frame.cc:
print(name)
df[df.cc==name].to_csv("f:\\result\\_"+u"%s" %name+".csv")
最後可以得到不同類別下的號碼,並且每乙個類別對應乙個類別名稱的csv檔案。此方法可舉一反三應用在別的資料上。
利用python對csv檔案進行分割
有個任務,就是將乙個大的csv分割為幾個小的csv,當然是的包含表頭的。於是,我想到了類似於,用雙指標來做。import csv import os path users mac desktop 186 3.csv with open path,r newline as file csvreader...
利用Python處理CSV 檔案
csv 檔案 將資料作為一系列以逗號分隔的值寫入檔案,通俗的講就是兩個逗號的資訊之間看作乙個資料。csv模組包含在python標準庫中,可用於分析csv檔案中的資料行 import csv 利用matplotlib繪圖 from matplotlib import pyplot as plt fil...
python中利用CSV庫讀寫csv檔案
csv檔案 逗號分隔值 comma separated values,csv,有時也稱為字元分隔值,因為分隔字元也可以不是逗號 其檔案以純文字形式儲存 資料 數字和文字 首先我們先 看一下資料 我們建立了兩個csv檔案,乙個是英文的,乙個是帶有中文的 需要加上,encoding utf 8 不然會有...