pandas的api支援眾多的檔案格式,如csv、sql、xls、json、hdf5。
# 讀取檔案,並且指定只獲取'open', 'close'指標
data = pd.read_csv("./data/stock_day.csv", usecols=['open', 'close'])
hdf5hdf5檔案的讀取和儲存需要指定乙個鍵,值為要儲存的dataframe
從h5檔案當中讀取資料
dataframe.to_hdf(path_or_buf, key, \kwargs)
json
dataframe.to_json(path_or_buf=none, orient=none, lines=false)
to_json--儲存檔案—注意:lines=true
優先選擇使用hdf5檔案儲存
csv檔案儲存與讀取
csv是指逗號分隔值檔案格式,是以純文字形式來儲存 資料。1.儲存為csv格式 把要儲存的 中資料,按每一行存成一條記錄,然後將記錄新增到乙個list裡面,寫入檔案的時候將每個記錄轉換成一串逗號分隔的字串,再用遍歷的方法把所有記錄取出來 我是這樣寫的 也可以都存在乙個記錄裡,用換行符來換行,一次寫入...
Python 檔案讀取與儲存
file1 open pima indians diabetes.txt r file2 open out.txt w data file1.read i 0while true line file1.readline tt line 1 1 if i 3 print tt i 1 file2.wr...
spark檔案讀取與儲存(scala實現)
將乙個文字檔案讀取為rdd時,輸入的每一行都會成為rdd的乙個元素。也可以將多個完整的文字檔案一次性讀取為乙個pairrdd,其中鍵是檔名,值是檔案內容。讀取文字檔案 val input sc.textfile filepath 儲存為文字檔案 result.s aastextfile output...