data = pd.read_csv(path,header,names=['',''] #返回dataframe物件
#畫圖data.plt(kind='scatter',x='',y='') #scatter散點圖
plt.show()
str.strip('char') 用於移除字串**頭尾**指定的字元(預設為空格)或字串行。
split() 分隔
import numpy as np
np.r_[a,b]
#是按行連線兩個矩陣,就是把兩矩陣上下相連,要求列數相等,類似於pandas中的 concat()。
np.c_[a,b]
#是按列連線兩個矩陣,就是把兩矩陣左右相連,要求行數相等,類似於pandas中的 merge()。
print(「ring」 in 「strings」) #true
print(「wow」 in 「amazing!」) #false
print(「yes」 in 「yes!」) #false
print("" in 「no way!」) #true
讀寫檔案基本使用 with open…as…方式,這樣子安全!
with
open
('path'
,'method'
)as f:
f.read
() #可讀取整個檔案,也可自行設定大小,如 f.
read
(100
) f.
readline
() #一次讀取一行
f.readlines
() #可讀取整個檔案,按行讀取
f.write
(text) #寫入text內容
f.close
() #關閉檔案
method型別:
method描述r
開啟乙個檔案用於唯讀。檔案指標將會放在檔案的開頭。
rb以二進位制格式開啟乙個檔案用於唯讀。檔案指標將會放在檔案的開頭。
r+開啟乙個檔案用於讀寫。檔案指標將會放在檔案的開頭。
rb+以二進位制格式開啟乙個檔案用於讀寫。檔案指標將會放在檔案的開頭。
w開啟乙個檔案只用於寫入。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。
wb以二進位制格式開啟乙個檔案只用於寫入。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。
w+開啟乙個檔案用於讀寫 。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。
wb+以二進位制格式開啟乙個檔案用於讀寫。如果該檔案已存在則將其覆蓋。如果該檔案不存在,建立新檔案。
a開啟乙個檔案用於追加。如果該檔案已存在,檔案指標將會放在檔案的結尾。如果該檔案不存在,建立新檔案進行寫入。
ab以二進位制格式開啟乙個檔案用於追加。如果該檔案已存在,檔案指標將會放在檔案的結尾。也就是說,新的內容將會被寫入到已有內容之後。如果該檔案不存在,建立新檔案進行寫入。
a+開啟乙個檔案用於讀寫。如果該檔案已存在,檔案指標將會放在檔案的結尾。檔案開啟時會是追加模式。如果該檔案不存在,建立新檔案用於讀寫。
ab+以二進位制格式開啟乙個檔案用於追加。如果該檔案已存在,檔案指標將會放在檔案的結尾。如果該檔案不存在,建立新檔案用於讀寫。
1、json.dumps()
用於將dict型別的資料轉成str,因為如果直接將dict型別的資料寫入json檔案中會發生報錯,因此在將資料寫入時需要用到該函式。
import json
dict =
str = json.dumps(dict)
print(dict)
print(str)
#輸出結果
#字典型別
#字串型別
2、json.loads()
用於將str型別的資料轉成dict。
import json
dict1 =
str = json.dumps(dict)
dict2 = json.loads(dict1)
#輸出結果, 'a'變成了u'a'是因為發生了型別轉換,str會轉換成unicode
附上python轉換型別……
3、json.dump()
用於將dict型別的資料轉成str,並寫入到json檔案中。下面兩種方法都可以將資料寫入json檔案
import json
#方法一:
str = json.dumps(dict)
with open('file_name', "w") as f:
f.write(str)
方法二:
json.dump(dict, open('file_name', "w"))
4、json.load()
從json檔案中讀取資料
import json
emb_filename = ('/home/cqh/facedata/emb_json.json')
jsobj = json.load(open(emb_filename))
print(jsobj)
print(type(jsobj))
for key in jsobj.keys():
print('key: %s value: %s' % (key,jsobj.get(key)))
#執行結果
key: a value: 1111
key: c value: 3333
key: b value: 2222
key: d value: 4444
import requests,json
url = '...'
r = requests.get(url)
data = json.dumps(r.json())
print(type(r)) #requests.models.response型別
print(type(r.json())) #dict / list資料型別
print(type(data)) #返回str資料型別
r.text #http響應內容的字串形式,即:url對應的頁面內容
r.content #http響應內容的二進位制形式
python中基本資料處理
def function a,b if a 0 b 0 return 只做夜班 elif a 0 b 0 return 只做白班 elif a 0 b 0 return 未做單 else return 混合 function x.夜間上班時長,x.日間上班時長 axis 1 例 有某工廠工人上班時間...
python 資料處理之分箱操作
什麼是分箱?簡單點說就是將不同的東西,按照特定的條件放到乙個指定容器裡,比如水果 把綠色的放乙個籃子裡,紅色乙個籃子等等,這個籃子就是箱,而水果就是資料 顏色就是條件 什麼樣式的資料要進行分箱 資料主要分為連續變數和分類變數,分箱的操作主要針對於連續變數。為什麼要對資料進行分箱操作 穩定性,時間複雜...
Python 資料處理
將檔案切分,存入列表 strip split with open james.txt as jaf data jaf.readline james data.strip split 資料檔案為 2 34,3 21,2.34,2.45,3.01,2 01,2 01,3 10,2 22 print ja...