#啞變數處理類別型資料方法get_dummies
detail=pd.read_csv('e:\大三上\張宇萌\實習任務安排(2019-10-10)\detail.csv',encoding='gbk')
#啞變數處理
data=detail.loc[0:5,'dishes_name']#抽取部分資料做演示
print('初始\n',data)
print('結果\n',pd.get_dummies(data))
#使用等寬法、等頻法、聚類分析法離散化連續資料
#等寬法
price=pd.cut(detail['amounts'],5)
print('離散化後5條記錄售價分布為\n',price.value_counts())
#等頻法
def sameratecut(data,k):
w=data.quantile(np.arange(0,1+1.0/k,1.0/k))
data=pd.cut(data,w)
return data
#對菜品售價進行等頻法離散化
result=sameratecut(detail['amounts'],5).value_counts()
print('菜品資料等頻離散化後各個類別數目分布狀況為:\n',result)
#聚類分析法
#對dishes_name特徵進行啞變數處理
data=detail.loc[:,'dishes_name']
print(data.iloc[:5])
print(pd.get_dummies(data).iloc[:5,:5])
#自定義等頻法離散化函式
def sameratecut(data,k):
w=data.quantile(np.arange(0,1+1.0/k,1.0/k))
data=pd.cut(data,w)
return data
#菜品售價等頻法離散化
result=sameratecut(detail['amounts'],5).value_counts()
print(result)
arcgis中的座標轉換方法(80轉54)
使用者經常會遇到這樣的情況,現有的資料座標不符合要求,為應對需求,不得不為資料轉換座標系。很多人認為轉換座標系只是單純的使用工具箱中的 投影 工具,那就大錯特錯了。有很多情況下,只使用 投影 工具並不能成功的賦予資料所需要的座標系。首先,使用者需要明白一點,由於不同的座標系對應不同的旋轉橢球體,所以...
WGS 84 北京54 西安80空間座標轉平面座標
wgs 84 北京54 西安80空間座標轉平面座標 arcgis中有一些強大的功能不容易被發現,比如這個wgs 84 北京54 西安80空間座標轉平面座標的功能。其實實現的方法比較簡單。一般需求描述如下 手頭上有研究站點位置的點shaple檔案,但是站點位置資訊是經緯度座標,當要應用轉換公式計算各個...
LintCode 54 轉換字串到整數
實現atoi這個函式,將乙個字串轉換為整數。如果沒有合法的整數,返回0。如果整數超出了32位整數的範圍,返回int max 2147483647 如果是正整數,或者int min 2147483648 如果是負整數。樣例 10 10 1 1 123123123123123 2147483647 1....