#鐵達尼號沉船事故
#鐵達尼號乘客資料查驗
import pandas as pd #匯入pandas用於資料分析
titanic = pd.read_csv('')
titanic.head() #觀察前幾行資料
titanic.info() #檢視資料的統計特徵
#特徵選取,機器學習很重要的乙個環節
x = titanic[['pclass', 'age', '***']] #這三個特徵可能決定是否能夠倖免
y = titanic['survived']
x['age'].fillna(x['age'].mean, inplace = true) #將age特徵缺失行用平均值補充
#資料分割
from sklearn.cross_validation import train_test_split
x_train, x_test, y_train, y_test = train_test_split(x, y, train_size = 0.25, random_state = 33)
#特徵轉換器轉換特徵
from sklearn.feature_extraction import dictvectorizer
vec = dictvectorizer(sparse=false)
x_train = vec.fit_transform(x_train.to_dict(orient='record')) #將類別型的特徵都單獨剝離出來
x_test = vec.transform(x_test.to_dict(orient='record'))
#決策樹分類器
from sklearn.tree import decisiontreeclassifier
dtc = decisiontreeclassifier() #初始化分類器
dtc.fit(x_train, y_train) #訓練分類器
y_predict = dtc.predict(x_test) #用訓練好的模型進行**
#使用隨機森林進行整合模型訓練
from sklearn.ensemble import randomforestclassifier
rfc = randomforestclassifier()
rfc.fit(x_train, y_train)
y_rfc_predict = rfc.predict(x_test)
#使用梯度提公升決策樹進行整合模型的訓練
from sklearn.ensemble import gradientboostingclassifier
gbc = gradientboostingclassifier()
gbc.fit(x_train, y_train)
y_gbc_predict = gbc.predict(x_test)
#單一決策樹效能分析,輸出分類任務的評價指標,精確度、召回率、f1指標
from sklearn.metrics import classification_report
print('accuracy of decisiontree is :',dtc.score(x_test, y_test))
print(classification_report(y_predict, y_test))
print('accuracy of randomforest is :',rfc.score(x_test, y_test))
print(classification_report(y_rfc_predict, y_test))
print('accuracy of gradientboosting is :',gbc.score(x_test, y_test))
print(classification_report(y_gbc_predict, y_test))
多分類學習
多分類學習的基本思路是拆解法,即將多個二分類任務拆為若干個二分類任務求解。具體地就是,先對問題進行拆分,然後為每個拆分的二分類任務訓練乙個分類器 在測試時,對這些分類器的 結果進行整合以獲得最終的多分類結果。關鍵 多分類任務如何拆分。經典的為 一對一 one vs one,ovo 一對多 one v...
IP分類學習
0.0.0.0 代表的是所有網段也是作為保留網段的。a類 10.0.0.0 to 10.255.255.255 b類 172.16.0.0 to 172.31.255.255 c類 192.168.0.0 to 192.168.255.255 總結如下 a類位址255.0.0.0 8 1 a類位址第...
theano學習之分類學習
from future import print function import numpy as np import theano import theano.tensor as t 該函式功能用來計算準確率 def compute accuracy y target,y predict corr...