22 高階流行庫模型 XGBoost

#-*- coding:utf-8 -*-
#對比隨機決策森林和xgboost模型對鐵達尼號的乘客是否生還的**能力
import pandas as pd 
titanic = pd.read_csv('')
#根據分析，我們認為***,age,pclass這些特徵都很有可能成為決定倖免與否的決定性因素
x = titanic[['pclass','***','age']]
y = titanic['survived']
#填充age的缺失值，用平均值來代替
x['age'].fillna(x['age'].mean(),inplace=true)
#對原始資料進行分割
from sklearn.cross_validation import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.25,random_state=33)
#這裡匯入的是dictvectorizer，作用是將符號化特徵，轉成數字型0/1表示
from sklearn.feature_extraction import dictvectorizer
#sparse=false指不用稀疏矩陣表示
vec = dictvectorizer(sparse=false) 
#向量化，類別型特徵轉成0/1型
x_train = vec.fit_transform(x_train.to_dict(orient='record'))
x_test = vec.fit_transform(x_test.to_dict(orient='record'))
#1.採用預設配置的隨機森林進行**
from sklearn.ensemble import randomforestclassifier
rfc = randomforestclassifier()
rfc.fit(x_train,y_train)
y_rfc_predict = rfc.predict(x_test)
print
'the accuracy of rfc on testing set is',rfc.score(x_test,y_test)
#the accuracy of rfc on testing set is 0.77811550152
#2.採用預設配置的xgboost進行**
from xgboost import xgbclassifier
xgbc = xgbclassifier()
xgbc.fit(x_train,y_train)
print
'the accuracy of xgbc on testing set is',xgbc.score(x_test,y_test)
#the accuracy of xgbc on testing set is 0.787234042553

22 高階SQL特性

1.約束為正確地進行關聯式資料庫設計，需要一種方法來保證只在表中插入合法的資料。例如，如果 orders 表儲存訂單資訊，orderitems 表儲存訂單詳細內容，應該保證 orderitems 中引用的任何訂單 id存在於 orders 中。類似地，在 orders 表中引用的任意使用者必須存在於...

OGL（教程22）模型載入

背景知識我們不能手動的建立複雜的模型。正如你所想象的，為每個頂點指定位置和其他的屬性，並且要在縮放的時候保持正確是不現實的。乙個盒子金字塔或者是簡單的表面是ok的，但是對於人臉這種複雜的網格結構就不可行了。現實的世界或者是商業的應用，處理的網格模型都是通過設計師設計的模型，他們使用blender...

Vulkan學習 22 載入模型

我們暫時不使用光照，只簡單地將紋理貼在模型上。在這裡，我們載入的模型叫做 chalet hippolyte chassande baroz。我們對它的大小和方向進行了調整這一模型大概由 50 萬面三角形構成。大小為1.5x1.5x1.5。如果使用的模型大於這一尺寸，讀者就需要對使用的檢視矩陣進行...

22 高階 流行庫模型 XGBoost

22 高階SQL特性

OGL（教程22） 模型載入

Vulkan學習 22 載入模型

相關推薦

22 高階流行庫模型 XGBoost

OGL（教程22）模型載入