#-*- coding:utf-8 -*-
#對比隨機決策森林和xgboost模型對鐵達尼號的乘客是否生還的**能力
import pandas as pd
titanic = pd.read_csv('')
#根據分析,我們認為***,age,pclass這些特徵都很有可能成為決定倖免與否的決定性因素
x = titanic[['pclass','***','age']]
y = titanic['survived']
#填充age的缺失值,用平均值來代替
x['age'].fillna(x['age'].mean(),inplace=true)
#對原始資料進行分割
from sklearn.cross_validation import train_test_split
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size=0.25,random_state=33)
#這裡匯入的是dictvectorizer,作用是將符號化特徵,轉成數字型0/1表示
from sklearn.feature_extraction import dictvectorizer
#sparse=false指不用稀疏矩陣表示
vec = dictvectorizer(sparse=false)
#向量化,類別型特徵轉成0/1型
x_train = vec.fit_transform(x_train.to_dict(orient='record'))
x_test = vec.fit_transform(x_test.to_dict(orient='record'))
#1.採用預設配置的隨機森林進行**
from sklearn.ensemble import randomforestclassifier
rfc = randomforestclassifier()
rfc.fit(x_train,y_train)
y_rfc_predict = rfc.predict(x_test)
print
'the accuracy of rfc on testing set is',rfc.score(x_test,y_test)
#the accuracy of rfc on testing set is 0.77811550152
#2.採用預設配置的xgboost進行**
from xgboost import xgbclassifier
xgbc = xgbclassifier()
xgbc.fit(x_train,y_train)
print
'the accuracy of xgbc on testing set is',xgbc.score(x_test,y_test)
#the accuracy of xgbc on testing set is 0.787234042553
22 高階SQL特性
1.約束為正確地進行關聯式資料庫設計,需要一種方法來保證只在表中插入合法的資料。例如,如果 orders 表儲存訂單資訊,orderitems 表儲存訂單詳細內容,應該保證 orderitems 中引用的任何訂單 id存在於 orders 中。類似地,在 orders 表中引用的任意使用者必須存在於...
OGL(教程22) 模型載入
背景知識 我們不能手動的建立複雜的模型。正如你所想象的,為每個頂點指定位置和其他的屬性,並且要在縮放的時候保持正確是不現實的。乙個盒子 金字塔或者是簡單的表面是ok的,但是對於人臉這種複雜的網格結構就不可行了。現實的世界或者是商業的應用,處理的網格模型都是通過設計師設計的模型,他們使用blender...
Vulkan學習 22 載入模型
我們暫時不使用光照,只簡單地將紋理貼在模型上。在這裡,我們載入的模型叫做 chalet hippolyte chassande baroz。我 們對它的大小和方向進行了調整 這一模型大概由 50 萬面三角形構成。大小為1.5x1.5x1.5。如果使用的模型大於這一尺寸,讀者就需要對使用的檢視矩陣進行...