1、**
import pandas as pd
import numpy as np
#import xlwt
import xlrd
filename = 'e:/data/chapter5/demo/data/bankloan.xls' #檔案路徑
#outputfile= r'e:\data\chapter4\demo\data\output_principal_component.xls'
data = pd.read_excel(filename) #讀取檔案
#print(data)
x = data.iloc[:,:8].as_matrix() #讀取所有行,第0-7列資料,並將資料轉換成矩陣形式
y = data.iloc[:,8].as_matrix() #第8列所有資料,並將資料轉換成矩陣形式
#print(x)
#print(y)
from sklearn.linear_model import logisticregression as lr
from sklearn.linear_model import randomizedlogisticregression as rlr
rlr = rlr() #建立隨機邏輯回歸模型,篩選變數;在建立模型時,使用了預設閾值0.25,可以用rlr(selection_threshold = 0.4)手動設定閾值
rlr.fit(x, y) #訓練模型
rlr.get_support() #獲取特徵篩選結果
print(rlr.get_support())
print(rlr.scores_) #獲取各特徵分數
print(u'通過隨機邏輯回歸模型篩選特徵結束。')
data_1 = data.drop(u'違約', 1)
print(u'有效特徵為:%s' % ','.join(data_1.columns[rlr.get_support()]))
x = data[data_1.columns[rlr.get_support()]].as_matrix() #篩選好特徵
#print(x)
lr = lr()
lr.fit(x,y)
print(u'邏輯回歸模型訓練結束。')
print(u'模型的平均正確率為: %s' % lr.score(x, y)) #輸出模型的平均正確率
logistic回歸 logistic回歸
logistic回歸 logistic回歸分析可用於估計某個事件發生的可能性,這是乙個分類模型而不是乙個回歸模型!它的基本思想是利用一條直線將平面上的點分為兩個部分,即兩個類別,要解決的問題就是如何擬合出這條直線,這個擬合的過程就稱之為 回歸 logistic模型 假設你有乙個需要 的內容,要通過三...
logistic分類(logistic回歸 LR)
幾乎所有的教材都是從logistic分類開始的,因為logistic分類實在太經典,而且是神經網路的基本組成部分,每個神經元 cell 都可以看做是進行了一次logistic分類。所謂logistic分類,顧名思義,邏輯分類,是一種二分類法,能將資料分成0和1兩類。logistic分類的流程比較簡單...
Logistic回歸模型
一 logistic回歸模型 線性回歸模型要求因變數是連續型正態變數。當因變數是分類變數時,logistic回歸模型是最好的回歸模型。由於y只能取兩個值1或0,y的條件數學期望 e y xi 1 p y 1 xi 0 p y 0 xi p y 1 xi 選擇乙個函式,p y 1 x f x logi...