機器學習入門 邏輯回歸的分類評估方法

2022-05-24 07:45:06 字數 2126 閱讀 6188

導包

import pandas as pd

import numpy as np

from sklearn.model_selection import train_test_split

from sklearn.preprocessing import standardscaler

from sklearn.linear_model import logisticregression

from sklearn.metrics import classification_report,roc_auc_score

獲取資料
# 1.獲取資料

資料處理

# 2.1 缺失值處理

data = data.replace(to_replace="?",value=np.nan)

data = data.dropna()

# 2.2 確定特徵值,目標值

x = data.iloc[:,1:-1]

x.head()

y = data["class"]

y.head()

# 2.3 分割資料

x_train,x_test,y_train,y_test = train_test_split(x,y,random_state=22,test_size=0.2)

特徵工程(標準化)
# 3.特徵工程(標準化)

transfer = standardscaler()

x_train = transfer.fit_transform(x_train)

x_test = transfer.fit_transform(x_test)

機器學習(邏輯回歸)
# 4.機器學習(邏輯回歸)

estimator = logisticregression()

estimator.fit(x_train,y_train)

模型評估
# 模型評估

# 5.1 列印分數

score = estimator.score(x_test,y_test)

print("**分數為:\n",score)

# 5.2 列印**結果

y_predict = estimator.predict(x_test)

print("**結果為:\n",y_predict)

## 5.3 精確率和召回率評價

ret = classification_report(y_test,y_predict,labels=(2,4),target_names=("良性","惡行"))

print(ret)

## 5.4 auc指標計算

python 邏輯回歸分類 機器學習 邏輯回歸分類

分類問題 1 本質 決策面 decision su ce 2 評估分類演算法的指標,正確率 正確分類個數 總數 二分分類 邏輯回歸輸入 訓練資料的特徵和標籤 模型 邏輯回歸 輸出 分類結果 什麼是邏輯函式?在0到1之間取值,邏輯回歸是因為引數是邏輯函式 邏輯的數值 表示分類結果是1是y的結果 決策面...

機器學習入門 複習邏輯回歸

取h x 0.5時,y 1。由sigmoid函式的影象可知,當sigmoid函式的引數 tx 0時,h x 的取值即 0.5。由於是複習,不做過多的數學推導,直接給出代價函式的式子。此處的代價函式不是平方差代價函式,而是使用cost函式作以替代,而cost函式是乙個分段函式,實際上,cost函式中的...

機器學習 邏輯回歸 多分類問題

from sklearn.linear model import logisticregression 1 penalty 使用指定正則化項 預設 l2 2 dual n samples n features取false 預設 3 c 正則化強度,值越小正則化強度越大 4 fit intercept...