導包
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import standardscaler
from sklearn.linear_model import logisticregression
from sklearn.metrics import classification_report,roc_auc_score
獲取資料# 1.獲取資料
資料處理
# 2.1 缺失值處理
data = data.replace(to_replace="?",value=np.nan)
data = data.dropna()
# 2.2 確定特徵值,目標值
x = data.iloc[:,1:-1]
x.head()
y = data["class"]
y.head()
# 2.3 分割資料
x_train,x_test,y_train,y_test = train_test_split(x,y,random_state=22,test_size=0.2)
特徵工程(標準化)# 3.特徵工程(標準化)
transfer = standardscaler()
x_train = transfer.fit_transform(x_train)
x_test = transfer.fit_transform(x_test)
機器學習(邏輯回歸)# 4.機器學習(邏輯回歸)
estimator = logisticregression()
estimator.fit(x_train,y_train)
模型評估# 模型評估
# 5.1 列印分數
score = estimator.score(x_test,y_test)
print("**分數為:\n",score)
# 5.2 列印**結果
y_predict = estimator.predict(x_test)
print("**結果為:\n",y_predict)
## 5.3 精確率和召回率評價
ret = classification_report(y_test,y_predict,labels=(2,4),target_names=("良性","惡行"))
print(ret)
## 5.4 auc指標計算
python 邏輯回歸分類 機器學習 邏輯回歸分類
分類問題 1 本質 決策面 decision su ce 2 評估分類演算法的指標,正確率 正確分類個數 總數 二分分類 邏輯回歸輸入 訓練資料的特徵和標籤 模型 邏輯回歸 輸出 分類結果 什麼是邏輯函式?在0到1之間取值,邏輯回歸是因為引數是邏輯函式 邏輯的數值 表示分類結果是1是y的結果 決策面...
機器學習入門 複習邏輯回歸
取h x 0.5時,y 1。由sigmoid函式的影象可知,當sigmoid函式的引數 tx 0時,h x 的取值即 0.5。由於是複習,不做過多的數學推導,直接給出代價函式的式子。此處的代價函式不是平方差代價函式,而是使用cost函式作以替代,而cost函式是乙個分段函式,實際上,cost函式中的...
機器學習 邏輯回歸 多分類問題
from sklearn.linear model import logisticregression 1 penalty 使用指定正則化項 預設 l2 2 dual n samples n features取false 預設 3 c 正則化強度,值越小正則化強度越大 4 fit intercept...