機器學習 分類3

2021-08-30 08:57:09 字數 2075 閱讀 5077

今天,輸出了cross validation 在每個類別裡面的 模型評估值。

主要有下面2步:

#這是將輸出變成pandas矩陣的函式

from sklearn.metrics import classification_report

from collections import defaultdict

def report2dict(cr):

# parse rows

tmp = list()

for row in cr.split("\n"):

parsed_row = [x for x in row.split(" ") if len(x) > 0]

if len(parsed_row) > 0:

# store in dictionary

measures = tmp[0]

d_class_data = defaultdict(dict)

for row in tmp[1:]:

class_label = row[0]

for j, m in enumerate(measures):

d_class_data[class_label][m.strip()] = float(row[j + 1].strip())

return d_class_data

#輸出了cross validation 在每個類別裡面的 模型評估值。

import numpy as np

from sklearn.model_selection import stratifiedkfold

from sklearn import metrics

from sklearn.metrics import classification_report,accuracy_score,confusion_matrix

from sklearn.model_selection import cross_val_score

x = text

y = lab

skf = stratifiedkfold(n_splits=10)

print(skf)

skf.get_n_splits(x, y)

accuracy=

precision =

recall =

fscore =

pd_=pd.dataframe()

stratifiedkfold(n_splits=10, random_state=none, shuffle=false)

for train_index, test_index in skf.split(x, y):

# print("train:", train_index, "test:", test_index)

x_train, x_test = np.array(x)[train_index], np.array(x)[test_index]

y_train, y_test = np.array(y)[train_index], np.array(y)[test_index]

# print(len(x_train),len(x_test))

# print(len(y_train),len(y_test))

# a_,p,r,f = accuracy1(pipe,x_train, x_test,y_train, y_test)

predictions=pipe.predict(x_test)

report2dict(classification_report(y_test, predictions, target_names=pipe.classes_))

pd1_=pd.dataframe(report2dict(classification_report(y_test, predictions, target_names=pipe.classes_))).t

df_add = pd_.add(pd1_, fill_value=0)

pd_=df_add

print(df_add/10)

機器學習3 分類演算法

機器學習一般的資料集會劃分為兩個部分 劃分比例 想一下之前做的特徵工程的步驟?我們把特徵工程的介面稱之為轉換器,其中轉換器呼叫有這麼幾種形式 在sklearn中,估計器 estimator 是乙個重要的角色,是一類實現了演算法的api 2 用於回歸的估計器 3 用於無監督學習的估計器 如果乙個樣本在...

機器學習分類

監督學習是從標記的訓練資料來推斷乙個功能的機器學習任務。訓練資料報括一套訓練示例。在監督學習中,每個例項都是由乙個輸入物件 通常為向量 和乙個期望的輸出值 也稱為監督訊號 組成。監督學習演算法是分析該訓練資料,並產生乙個推斷的功能,其可以用於對映出新的例項。主要有 非監督學習是在未加標籤的資料中,試...

機器學習分類

一 機器學習的概念 從廣義上來說,機器學習是一種能夠賦予機器學習的能力以此讓它完成直接程式設計無法完成的功能的方法。但從實踐的意義上來說,機器學習是一種通過利用資料,訓練出模型,然後使用模型 的一種方法。二 機器學習的分類 1.監督學習 監督學習 資料集有輸入和輸出資料 通過已有的一部分輸入資料與輸...