create dummy classifier 建立** 分類模型
strategy=『uniform』 隨機篩選樣本
strategy=『strategy』 使**結果與訓練集中資料比例相同
# # 建立基準分類模型
from sklearn.datasets import load_iris
from sklearn.dummy import dummyclassifier
from sklearn.model_selection import train_test_split
# 載入資料
iris = load_iris()
# 타깃 벡터와 특성 행렬을 만듭니다.
features, target = iris.data, iris.target
# 將資料分為測試集和 訓練集
features_train, features_test, target_train, target_test = train_test_split(
features, target, random_state=0)
# create dummy classifier 建立** 分類模型
# strategy='uniform' 隨機篩選樣本
# strategy='strategy' 使**結果與訓練集中資料比例相同
dummy = dummyclassifier(strategy=
'uniform'
, random_state=1)
# "train" model 訓練模型
dummy.fit(features_train, target_train)
# get accuracy score 計算模型 精確度
dummy.score(features_test, target_test)
0.42105263157894735
計算模型得分
# 載入庫
from sklearn.ensemble import randomforestclassifier
# 建立分類模型
classifier = randomforestclassifier()
# 訓練模型
classifier.fit(features_train, target_train)
# 計算模型得分
classifier.score(features_test, target_test)
0.9736842105263158
붙임**
dummy = dummyclassifier(strategy=
'most_frequent'
)dummy.fit(features_train, target_train)
# 進行**
dummy.predict(features_test)
array([2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2,2
,2])
# 훈련 세트의 타깃 개수를 확인합니다.
np.bincount(target_train)
array([37
,34,41
])
MOSES 分子生成模型的基準平台
深度生成模型因發現新的分子和材料而迅速流行。這樣的模型可以從大量的分子結構中學習並產生新的化合物。這項工作中介紹了分子集 moses 乙個基準平台,可支援針對藥物發現的機器學習研究。moses實現了幾種流行的分子生成模型,並提供了一組指標來評估所生成分子的質量和多樣性。借助moses,旨在標準化分子...
分類模型和回歸模型
分類 概念 對於分類問題,監督學習從資料中學習乙個分類模型或者分類決策函式,稱為分類器。分類器對新的輸入 其屬於哪一類別,稱為分類。優化過程 找到最優決策面 輸出 離散值,如0 1,yes no 評價指標 一般是精確率,即給定測試資料集,分類器能正確分類的樣本數佔總樣本數的比。模型損失函式 交叉熵損...
話題模型分類
topic model 是一種應用十分廣泛的產生式模型 generative model 在ir,nlp,ml都有廣泛的應用,本文將對目前已有的topic model進行分類總結,然後選擇幾個代表性的topic model進行較為詳細的介紹,從而理解topic model 的思想,以及怎麼應用。to...