對於標稱型資料來說,preprocessing.labelbinarizer是乙個很好用的工具。比如可以把yes和no轉化為0和1,或是把incident和normal轉化為0和1。當然,對於兩類以上的標籤也是適用的。這裡舉乙個簡單的例子,說明將標籤二值化以及其逆過程。
# -*- coding: utf-8 -*-
from sklearn import preprocessing
from sklearn import tree
# help(preprocessing.labelbinarizer)#取消注釋可以檢視詳細用法
# 特徵矩陣
featurelist=[[1,0],[1,1],[0,0],[0,1]]
# 標籤矩陣
labellist=['yes', 'no', 'no', 'yes']
labellist1=['yes', 'no', 'no', 'yes','ok']
# 將標籤矩陣二值化
lb = preprocessing.labelbinarizer()
dummy=lb.fit_transform(labellist)
dummy1=lb.fit_transform(labellist1)
# print(dummy)
# 模型建立和訓練
clf = tree.decisiontreeclassifier()
clf = clf.fit(featurelist, dummy)
p=clf.predict([[0,1]])
# print(p)#取消注釋可以檢視p的值
# 逆過程
yesorno=lb.inverse_transform(p)
print(yesorno)
dummy:
[[1]
[0][0]
[1]]
dummy1:
[[0 0 1]
[1 0 0]
[1 0 0]
[0 0 1]
[0 1 0]]
標籤二值化LabelBinarizer
對於標稱型資料來說,preprocessing.labelbinarizer是乙個很好用的工具。比如可以把yes和no轉化為0和1,或是把incident和normal轉化為0和1。當然,對於兩類以上的標籤也是適用的。這裡舉乙個簡單的例子,說明將標籤二值化以及其逆過程。coding utf 8 fr...
container of 的的的原理
另外一篇,同樣精彩,揭開linux核心中container of的神秘面紗 華清遠見嵌入式學院講師。在linux 核心中有乙個大名鼎鼎的巨集container of 這個巨集是用來幹嘛的呢?我們先來看看它在核心中是怎樣定義的。呵呵,乍一看不知道是什麼東東。我們先來分析一下container of p...
存在的就是合理的,發生的即是必然的。
筆者有時候會想,什麼是對,什麼是錯?對於追求某一件事情之前首先會考慮,為什麼我要做這件事情。所以經過自我分析和生活周邊環境的總結。我認為,對於乙個人來,這是在站在個體的角度上說。什麼是對的?就是你自己覺得是對的,它就是對的。不過這個只是你自己的想法。主觀上的正確,不代表客觀上也受到了別人的認可。就拿...