pip 安裝
安裝 scikit-learn (sklearn) 最簡單的方法就是使用 pip 安裝它.
首先確認自己電腦中有安裝
python (>=2.6 或 >=3.3 版本)
numpy (>=1.6.1)
scipy (>=0.9)
然後開啟cmd視窗,使用如下命令安裝
pip3 install -u scikit-learn(因為我用的版本是python3,所以pip後面要加3)
ps:其實只要電腦中已經安裝anaconda,那就不需要再安裝sklearn了
可以使用conda list 命令檢視anaconda中是否有sklearn模組
import numpy as np
from sklearn import datasets #從sklearn自帶資料庫中載入鳶尾花資料
from sklearn.model_selection import train_test_split #引入train_test_split函式
from sklearn.neighbors import kneighborsclassifier #引入knn分類器
iris=datasets.load_iris() #將鳶尾花資料存在iris中
iris_x=iris.data #指定訓練資料iris_x
iris_y=iris.target #指定訓練目標iris_y
# print(iris_x[:2,:]) //檢視前兩個例子的所有特徵值
# print(iris_y) //檢視目標標籤名稱
#使用train_test_split()函式將資料集分成用於訓練的data和用於測試的data
x_train,x_test,y_train,y_test=train_test_split(iris_x,iris_y,test_size=0.3)
knn=kneighborsclassifier() #呼叫knn分類器
knn.fit(x_train,y_train) #訓練knn分類器
print(knn.predict(x_test)) #**值
print(y_test) #真實值
輸出結果
一二行實**值,三四行是真實值
用最簡單的資料分類例子實現KNN演算法
k 鄰近演算法 knn 的工作原理是 已知乙個帶標籤的已分類資料集合,輸入未分類的新資料之後,計算新資料到資料集中的每個資料的歐幾里得距離,篩選出前k個最近的點,選擇這k個點 現次數最多的分類,即作為新資料的分類標籤 問題描述 已知4個帶標籤的座標點a1 1.0,1.1 a2 1.0,1.0 b1 ...
SElinux 學習筆記 例子實現
測試環境介紹 作業系統 fedora 22 mate fedora 21 環境搭建 root yum install y policycoreutils python policycoreutils devel selinux policy devel setools hddtemp git vim...
Tempo的PIPA Task的例子實現
pipa是people initiating process activity的意思,也就是流程的初始化節點是人工節點,一般會通過繫結的xform表單來啟動流程。在bpms.intalio.com站點上有乙個非常詳細的pipa的flash demo,並且這個例子演示了表單的繫結,採用的是xform。...