python零基礎,啥都不懂的小白,一句句翻譯中。。。
//準備訓練資料集
//包含資料的座標位置,與資料的標籤
def reactedataset():
group = array
lables = ['a','a','b','b']
return group,lables
def classfy0(inx, dataset,lables,k):
datasetsize = dataset.shape[0]//獲取資料集的行數
diffmat = tile(int,(datasetsize,1))-dataset; //將待測資料在行方向擴充套件datasize次,再減去原來的矩陣,得到差矩陣;
sqdiffmat = diffmat**2
sqdistance = sqdiffmat.sum(axis=1)//矩陣的每一行向量相加 即是把每一行的所有資料相加 axis=0按列相加 即是把該列所有資料相加
distance =sqdistance**0.5
sortdistindicies = distance.argsort()//將distance中的元素從小到大排列,提取其對應的index(索引),然後輸出到sortdisdindiccies,它也是個陣列
classcount={}
for i in range(k)
voteilabel = lables[sortdistindicies[i]]
classcount[voteilabel] = classcount.get(voteilabel,0) +1
get(key,default=none)造字典
//依次查詢是否有該key,有則將取出value再+1,沒有則返回新增該key並置value為0,再+1
sortedclasscount = sorted(classcount.iteritems(), //
sortedclasscount是乙個listkey = operator.itemgetter(1),reverse = true)return sortedclasscount[0][0]
機器學習實戰筆記 1 機器學習基礎
監督學習的兩個任務 分類和回歸分析 數值型資料 分類方法思路 這個表至關重要,叫做特徵向量表 特徵1特徵2 目的變數 類別 例項1 例項2 如上表,分類思路如下 用大量的已分類資料 其目標變數的值已給出 組成的訓練集進行訓練,該訓練集由若干個訓練樣本構成,每個訓練樣本是乙個例項 測試樣本 不提供目標...
機器學習實戰學習筆記 1 基礎
1,什麼是機器學習 機器學習,簡單說就是要把無序的資料,轉化為人們可以識別的有用的資料。2,機器學習需要哪些基礎知識 機器學習橫跨很多學科領域,包括但不限於 計算機,數理統計,工程技術等。3,什麼時候可以用機器學習 一般我們寫 解決問題,結果或者計算過程具有確定性。比如計算完全數,水仙花數,或者保險...
機器學習實戰(1)
from numpy import import operator def createdataset object group array 1.0,1.0 1.0,1.1 0,0 0,0.1 labels a a b b return group,labels def classify0 inx,...