本文是針對《機器學習實戰》內函式的解析。並以頁數呈現。
p19:numpy.tile(a,rep)函式
當rep為數字時,生成乙個一維重複rep次的list。
當rep為元組(m,n)時,生成乙個m行並且每行重複n次的矩陣。
import numpy as np
a1 = [1,2,3]
a2 = [2,3,4]
b1 = np.tile(a1,1)
b2 = np.tile(a1,(3,2))
b2_1 = np.tile(a2,(3,2))
b2_2 = b2 - b2_1
print("b1:")
print(b1)
print("b2:")
print(b2)
print("b2_2:")
print(b2_2)
b1:[1 2 3]
b2:[[1 2 3 1 2 3]
[1 2 3 1 2 3]
[1 2 3 1 2 3]]
b2_2:
[[-1 -1 -1 -1 -1 -1]
[-1 -1 -1 -1 -1 -1]
[-1 -1 -1 -1 -1 -1]]
p19:sqdiffmat.sum(axis=1)
axis=0表述列 axis=1表述行
p19:distances.argsort()
函式意義:將x中的元素從小到大排列,提取其對應的index(索引),然後輸出到y。
import numpy as np
x = np.array([-1,-2,-3,1,2,3])
y = x.argsort()
print(y)
[2 1 0 3 4 5]
p19:python字典的dict.get(key,value)
該方法是通過鍵來獲取相應的值,如果相應的鍵不存在則返回none。
預設的返回值在非返回none值情況下會被所得值替代,如果查詢失敗,則返回乙個預設值。
import numpy as np
dict =
print(dict.get(1))
print(dict.get(4,none))
print(dict.get(4,"get"))
print(dict.get(5))
print(dict.get(5,0))
onefour
four
none
0
p19:python 字典的iteritems()函式與itemgetter()函式
items()函式,將乙個字典以列表的形式返回,因為字典是無序的,所以返回的列表也是無序的。
iteritems()函式在python3被廢除,直接使用items()函式代替。
import numpy as np
a_dict =
b_dict = a_dict.items()
print(type(b_dict))
for i,j in b_dict:
print(i,j)
1 one
2 two
p21:readlines()函式
python中readlines()函式:讀取所有行(直到結束符 eof)並返回列表,可以使用for...in 結構語句去處理。
如遇到結束符 「eof」 則返回空字串。
p21:numpy.zeros(shape, dtype=float, order=』c』)
shape:int或ints序列(新陣列的形狀)
dtype:矩陣內部元素型別(預設為float)
order:可選,是否在儲存器中以c或fortran連續(按行或列方式)儲存多維資料。
import numpy as np
from numpy.ma import zeros
a1 = zeros(5)
a2 = zeros((5,3))
a3 = zeros((5,3),dtype=int)
print("a1:")
print(a1)
print("a2:")
print(a2)
print("a3:")
print(a3)
a1:[0. 0. 0. 0. 0.]
a2:[[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]
[0. 0. 0.]]
a3:[[0 0 0]
[0 0 0]
[0 0 0]
[0 0 0]
[0 0 0]]
p21:strip()函式
string.strip(rm)
當rm不為空時,刪除s字串中開頭、結尾處,位於 rm刪除序列的字元
當rm為空時候,預設刪除空白符(包括'\n', '\r', '\t', ' ')
p22:returnmatrix[index,:] = listfromline[0:3]
matrix[index,:] = list[0:3]意義:將list中0,1,2中的元素賦值給index行中所有的元素
p26:matrix.shape[0]
函式作用:快速讀取矩陣的形狀,使用shape[0]讀取矩陣第一維度的長度
《機器學習實戰》 第二章KNN
knn演算法是基本的機器學習方法,其原理很簡單 如果乙個例項在特徵空間中的k個最相似 即特徵空間中最近鄰 的例項中的大多數屬於某乙個類別,則該例項也屬於這個類別。其實際上是選擇k個最可能的樣本進行投票,這和k means尋找k個幾何中心點進行聚類是不同的.如下圖所示 有兩種型別的樣本資料,一類是藍色...
機器學習實戰第二章 KNN
tile的使用方法 tile a,n 的功能是把a陣列重複n次 可以在列方向,也可以在行方向 argsort 函式 argsort 函式返回的是陣列中值從大到小的索引值 dict.get 函式 語法 dict.get key,default none key 字典中要查詢的鍵 default 如果指...
機器學習實戰 第二章 K 近鄰演算法
本系列目的在於總結每乙個分類器的特點 優點 缺點 使用資料型別 使用時的注意事項等 相關 自己搜。python 建議使用2.7 python常用函式庫 numpy scikit learn等 python整合環境 anaconda 優點 1 對異常值不敏感 2 無資料輸入假設 缺點 1 計算複雜度高...