《機器學習實戰》(第二章)中函式詳細解析

2021-08-24 18:07:13 字數 2758 閱讀 4341

本文是針對《機器學習實戰》內函式的解析。並以頁數呈現。

p19:numpy.tile(a,rep)函式

當rep為數字時,生成乙個一維重複rep次的list。

當rep為元組(m,n)時,生成乙個m行並且每行重複n次的矩陣。

import numpy as np

a1 = [1,2,3]

a2 = [2,3,4]

b1 = np.tile(a1,1)

b2 = np.tile(a1,(3,2))

b2_1 = np.tile(a2,(3,2))

b2_2 = b2 - b2_1

print("b1:")

print(b1)

print("b2:")

print(b2)

print("b2_2:")

print(b2_2)

b1:[1 2 3]

b2:[[1 2 3 1 2 3]

[1 2 3 1 2 3]

[1 2 3 1 2 3]]

b2_2:

[[-1 -1 -1 -1 -1 -1]

[-1 -1 -1 -1 -1 -1]

[-1 -1 -1 -1 -1 -1]]

p19:sqdiffmat.sum(axis=1)

axis=0表述列  axis=1表述行

p19:distances.argsort()

函式意義:將x中的元素從小到大排列提取其對應的index(索引),然後輸出到y

import numpy as np

x = np.array([-1,-2,-3,1,2,3])

y = x.argsort()

print(y)

[2 1 0 3 4 5]

p19:python字典的dict.get(key,value)

該方法是通過鍵來獲取相應的值,如果相應的鍵不存在則返回none。

預設的返回值在非返回none值情況下會被所得值替代,如果查詢失敗,則返回乙個預設值。

import numpy as np

dict =

print(dict.get(1))

print(dict.get(4,none))

print(dict.get(4,"get"))

print(dict.get(5))

print(dict.get(5,0))

onefour

four

none

0

p19:python 字典的iteritems()函式與itemgetter()函式

items()函式,將乙個字典以列表的形式返回,因為字典是無序的,所以返回的列表也是無序的。

iteritems()函式在python3被廢除,直接使用items()函式代替。

import numpy as np

a_dict =

b_dict = a_dict.items()

print(type(b_dict))

for i,j in b_dict:

print(i,j)

1 one

2 two

p21:readlines()函式

python中readlines()函式:讀取所有行(直到結束符 eof)並返回列表,可以使用for...in 結構語句去處理。

如遇到結束符 「eof」 則返回空字串。

p21:numpy.zeros(shape, dtype=float, order=』c』)

shape:int或ints序列(新陣列的形狀)

dtype:矩陣內部元素型別(預設為float)

order:可選,是否在儲存器中以c或fortran連續(按行或列方式)儲存多維資料。

import numpy as np

from numpy.ma import zeros

a1 = zeros(5)

a2 = zeros((5,3))

a3 = zeros((5,3),dtype=int)

print("a1:")

print(a1)

print("a2:")

print(a2)

print("a3:")

print(a3)

a1:[0. 0. 0. 0. 0.]

a2:[[0. 0. 0.]

[0. 0. 0.]

[0. 0. 0.]

[0. 0. 0.]

[0. 0. 0.]]

a3:[[0 0 0]

[0 0 0]

[0 0 0]

[0 0 0]

[0 0 0]]

p21:strip()函式

string.strip(rm)

當rm不為空時,刪除s字串中開頭、結尾處,位於 rm刪除序列的字元

當rm為空時候,預設刪除空白符(包括'\n', '\r',  '\t',  ' ')

p22:returnmatrix[index,:] = listfromline[0:3]

matrix[index,:] = list[0:3]意義:將list中0,1,2中的元素賦值給index行中所有的元素

p26:matrix.shape[0]

函式作用:快速讀取矩陣的形狀,使用shape[0]讀取矩陣第一維度的長度

《機器學習實戰》 第二章KNN

knn演算法是基本的機器學習方法,其原理很簡單 如果乙個例項在特徵空間中的k個最相似 即特徵空間中最近鄰 的例項中的大多數屬於某乙個類別,則該例項也屬於這個類別。其實際上是選擇k個最可能的樣本進行投票,這和k means尋找k個幾何中心點進行聚類是不同的.如下圖所示 有兩種型別的樣本資料,一類是藍色...

機器學習實戰第二章 KNN

tile的使用方法 tile a,n 的功能是把a陣列重複n次 可以在列方向,也可以在行方向 argsort 函式 argsort 函式返回的是陣列中值從大到小的索引值 dict.get 函式 語法 dict.get key,default none key 字典中要查詢的鍵 default 如果指...

機器學習實戰 第二章 K 近鄰演算法

本系列目的在於總結每乙個分類器的特點 優點 缺點 使用資料型別 使用時的注意事項等 相關 自己搜。python 建議使用2.7 python常用函式庫 numpy scikit learn等 python整合環境 anaconda 優點 1 對異常值不敏感 2 無資料輸入假設 缺點 1 計算複雜度高...