課堂測試 機器學習原理

2022-09-17 16:06:16 字數 804 閱讀 4804

1、用自己的話說明機器學習的四大分類: classification (分類)、

clustering (聚類)

、regression (回歸)

、dimensionality reduction (降維)

。classification (分類

):分類需要先找到資料樣本點中的分界線,再根據分界線對新資料進行分類,分類資料是離散的值,比如識別、情感分析等領域會經常用到分類任務。

clustering (聚類

):聚類是根據樣本之間的相似度,將一批資料劃分為n個組。比如使用者分組、異常值檢測等領域會用到聚類任務。

regression (回歸

):回歸是對已有的資料樣本點進行擬合,再根據擬合出來的函式,對未來進行**。回歸資料是連續的值,比如商品**走勢的**就是回歸任務。 

dimensionality reduction (降維

):降維是減少資料的維度,對資料進行降噪、去冗餘,方便計算和訓練;如資料預處理,減少一些對模型準確率影響很小維度,可以提高計算效率。再如圖表視覺化,我們進行資料分析時,通常會將高維模型降為三維或二維圖表,便於直觀分析。

2、用自己的話說明正向傳播、反向傳播、梯度下降。

正向傳播:正向傳播是指對神經網路沿著從輸入層到輸出層的順序,依次計算並儲存模型的中間變數。

反向傳播:反向傳播用於計算神經網路中的引數梯度。

梯度下降:用於優化目標函式,如果要最小化乙個損失函式,就使用梯度下降法。

3、用自己的話說明梯度消失和梯度**原因。

(1)隱藏層的層數過多;(2)採用了不合適的啟用函式;(3)權重的初始化值過大.

測試機器學習演算法的好壞

一 當我們訓練出乙個模型,我們不知道這個模型是好還是壞,我們如果應用到真實環境,結果 的沒有可信度,所以在輸入樣例之前先對模型進行測試。這時,我們就要將我們所有的資料分為兩部分,一大部分用來訓練,一小部分用來測試,一般比例在8 2。也就是我們會有兩套資料集,乙個是訓練集,另乙個是測試集。二 鳶尾花舉...

如何測試機器的大小端

一 大小端 1 為啥會有大小端 在計算機系統中以位元組為單位,每個位址單位都有乙個位元組 乙個位元組8個bit位 在c語言中,有char 8bit short 16bit long 32bit,具體看編譯器 對於位數大於8的處理器,不如16位或者32位的處理器,由於暫存器寬度大於乙個位元組,那麼必然...

測試機器大小端儲存的方法

小端模式 little endian 是指資料的高位元組儲存在記憶體的高位址中,而資料的低位元組儲存在記憶體的低位址中,這種儲存模式將位址的高低和資料位權有效地結合起來,高位址部分權值高,低位址部分權值低,和我們的邏輯方法一致。大端模式 big endian 是指資料的高位元組,儲存在記憶體的低位址...