需要了解的基本概念 特徵 訓練集 樣例等

2021-07-31 01:48:50 字數 619 閱讀 2088

假定我們收集了一些關於西瓜的資料,例如(色澤=青綠,根蒂=蜷縮,敲聲=渾響),(色澤=烏黑,根蒂=稍蜷,敲聲=沉悶),每對括號內都是一條記錄,「=」意思是「取值為

」。這組記錄的集合稱為乙個「資料集」,其中每條記錄是關於乙個事件或物件的描述,稱為乙個「示例」或「樣本」。反應事件或物件在某方面的表現或性質的事項,例如「色澤」「根蒂」,稱為「屬性」或「特徵」;屬性上的取值稱為「屬性值」。屬性張成的空間,稱為「屬性空間」或「樣本空間」。例如我們把「色澤」「根蒂」「聲響」作為三個座標軸,把他們張成乙個用於描述西瓜的三維空間,每個西瓜都可在這個空間中找到自己的座標位置,由於空間中的每個點對應乙個座標向量,因此我們也把乙個示例成為乙個「特徵向量」。

從資料中學得模型的過程稱為「學習」或「訓練」,這個過程通過執行某個學習演算法來完成。訓練過程中使用的資料稱為「訓練資料」,其中每個樣本成了乙個「訓練樣本」,訓練樣本組成的集合稱為「訓練集」。如果希望學得乙個能幫助我們判斷沒剖開的是不是「好瓜」的模型,僅有前面的示例資料顯然是不夠的。要建立這樣的關於「**」的模型,我們需獲得訓練樣本的「結果」資訊,例如((「色澤=青綠,根蒂=蜷縮,敲聲=混響),好瓜)。這裡關於示例結果的資訊,例如「好瓜」,稱為「標記」;擁有了標記資訊的示例,則稱為「樣例」。

這些基本的概念,是機器學習中必須要了解的。

Android學習需要了解的一些基本概念

android系統主要由五個部分組成 自下而上 1.linux核心 2.資料庫 3.android執行時 4.應用程式框架 5.應用程式 android四大元件 activity service broadcastreceiver contentprovider android所有ui元件都繼承vi...

關於C語言的資料型別需要了解的基本概念

資料型別,總結起來主要有以下幾種 整型 int 字元型 char 浮點型 float double 陣列 int a 10 指標 int p 結構體 struct 空型別 void 這些是我常見的,還有像列舉型別 enum 共用體型別 union 是不常見到的。一部分資料型別進行知識點羅列 整型 1...

機器學習基本概念(訓練集測試集)

1.訓練集 training set data 訓練樣例 training examples 用來進行訓練,也是產生模型或者演算法的資料集 測試集 testing set data 測試樣例 testing examples 用來專門進行測試已經學習好的模型或者演算法資料集 特徵向量 feature...