《機器學習(周志華)》 西瓜資料集3 0

2021-07-10 17:23:44 字數 781 閱讀 8660

書上的乙個常用資料集

編號,色澤,根蒂,敲聲,紋理,臍部,觸感,密度,含糖率,好瓜

1,青綠,蜷縮,濁響,清晰,凹陷,硬滑,0.697,0.46,是

2,烏黑,蜷縮,沉悶,清晰,凹陷,硬滑,0.774,0.376,是

3,烏黑,蜷縮,濁響,清晰,凹陷,硬滑,0.634,0.264,是

4,青綠,蜷縮,沉悶,清晰,凹陷,硬滑,0.608,0.318,是

5,淺白,蜷縮,濁響,清晰,凹陷,硬滑,0.556,0.215,是

6,青綠,稍蜷,濁響,清晰,稍凹,軟粘,0.403,0.237,是

7,烏黑,稍蜷,濁響,稍糊,稍凹,軟粘,0.481,0.149,是

8,烏黑,稍蜷,濁響,清晰,稍凹,硬滑,0.437,0.211,是

9,烏黑,稍蜷,沉悶,稍糊,稍凹,硬滑,0.666,0.091,否

10,青綠,硬挺,清脆,清晰,平坦,軟粘,0.243,0.267,否

11,淺白,硬挺,清脆,模糊,平坦,硬滑,0.245,0.057,否

12,淺白,蜷縮,濁響,模糊,平坦,軟粘,0.343,0.099,否

13,青綠,稍蜷,濁響,稍糊,凹陷,硬滑,0.639,0.161,否

14,淺白,稍蜷,沉悶,稍糊,凹陷,硬滑,0.657,0.198,否

15,烏黑,稍蜷,濁響,清晰,稍凹,軟粘,0.36,0.37,否

16,淺白,蜷縮,濁響,模糊,平坦,硬滑,0.593,0.042,否

17,青綠,蜷縮,沉悶,稍糊,稍凹,硬滑,0.719,0.103,否

機器學習(周志華) 西瓜書簡要筆記(2)

1.錯誤率 分類錯誤的樣本數佔樣本總數的比例。精度 精度 1 錯誤率 誤差 學習器的實際 輸出與樣本的真實輸出之間的差異 訓練誤差 學習器在訓練集上的誤差,也稱為 經驗誤差 泛化誤差 在新樣本上的誤差 2.過擬合 當學習器把訓練樣本學得 太好 了的時候,很可能已經把訓練樣本自身的一些特點當作了所有潛...

機器學習(周志華) 西瓜書簡要筆記(4)

1.決策樹是一種常見的機器學習方法,也稱為 判定樹 決策樹是基於樹結構來進行決策的。2.決策過程的最終結論對應了我們所希望的判定結果。決策過程中提出的每個判定問題都是對某個屬性的 測試 每個測試的結果或是匯出最終結論,或是匯出進一步的判定問題,其考慮範圍是在上次決策結果的限定範圍之內。3.一顆決策樹...

機器學習第一章緒論(周志華西瓜書)

目錄 第一章 緒論 1.1 引言 1.2 基本術語 1.3 假設空間 1.4 歸納偏好 1.5 發展歷程 1.6 應用現狀 1.7閱讀材料 2.課後練習 由 的值是否連續分類 由是否有標記分類 最終可能會有很多與訓練集一致的假設 無法取捨 通過實際偏好來選擇 有沒有一般性原則來引導選擇正確的偏好呢?...