本章比較簡單,直接貼**和
# coding=utf-8
# 什麼是好的特徵(feature)
# 要求判斷狗是灰狗還是拉布拉多
# 現在的資料有2個feature,乙個是身高,乙個是眼睛的顏色
# 首先說身高
# 灰狗的身高大概在28cm,正負4cm
# 拉布拉多的身高大概在24cm,正負4cm
# 我們來模擬一些隨機資料
import numpy as np
import matplotlib.pyplot as plt
# 生成500個資料
greyhounds = 500
labs = 500
grey_height = 28 + 4 * np.random.randn(greyhounds)
labs_height = 24 + 4 * np.random.randn(labs)
plt.hist([grey_height,labs_height],stacked=true,color=['r','b'])
plt.show();
# 可以看到影象中間段,這些區間讓我們無法很好的判斷狗的種類
# 所以我們需要更多的特徵
# 由於狗的品種跟狗的眼睛的顏色沒有直接關係,所以"眼睛的顏色"是個"壞"的特徵
藍色為拉布拉多 紅色為灰狗機器學習 什麼是特徵提取
通常來說,將資料想象成 是很有用的。你想要處理的每乙個資料點 每 一封電子郵件 每一名客戶 每一次交易 對應 中的一行,描述該資料點的每一項屬 性 比如客戶年齡 交易金額或交易地點 對應 中的一列。你可能會從年齡 性別 賬號建立時間 在你的購物 上的購買頻率等方面來描述使用者。你可能會用每乙個畫素 ...
什麼是機器學習
機器學習 machine learning 是研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的效能。它是人工智慧的核心,是使計算機具有智慧型的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納 綜合而不是演譯。學習能力是智慧型行為的乙個非常重...
什麼是機器學習
廣州的天氣總是陰晴不定,經常上午陽光燦爛,下午突然烏雲密布,狂風亂作,然後就是傾盆大雨。每次看見烏雲和大風,人們就知道要下大雨了。為什麼我們看見烏雲感受到大風,就知道要下雨了呢?我們能做出這些有效的預判,是因為我們已經積累了許多經驗,而通過對經驗的利用,就能對新情況做出有效 那麼,這樣利用經驗做出判...