機器學習筆記入門 (三)

2021-09-23 10:19:00 字數 1285 閱讀 1684

有幾個點需要了解:

線性模型的形式: f(x) = w1x1 + w2x2 +…+ wm*xm + b

從這裡我們可以了解前面幾章介紹的模型,訓練,**等等知識的真實面目,上面這個函式或者公式,就是所謂的模型。西瓜問題的線性模型就形同:

f好瓜(x)=a * x色澤 + b * x根蒂 + c * x敲聲 + 1

其中a,b,c就是需要大量資料來訓練的引數,實際做法就是,通過大量的西瓜資料帶入到各個x中去,然後通過賦予a,b,c各種值來讓**f好瓜(x)**的錯誤最低,這個做法就是訓練,訓練的結果就是會出現類似如下的模型:

f好瓜(x)=0.2 * x色澤 + 0.5 * x根蒂 + 0.2 * x敲聲 + 1

其中0.2和0.5就是通過訓練得來的,錯誤率最低的引數,也就是最優的引數,接下來就是**,實際做法就是再拿一些訓練集以外的資料,形同(色澤=淺白,根蒂=蜷縮,敲聲=濁響)分別帶入到三個x中,就能計算出f好瓜(x)的值,整個過程就是這樣。當然訓練和**一般是交替進行的,訓練的引數表現好不代表**也會表現得很好。

另外,也可以看出,根蒂比色澤對是不是好瓜的判斷更重要,因為根蒂的引數0.5大於色澤0.2 。

線性回歸

通俗理解線性回歸

線性回歸的目的是在訓練的過程中,判斷給定的引數是否最好,誤差最小。它的核心思想就是求得多個模型**的結果和真實結果之間的差距之和,這個和越小,引數就越接近合適。

對數機率回歸

需要先了解,單調可微函式,對數。然後詳細見這裡。

對數機率回歸實際上是針對分類學習的,即「好瓜」和「壞瓜」這類問題的。

lda(線性判別分析)

投影後類內方差最小,類間方差最大

降維:以西瓜為例子,色澤是乙個維度,根蒂是乙個維度,敲聲是乙個維度,這個在前面假設空間裡提到過,而如果西瓜不止這些對好瓜壞瓜的因素而是有很多個,比如大小,圖案等等,那麼西瓜這個問題就有多個維度。針對上面的好瓜模型f好瓜(x)=a * x色澤 + b * x根蒂 + c * x敲聲 + 1,如果色澤對於好瓜壞瓜這個結果並沒有影響,那麼就把這一項去掉,但需注意,這裡的去掉並非是人為的把它去掉,而是如lda模型在訓練的過程中會學習到色澤對於結果沒有影響,因此會在演算法內把它去掉。

多分類學習

多分類學習的核心思想是將多個分類任務拆分為若干個二分類任務。拆分的策略

類別不平衡問題

LESS學習筆記 入門

今天在網上完成了less的基礎學習,下面是我的學習筆記。總共有三個檔案 index.html main.less mian.css,其中mian.css是main.less經過koala編譯之後自動生成的。下面是 index.html mian.less charset utf 8 body div...

Yii學習筆記(入門)

use yii db activerecord class a extends activerecord hello,i am only page.1 初始化應用 訪問http localhost basic web index.php,進入yii的啟動頁面。如果提示你未安裝openssl的話,去你...

hightopo學習筆記 入門

ht是基於html5標準的企業應用圖形介面一站式解決方案,其包含通用元件 拓撲元件和3d渲染引擎等豐富的圖形介面開發類庫,提供了完全基於html5的向量編輯器 拓撲編輯器及 3d場景編輯器等多套視覺化設計工具,和完善的類庫開發手冊 工具使用手冊 及針對html5技術如何進行大規模團隊開發的客戶深度培...