機器學習學習記錄 持續更新 特徵組合

2021-10-02 19:54:10 字數 786 閱讀 4892

在之前的機器學習過程中,基本上都是在研究一些線性模型,如下圖,用一條直線將不同顏色的點分割開來

但是,當你遇到下面這樣的圖形,請問你還可以用一條直線將不同顏色的點分割開來嗎?

顯然是不行的!!!!

難道這說明我們之前費勁時間學習的線性模型其實沒有什麼廣泛的用途嗎?no!!!!!線性模型是目前用的最多、計算速度最快的模型,很多非線性問題都是通過轉換成線性問題來解決的,這就是為什麼特徵組合需要在此提出來!

特徵組合是指通過將兩個或多個輸入特徵相乘來對特徵空間中的非線性規律進行編碼的合成特徵。「cross」(組合)這一術語來自 cross product(向量積)。我們通過將x1與x2組合來建立乙個名為 的特徵組合:x3

我們像處理任何其他特徵一樣來處理這個新建的 特徵組合。線性公式變為:

線性演算法可以算出w3的權重,就像算出w1和w2的權重一樣。換言之,雖然 表示非線性資訊,但您不需要改變線性模型的訓練方式來確定w3的值。

機器學習學習記錄 持續更新 pandas

pandas訪問資料的方法 pandas操控資料的方法 pandas 是一種列存資料分析 api。它是用於處理和分析輸入資料的強大工具,很多機器學習框架都支援將 pandas 資料結構作為輸入。可以將它想象成乙個關係型資料 其中包含多個行和已命名的列。建立dataframe的方法可以是將對映 str...

機器學習學習記錄 持續更新 pandas

pandas訪問資料的方法 pandas操控資料的方法 pandas 是一種列存資料分析 api。它是用於處理和分析輸入資料的強大工具,很多機器學習框架都支援將 pandas 資料結構作為輸入。可以將它想象成乙個關係型資料 其中包含多個行和已命名的列。建立dataframe的方法可以是將對映 str...

機器學習學習記錄 持續更新 降低損失

下圖是機器學習過程中常見的迭代流程圖 該圖體現了機器學習過程中,通過迭代來減少損失的基本思路。大致思路如下 首先根據資料集中的訓練集來得到乙個 模型,然後利用該模型來計算乙個特徵對應的輸出,並且計算出損失。通過獲得的損失,來更新 模型的引數,再反覆進行上述過程。直至最後計算出來的損失降低至了可接受的...