機器學習 演算法學習3

2022-07-15 08:00:18 字數 512 閱讀 8041

詞向量:

將詞語"嵌入"到乙個n維空間,使得詞語相近的詞語放到相近的位置。

機器翻譯類不類似於矩陣的變換?

谷歌出品的乙個工具word2vec,用於入門。

句向量?段向量?文件向量?

很多事情向量化,可以解決很多問題。

傳統的one-hot 編碼的原來是,有多少個字就有多少個維度.

科[1,0,0,0,0,0,0,0]

學[0,1,0,0,0,0,0,0]

one hot -- >詞向量表(全連線的大矩陣)-->輸出(該詞的矩陣)

embedding層就是one hot 層。

時間序列:每次作**都是乙個序列, 序列每個時間點都有若干個屬性,實際上是乙個矩陣的輸入。

遞迴神經網路(rnn)原理:第一次輸出的結果與第二次輸入進行聯合**得到的二次輸出的結果,第二次與第三次聯合**......不斷遞迴。

長短時遞迴神經網路(lstm):在傳統的rnn上加入"門",專門用於解決序列型別的神經網路,lstm是文字領域的王牌。

機器學習演算法學習 1

我從線性 函式 影象以及演算法實踐這幾個方面對logistic regression模型進行表述。正常來說,乙個關於分類的問題可以分成線性可分和線性不可分兩種。還有一種叫非線性可分,難頂 1 線性可分是指能夠使用線性函式正確分類,如在座標軸上y 3的一類,y 3為另一類,那麼y 3就是他們的線性函式...

機器學習之PCA演算法學習

pca全稱principal component analysis,即主成分分析,是一種常用的資料降維方法。它可以通過線性變換將原始資料變換為一組各維度線性無關的表示,以此來提取資料的主要線性分量。其中,z為低維矩陣,x為高維矩陣,w為兩者之間的對映關係。假如我們有二維資料 原始資料有兩個特徵軸 特...

機器學習之整合學習演算法學習筆記

boosting方法是一種將弱學習器提公升為強學習器的演算法。最著名的代表是 adaboost 演算法。它學習過程中,對分類正確的樣本降低了權重,對分類錯誤的樣本公升高權重或保持不變。在演算法中,需要對訓練樣本分佈進行重新調整。有兩種調整方式 重新賦權法 即在訓練的每一輪中,根據樣本分佈為每乙個訓練...