有監督的神經網路模型

2021-09-24 04:31:00 字數 2467 閱讀 9120

多層感知器(multi-layer perceptron, mlp)是乙個有監督的學習演算法,它通過訓練乙個資料集學習函式 f(⋅

):rm

→rof(\centerdot): r^m\rightarrow r^o

f(⋅):r

m→ro

, 這裡, m

mm 是輸入維數,而 o

oo 是輸出維數。給定特徵向量 x=(

x1,x

2,…,

xm)′

x=(x_1, x_2, \dots, x_m)'

x=(x1​

,x2​

,…,x

m​)′

與目標 y

yy, 它能學習乙個分類或回歸的非線性函式近似。在輸入與輸出層之間,可以有一層或多層非線性層,即,非線性變換,稱這些層為隱層。圖1顯示了乙個具有乙個隱層、一維輸出的mlp.

最左邊層,即輸入層,由輸入特徵組成,這些特徵在神經網路裡也稱為神經元(neurons). 位於隱層的每個神經元,實際上是上一層的加權線性變換 w1x

1+w2

x2+⋯

+wmx

mw_1x_1+w_2x_2+\dots+w_m x_m

w1​x1​

+w2​

x2​+

⋯+wm

​xm​

, 然後作乙個非線性函式變換 g(⋅

):r→

rg(\centerdot): r\rightarrow r

g(⋅):r

→r, 例如,雙曲正切函式。最後,由輸出層變換最後的隱層值。

多層感知器的優勢:

多層感知器的劣勢:

sklearn.neural_network模組包括基於神經網路的模型。主要的模型有:

sklearn.neural_network裡,類mlpclassifier使用向後傳播執行乙個mlp演算法。具體地說,mlp在兩層上訓練:

from sklearn.neural_network import mlpclassifier

x = [[0., 0.], [1., 1.]]

y = [0, 1]

clf = mlpclassifier(solver='lbfgs', alpha=1e-5,

hidden_layer_sizes=(5, 2), random_state=1)

clf.fit(x, y)

mlpclassifier(activation=『relu』, alpha=1e-05, batch_size=『auto』, beta_1=0.9,

beta_2=0.999, early_stopping=false, epsilon=1e-08,

hidden_layer_sizes=(5, 2), learning_rate=『constant』,

learning_rate_init=0.001, max_iter=200, momentum=0.9,

nesterovs_momentum=true, power_t=0.5, random_state=1, shuffle=true,

solver=『lbfgs』, tol=0.0001, validation_fraction=0.1, verbose=false,

warm_start=false)

經過擬合(訓練)後,模型可以用來**新樣本的類標籤。

clf.predict([[2., 2.], [-1., -2.]])
array([1, 0])

mlp能根據訓練資料擬合乙個非線性模型,屬性clf.coefs_包括由模型引數組成的權矩陣

[coef.shape for coef in clf.coefs_]
[(2, 5), (5, 2), (2, 1)]

當前,mlpclassifier僅支援交叉熵損失函式,通過執行predict_proba方法,可以實現類別的概率估計。

clf.predict_proba([[2., 2.], [1., 2.]])
array([[1.967…e-04, 9.998…-01],

[1.967…e-04, 9.998…-01]])

mlpregressor執行乙個使用後向傳播的多層感知器,在輸出層沒有啟用函式。因此,它使用平方誤差作為損失函式,輸出是連續值。

mlpclassifier and mlpregressor都使用引數alpha作為正則項。所謂「正則」,是指通過懲罰值大的權,避免過度擬合的情況。

神經網路模型是什麼 神經網路模型有什麼吸引力

神經網路模型是什麼,神經網路模型有什麼吸引力?這篇文章對這兩個問題做細緻的講解。神經網路模型是以神經元的數學模型為基礎來描述的。神經網路模型 artificialnuearlnewtokr s,是對人類大腦系統的一階特性的一種描。簡單地講,它是乙個數學模型。神經網路模型由網路拓撲 節點特點和學習規則...

神經網路模型

神經網路往往不需要人為的構造資料特徵,因為乙個神經元就可以看做是原始資料的不同特徵的組合,在神經元數目足夠大,層數足夠多的情況下,是很容易準確的進行分類的.神經網路是由具有適應性的簡單單元組成的廣泛並行互連的網路,它的組織能夠模擬生物神經系統對真實世界物體所做出的互動反應 神經元模型 m p神經元模...

神經網路語言模型

基於計數的n gram語言模型 出現的問題 1 資料稀疏,有些資料未出現過 2 忽略語義的相關性,如 無聊 與 枯燥 雖然語義相似,但無法共享資訊。詞語表示為 one hot表示法。基於分布式表示的n gram語言模型 出現的問題 1 詞向量 如何將每個詞對映到實數向量空間中的乙個點 2 f函式的設...