神經網路簡介

2021-07-25 03:10:01 字數 2285 閱讀 6481

簡單介紹一下什麼是神經網路,以及其原理

這個感知器有3個input和乙個output,分別是x1

,x2,

x3,有乙個output。乙個感知器可以擁有多個input,如x1

,x2,

… 。 input和output的值都有乙個特點,就是只能是1或者0,也就是說x1

,x2,

… 只能取0或者1,而output也只能取0或者1.那麼如何決定到底輸出0還是1呢?就根據每個input的權重(weight),把每個權重和input的值相乘,結果相加(∑j

wjxj

),再和某個閾值進行比較,如果結果比某個閾值大,那麼就輸出1,比閾值小,就輸出0。數學公式為:

output=⎧

⎩⎨⎪⎪

⎪⎪⎪⎪

01if ∑jw

jxj≤

threshold

if ∑jw

jxj>

threshold

(1)

這個模型基本上可以看做是乙個邏輯電路,只不過多了權重和閾值。

左邊的第一列被稱為感知器的第一層,有三個input,可以做三個簡單的決定,那麼為什麼還需要中間的第二層呢?是因為第二層可以另整個感知器做更多的更抽象的選擇。而第三層只有乙個感知器(perceptron),但實際上可以有更多個。公式∑j

wjxj

>

threhold

可以進行變形,另b≡

−threshold

,而∑jw

jxj 寫成點積的形式,即為:

output={

01if w⋅x

+b≤0

if w⋅x

+b>

0(2)

假設我們有了乙個感知器組成的神經網路,開始進行深度學習,我們想要識別手寫的阿拉伯數字,輸入的是以每個畫素值為最小單位的矩陣,而輸出的是識別的結果。如果網路最後將8識別成了9,我們想要去糾正它,只要我們更改一點input的權重和閾值,而整個網路輸出的結果也只改變一點的話,我們就可以每次改變微笑的量,直到網路輸出正確的結果為止。但實際上,如果我們改變一點權重或者閾值,整個網路的輸出結果可能會有翻天覆地的變化,這就使得學習演算法非常難以應用了。因此,我們引入乙個新的型別的人工智慧神經元:sigmoid neuronsigmoid neuron。這種神經元和感知器有相似的地方,但是不同的地方是:input中一些微小的權重和閾值的變化,只會引起output微小的變化。sigmoid neuron如圖所示:

和感知器一樣,有input,output,不同的地方是,不在像感知器一樣輸出

0 和

1了,而是輸出乙個函式:σ(

z)≡1

1+e−

z.(3)

,其中,因為inputs是 x1

,x2,

… , weights w1

,w2,

… , and bias

b ,所以3式又可以換成:11

+exp(−

∑jwj

xj−b

).(4)我們來分析一下方程(4):我們假設z≡

w⋅x+

b ,也就是sigmoid neuron的input是乙個非常大的數,那麼 e−

z 的結果就無限接近於0,則σ(z)的值就非常接近於1,而當z為乙個非常小的負數,則σ(z)的結果無限接近於1.也就是說σ(z)的值域在(0,1)區間。因為

σ 是連續函式,所以,δw

j 和 δb

的微小變化,會讓

δoutput

也產生微小變化,這樣就令訓練成為了可能。根據微積分,

δoutput≈∑

j∂output∂w

jδwj

+∂output∂b

δb,(5) δ

∂wj 為函式σ(

z)對w的偏導,δ∂

bj為函式σ(

z)對變數b的偏導。

先介紹一些術語,如下圖所示:

最左邊的一列叫做輸入層(input layer),而中間的一列叫做隱蔽層(hidden layer),最右邊的一列叫做輸出層(output layer)。在輸入層的神經元被稱為輸入神經元(input neurons),而在輸出層的神經元被稱為輸出神經元(output neurons)

輸入層和輸出層可以有多個神經元,而且隱蔽層可以有很多層。

如圖就是乙個擁有兩層隱蔽層的神經網路。因為歷史原因,有時候圖中的神經網路會被叫做多層感知器,雖然和感知器沒有關係。

想要幾個簡單的規則就能設計出隱蔽層是不可能的

目前為止,我們談論的神經網路都不存在迴圈,即資訊總是向前傳輸。但是,的確有些神經網路存在迴圈,我們稱這些網路為迴圈神經網路

神經網路簡介 多層神經網路

如上圖所示,該神經網路有三層。我們標記第一層 也就是輸入層 為a 1 第一層與第二層連線權重為w 1 然後第一層輸入與第一層權重的線性和為z 1 第一層神經元個數為n 1 並依次標記剩餘網路層。可以看出,存在 z l j i 1 n l a l i w l i,j a l w l j a l 1 f...

神經網路簡介

新手上路很多概念不清楚,本文作為記錄和筆記,簡單摘抄,列出關鍵概念,以便查閱,詳細內容移步原文 參考 如何自己從零實現乙個神經網路?量子位的回答 知乎 神經元 神經網路基本單元,獲得輸入,計算,產生輸出 權重 wx 偏置 b 啟用函式 使用的sigmoid,作用對無限制的輸入轉換為可 形式輸出,從而...

神經網路簡介

在過去的十年中,效能最佳的人工智慧系統 例如智慧型手機上的語音識別器或google最新的自動翻譯器 源自 深度學習 技術。實際上,深度學習是一種稱為神經網路的人工智慧方法的新名稱,這種方法已經流行了70多年。神經網路由沃倫 麥卡洛 warren mccullough 和沃爾特 皮茨 walter p...