資料探勘技術 神經網路模型

2022-08-30 08:30:12 字數 2899 閱讀 3758

神經網路模型

一、神經網路原理

對網路模型的研究始於20世紀40年代,作為一門交叉學科,它是人類基於對其大腦神經認識的基礎上,人工構造實現某種功能的網路模型。經過將近70年的發展,神經網路模型已成為機器學習的典型代表,它不依照任何概率分布,而是模仿人腦功能進行抽象運算。神經網路(neutral network)是通過數學演算法來模仿人腦思維的,它是資料探勘中機器學習的典型代表。神經網路是人腦的抽象計算模型,我們知道人腦中有數以百億個神經元(人腦處理資訊的微單元),這些神經元之間相互連線,是的人的大腦產生精密的邏輯思維。而資料探勘中的「神經網路」也是由大量並行分布的人工神經元(微處理單元)組成的,它有通過調整連線強度從經驗知識中進行學習的能力,並可以將這些知識進行應用。

人工神經網路首先要以一定的學習準則進行學習,然後才能工作。現以人工神經網路對手寫「a」、「b」兩個字母的識別為例進行說明,規定當「a」輸入網路時,應該輸出「1」,而當輸入為「b」時,輸出為「0」。所以網路學習的準則應該是:如果網路作出錯誤的判決,則通過網路的學習,應使得網路減少下次犯同樣錯誤的可能性。首先,給網路的各連線權值賦予(0,1)區間內的隨機值,將「a」所對應的圖象模式輸入給網路,網路將輸入模式加權求和、與門限比較、再進行非線性運算,得到網路的輸出。在此情況下,網路輸出為「1」和「0」的概率各為50%,也就是說是完全隨機的。這時如果輸出為「1」(結果正確),則使連線權值增大,以便使網路再次遇到「a」模式輸入時,仍然能作出正確的判斷。普通計算機的功能取決於程式中給出的知識和能力。顯然,對於智慧型活動要通過總結編制程式將十分困難。

人工神經網路也具有初步的自適應與自組織能力。在學習或訓練過程中改變突觸權重值,以適應周圍環境的要求。同一網路因學習方式及內容不同可具有不同的功能。人工神經網路是乙個具有學習能力的系統,可以發展知識,以致超過設計者原有的知識水平。通常,它的學習訓練方式可分為兩種,一種是有監督或稱有導師的學習,這時利用給定的樣本標準進行分類或模仿;另一種是無監督學習或稱無為導師學習,這時,只規定學習方式或某些規則,則具體的學習內容隨系統所處環境 (即輸入訊號情況)而異,系統可以自動發現環境特徵和規律性,具有更近似人腦的功能。

神經網路就像是乙個愛學習的孩子,您教她的知識她是不會忘記而且會學以致用的。我們把學習集(learning set)中的每個輸入加到神經網路中,並告訴神經網路輸出應該是什麼分類。在全部學習集都執行完成之後,神經網路就根據這些例子總結出她自己的想法,到底她是怎麼歸納的就是乙個黑盒了。之後我們就可以把測試集(testing set)中的測試例子用神經網路來分別作測試,如果測試通過(比如80%或90%的正確率),那麼神經網路就構建成功了。我們之後就可以用這個神經網路來判斷事務的分類了。

神經網路是通過對人腦的基本單元——神經元的建模和聯接,探索模擬人腦神經系統功能的模型,並研製一種具有學習、聯想、記憶和模式識別等智慧型資訊處理功能的人工系統。神經網路的乙個重要特性是它能夠從環境中學習,並把學習的結果分布儲存於網路的突觸連線中。神經網路的學習是乙個過程,在其所處環境的激勵下,相繼給網路輸入一些樣本模式,並按照一定的規則(學習演算法)調整網路各層的權值矩陣,待網路各層權值都收斂到一定值,學習過程結束。然後我們就可以用生成的神經網路來對真實資料做分類。

簡單來說,「神經網路」就是通過輸入多個非線性模型以及不同模型之間的加權互聯(加權的過程在隱蔽層完成),最終完成乙個輸出模型。具體來說,」神經網路「是一組互相連線的輸入/輸出單元,其中每個連線都會與乙個券種相關聯。在學習階段,通過調整這些連線的權重,就能夠**輸入觀測值的正確類標號。因此可以理解為人工神經網路是由大量神經網路元通過豐富完善的連線、抽樣、簡化和模擬而形成的一種資訊處理系統。

二、神經網路模型原理

人工網路模型的結構大致分為兩大類:前向型網路和反饋性網路。

具體來說,所謂前向型網路,是指傳播方向是從輸入端傳向輸出端,並且沒有任何的反饋;所謂反饋性網路是指在傳播方向上除了從輸入端傳向輸出端之外,還有回環或反饋存在。這兩種網路原理圖如下圖所示:

在上述的典型結構裡,神經網路通過輸入多個非線性模型,以及不同模型之間的加權互聯,最終得到乙個輸出模型。具體來說,多元輸入層是指一些自變數,這些自變數通過加權結合到中間的層次上,成為隱蔽層。隱蔽層主要包含的是非線性函式,頁尾轉換函式或壓縮函式。隱蔽層就是所謂的黑箱部分,幾乎沒有人能在所有的情況下多難過隱蔽層中哪些非線性函式式如何對自變數進行組合的,這是計算機思考代替人類思考的乙個典型案例。

由於「神經網路」擁有特有的大規模並行結構和資訊的並行處理等特點,因此它具有良好的自適應性、自組織性和高容錯性,並且具有較強的學習、記憶和識別功能。目前神經網路已經在訊號處理、模式識別、專家系統、**系統等眾多領域得到廣泛的應用。目前最主流的"神經網路"演算法是反饋傳播(backpropagation),該演算法在多層前向型(multilayer feed-forward)神經網路上進行學習,而多層前向型神經網路又是由乙個輸入層、乙個或多個隱蔽層以及乙個輸出層。」神經網路「技術在資料化運營中主要用途體現在:作為分類、**問題的重要技術支援,在使用者劃分、行為**、營銷響應等諸多方面具有廣泛的應用前景。

三、影響神經網路模型的5大因素

」神經網路「的主要特點就是其知識和結果的不可解釋性,沒有人知道隱蔽層離的非線性函式到底是如何處理自變數的,」神經網路「應用中產出物在很多時候讓人看不清其中的邏輯關係。但是,他的這個缺點並沒有影響該技術在資料化運營的廣泛應用,甚至可以這樣認為,正是因為其結果具有不可解釋性,反而更可能促使我們發現新的沒有認識到的規律和關係。在利用」神經網路「技術建模的過程中,有以下5個因素對買模型結果有著重大影響:

四、前向型網路模型的設計原理

大部分神經網路模型的學習過程,都是通過不斷地改變券種來使誤差達到總誤差的最小絕對值。比如,以常見的前向型網路模型為例,其設計原理如下:

五、神經網路的應用優勢

六、神經網路模型的缺點及注意事項

資料探勘 神經網路基礎

資料探勘 第二章 神經網路基礎 2.1 生物神經元模型 2.2 人工神經元模型 2.3 網路拓撲結構型別 2.4 人工神經網路模型 2.5 神經網路的學習 2.1 生物神經元模型 神經元是腦組織的基本單元,是神經系統結構與功能的單元。據統計大腦大約包含1.4 1011個神經元,每個神經元於大約103...

神經網路模型

神經網路往往不需要人為的構造資料特徵,因為乙個神經元就可以看做是原始資料的不同特徵的組合,在神經元數目足夠大,層數足夠多的情況下,是很容易準確的進行分類的.神經網路是由具有適應性的簡單單元組成的廣泛並行互連的網路,它的組織能夠模擬生物神經系統對真實世界物體所做出的互動反應 神經元模型 m p神經元模...

神經網路演算法 資料探勘

在 sql server analysis services 中,microsoft 神經網路演算法組合輸入屬性的每個可能狀態和可 屬性的每個可能狀態,並使用定型資料計算概率。之後,可以根據輸入屬性,將這些概率用於分類或回歸,並 被 屬性的結果。使用 microsoft 神經元網路演算法構造的挖掘模...