深度學習主要歷史簡介和資源推薦

第一代神經網路：

mcp神經元模型，該模型將神經元簡化為三個過程：

1. 輸入訊號加權

2. 求和

3. 非線性逼近

1958 單層感知機

死刑：只能處理線性分類問題，連xor問題都解決不了。

第二代神經網路：

1986 適用於mlp的bp演算法和sigmoid，有效解決了非線性分類和學習的問題。

1989 萬能逼近定理 lenet

1997 lstm模型

死刑：bp演算法存在梯度消失問題，即在誤差梯度後向傳遞的過程中，後層梯度以乘性方式疊加到前層，由於sigmoid函式的飽和特性，後層梯度本來就小，誤差梯度傳到前層幾乎為0，因此無法對前層進行有效的學習。

統計學習方法的春天：

1986 決策樹，之後id3、id4、cart等，符號學習方法

1995 線性svm，有完美的數學理論推導做支撐

1997 adaboost 整合學習，回歸和分類效果好

2000 kernel svm 解決了非線性分類的問題

2001 隨機森林更好地抑制過擬合，圖模型被提出

第三代神經網路：

2006 梯度消失的解決方案：無監督預訓練對權值進行初始化+有監督訓練微調。

2011 relu啟用函式被提出，有效地抑制梯度消失的問題。

2012 imagenet影象識別比賽，構建cnn網路alexnet奪冠，碾壓第二名。爆發。

創新點：1. relu 2.有監督訓練 3.dropout層、lrn層減小過擬合。

2015 loss的區域性極值問題對於深層網路的影響可以忽略。原因是深層網路雖然區域性極值非常多，但是通過深度學習的batch gradient descent優化方法很難陷進去，就算陷進去，其區域性極小值點與全域性極小值點也非常接近。

2015 deepresidual net 設計了乙個對於單位對映有較強學習能力的深度學習網路，增強了深度學習網路的表達能力。

深度學習是理論和工程相結合的領域，不僅僅需要寫**的能力強，也需要有理論知識能夠看得懂**，實現**提出來的新想法，所以應該理論與**相結合。

深度學習：