總的說來,我們現在有了很多非常厲害的深度學習框架,比如tensorflow,pytorch,paddlepaddle,caffe2等等等等。然而,我們用這些框架在搭建我們自己的深度學習模型的時候,到底做了一些什麼樣的操作呢?我們試圖去閱讀框架的原始碼來理解框架到底幫助我們做了些什麼,但是……很難!很難!很難!因為深度學習是需要加速啦,分布式計算啦,所以框架做了很多很多的優化,也讓像我們這樣的小白難以理解這些框架的原始碼。所以,為了幫助大家更進一步的了解神經網路模型的具體內容,我們整理了這樣乙個系列的教程。
對於這份教程的內容,如果沒有額外的說明,我們通常使用如下**的命名約定
符號含義
x輸入樣本
y輸入樣本的標籤
z各層運算的結果
a啟用函式結果
大寫字母
矩陣或向量,如a,w,b
小寫字母
變數,標量,如a,w,b
沒有各種基礎想學習卻無從下手哀聲嘆氣的玩家,請按時跟蹤最新部落格,推導數學公式,跑通**,並及時提出問題,以求最高療效;
深度學習小白,有直觀的人工智慧的認識,強烈的學習慾望和需求,請在部落格的基礎上配合**食用,效果更佳;
超級高手,提出您寶貴的意見,給廣大初學者指出一條明路!
環境:windows(linux也行),python(最好用3),anaconda(或者自己裝numpy之類的),tensorflow(嫌麻煩地請看這裡《ai應用開發實戰 - 從零開始配置環境》,tools for ai(按照鏈結教程走的就不用管這個了)。
自己:清醒的頭腦(困了的同學請自覺泡茶),紙和筆(如果像跟著推公式的話),鬧鐘(防止久坐按時起來轉轉),厚厚的衣服(有暖氣的同學請忽略)
神經網路簡易教程
作者 renu khandelwal 編譯 vk medium 在這篇文章中,我們將了解神經網路的基礎知識。這個部落格的先決條件是對機器學習的基本理解,如果你嘗試過一些機器學習演算法,那就更好了。首先簡單介紹一下人工神經網路,也叫ann。很多機器學習演算法的靈感來自大自然,而最大的靈感來自我們的大腦...
Tensorflow教程 遞迴神經網路
可以在 here。本教程的目的是重現 zaremba et al.2014 的成果,他們在 ptb 資料集上得到了很棒的結果。本教程使用的下面檔案的目錄是models rnn ptb 檔案作用 ptb word lm.py在 ptb 資料集上訓練乙個語言模型.reader.py讀取資料集.本教程需要...
研究表明 神經網路用光而不是電子實現
神經網路因計算成本高而聞名。但只有事物的訓練部分才會真正強調大多數計算機硬體,因為它涉及對效能的定期評估以及來回記憶以不斷調整其人工神經元之間的連線。相比之下,使用訓練有素的神經網路是乙個更簡單的過程,乙個計算複雜度不高的過程。實際上,訓練和執行階段可以在完全不同的硬體上執行。並且硬體中似乎有相當大...