華盛頓大學 初探深度學習

2021-07-15 23:36:51 字數 999 閱讀 7980

簡單的深度學習

通過修改對應的引數,表示邏輯問題

最基本的就是表示簡單的或門 和 與門

當要表示異或時,以上的就不夠了,還要再加一層,才可以表示

由於神經網路需要非常大量的資料,並且計算量極大(哪怕有gpu)

如果資料不是 很多的情況下,該怎麼辦???

用深度特徵(deep features),遷移學習

用深度學習提取特徵,然後用簡單的模型進行分類

由上圖就可以知道,假設我有一大堆的貓狗的,為了精確的區分貓狗,我運用8層,一千五百引數的神經網路。

現在,我又有一些其他的,用於區分哪個是椅子,那個不是。但是我的資料量很少,所以就不能用神經網路。那該怎麼辦??

我們可以考慮 用深度特徵(deep features),遷移學習 的方法解決!!!

即用深度學習提取特徵,然後用簡單的模型進行分類

我們用神經網路訓練貓狗時,用了8層,但其實只有最後一兩層才是用於區分哪個是貓,哪個是狗!!!其他的都是用於提取的特徵。比如 光線強度,摺疊程度,顏色,等等才!!!其實這些特徵可以直接運用到 區分椅子的模型裡。即把貓狗大戰的神經網路模型的前幾層的引數保持不變,直接給 椅子模型使用,再在椅子模型後加上乙個簡單的分類模型(比如svm,logistic 回歸),就形成了最終的模型!!!

Coursera華盛頓大學機器學習課程總結

一 基礎匯入課程 1 回歸 房價 2 分類 亞馬遜商品評價分類 二 回歸 模型 線性回歸 l1 l2正則化回歸 最近鄰回歸和核回歸 演算法 梯度下降 座標下降 概念 損失函式 偏差 方差折中 交叉驗證 稀疏性 過擬合 模型選擇 三 分類 模型 線性分類器 邏輯回歸分類器 svm 神經網路 核 決策樹...

深度學習初探(二)深度學習框架

theano 是最早的深度學習框架之一,是乙個基於 python 語言 定位底層運算的計算庫,theano 同時支援 gpu 和 cpu 運 算。由於theano 開發效率較低,模型編譯時間較長,同時開發人員轉投tensorflow 等原因,theano 目前已經停止維護 scikit learn ...

DeepMind 深度學習原理初探

去年11月,一篇名為 playing atari with deep reinforcement learning 的文章被初創人工智慧公司deepmind的員工上傳到了arxiv 兩個月之後,谷歌花了500萬歐元買下了deepmind公司,而人們對這個公司的了解僅限於這篇文章。近日,tartu大學...