深度學習的雜七雜八

2021-10-24 19:19:41 字數 421 閱讀 7731

在學習和實踐深度學習的時候,對於神經網路的搭建過程感覺蠻好奇的。現在主流的框架tensorflow、pytorch等都封了一系列底層模組,搭神經網路有點類似拼積木,embedding、conv2d、lstm、linear組合起來加上各啟用函式、在確定優化器、損失函式,就組了乙個模型出來,那麼在設計這個模型的時候是依據什麼原則進行規劃的呢?

一般我會在nlp分析裡加上embedding(用預訓練的詞向量模型)、卷積(類似於提取n-grams資訊)、max_pool(最大池化用的比較多,例如把(4,4)取最大值變成(2,2))、雙向結構(正序、倒序提取上下文資訊),在時間序列分析中加入迴圈結構(進行長期記憶),優化器一般就是adma,損失函式採用交叉熵之類,啟用函式除了tanh之外常用的也用過了,過擬合就塞dropout,剩下的一些就瞎jb搭,看模型結果,再結合一些相關**改改。

就挺懵的吧。

雜七雜八的

有一些常用的表示式的對應元 如下表 型別 元 注釋 注釋 array type comment value 注釋 注釋段 注釋第一行 注釋第二行 array type comments value 注釋第一行 注釋第二行 退出exit exit 200 array type exit array t...

UML雜七雜八

各種分析的角度 目的。1 用例分析,是整個系統層次的功能 使用者的分析 2 靜態分析是對系統實現過程中對類層次的分析,它關注各個實現類的基本性情及各個類之前的關係 關聯 組合 聚合 泛化。3 活動分析是對系統功能業務及業務流和的分析,它是對物件層次的分析。這裡面引入了事件 時候的因素了 4 元件分析...

RTSP雜七雜八

1755埠 1755埠預設情況下用於 microsoft media server 微軟 伺服器,簡稱mms 554埠預設情況下用於 real time streaming protocol 實時流協議,簡稱rtsp 試試下面的方法 開始 控制面板 網路和撥號鏈結 右鍵點選你當前用的網路,點屬性 選...