持續更新中…
n-gram語言模型引入馬爾科夫假設,假設當前單詞出現的概率只與前n-1個單詞有關。常見的unigram、bigram、trigram公式如下:
神經語言模型使用連續表示或詞彙embedding來進行**。
網路包含輸入層、投影層、隱藏層和輸出層。輸入為前n-1個單詞,然後將每個單詞對映成為多維向量,再通過隱層去學習更深層次的表徵,最後輸出層通過softmax輸出詞表中每個單詞出現的概率。
網路的第一層:將前n-1個單詞的向量 c(w
t−n+
1),.
..,c
(wt−
2),c
(wt−
1)c(w_), ..., c(w_),c(w_)
c(wt−n
+1)
,...
,c(w
t−2
),c(
wt−1
)進行拼接成為 (n−
1)∗m
(n-1)*m
(n−1)∗
m 維的向量,記為輸出 xxx。
網路第二層:通過全連線的隱層進行訓練 hx+
dhx+d
hx+d
,其中 h
hh 為權重矩陣,d
dd 為偏置項,最後通過乙個 tan
htanh
tanh
啟用函式。
網路的第三層:輸出層的節點個數為詞表的大小 ∣v∣
|v|∣v
∣, 每個節點 y
iy_i
yi 表示單詞 w
iw_i
wi **為下個單詞的概率。最終通過softmax進行歸一化輸出。y=b
+wx+
utan
h(d+
hx)p
=sof
tmax
(y)y=b+wx+utanh(d+hx) \\ p=softmax(y)
y=b+wx
+uta
nh(d
+hx)
p=so
ftma
x(y)
c語言的優缺點
1.物件導向程式設計功能 oops 物件導向程式設計的特點是c語言缺少的,你只能使用面向過程的語言來開發程式。c沒有的oops概念,這就是為什麼c 被開發。2.執行時型別檢查是不可用 在c語言沒有規定執行時型別檢查,比如我傳遞浮點值,而接收引數為整數型別那麼值將會被改變,它不會給任何型別的錯誤資訊。...
各種ADC轉換方式的優缺點
1 逐次逼近型 逐次逼近型adc是應用非常廣泛的模 數轉換方法,它包括1個比較器 1個數模轉換器 1個逐 次逼近暫存器 sar 和1個邏輯控制單元。它是將取樣輸入訊號與已知電壓不斷進行比較,1個時鐘週期完成1位轉換,n位轉換需要n個時鐘週期,轉換完 成,輸出二進位制數。這一型別adc的解析度和取樣速...
各種電容器的優缺點
電容器以生產材料可劃分為陶瓷電容器 鉭電解電容器 鋁電解電容器等。種類 優點缺點 應用陶瓷電容 溫度補償型 具有良好的高頻特性,較低的esr及殘餘電感esl 容量變化率小 濾波 高頻電容的耦合,與電感結合使用時,線圈的電感會隨著溫度的上公升而增加,這時則可以利用負溫度係數電容器來進行修正 高誘電型 ...