gan 的要點 (弱點與改進 推土距離)

2021-10-04 18:13:04 字數 796 閱讀 5454

1、如何度量兩個分布的相似度

kl散度,分布的對數差異的數學期望(兩個分布在所有取值上的加權平均)。

2、極大似然估計可以看作最小化模型分布的kl散度距離等價。

使得對數似然函式最大》等價轉換(引入負號)>引入常數項》相除形式》kl散度定義

3 、kl散度作為損失函式的模式塌陷問題:因為p(x)為其中乙個分布的加權,所以不具有對稱性,假設p(x) q(x)乙個為單峰、乙個為雙峰,用雙峰逼近的時容易忽視其中乙個。通常改用js散度。(假設10個模式,有可能只生成其中幾種模式,丟失其他模式)

4、gan的損失函式改進之一:加log。(雖然該方法在wgan中被批判),把目標函式的值域拉大。

5、在最優判別器下,gan定義的生成器loss可等價變換為最小化真實分布與生成分布之間的js散度。

(真、假樣本混合可以找出真的樣本)

6、推土機距離(絕妙,納什平衡依據)(最優路徑規劃最小消耗)(接近於連續,js、kl有突變、空間不要有懸崖)

1)取log的問題 導致沒有上界;判別器引數絕對值截斷(lipschitz連續)

2)解決訓練不穩定 (dc gan碰巧平衡生成、判別器)判別器過快最優,梯度為0

3)解決模型崩潰,生成多樣性。

4)gan最優判別器下,p(r)和g(g) 真實的分布和造出來的分布可能沒有重合,梯度消失

數學角度的GAN的改進方法

gan的discriminator評估的方式其實是計算p gp g pg 和pda ta p pd ata 的js散度。但是js 散度面對乙個問題 當兩個分布沒有重合,得到的js散度就是log 2log2 log2 同時之前從散度角度理解gan,使用js散度還面臨mode collapse和mode...

endeca 引擎搜尋的優點與弱點

endeca作為乙個企業級的搜尋工具,有它的優點,也有弱點。優點 效能和穩定性都很好,當有兩個dgraph在執行的時候,每秒可以處理上百個請求。endeca的過濾 refinement 功能也做的不錯。弱點 由於baseline是離線工作的,這個優點也造就了乙個缺點,那就是當endeca在新舊ind...

Normal Equations 的由來與推導

假設我們有m個樣本。特徵向量的維度為n。因此,可知樣本為,其中對於每乙個樣本中的x i 都有x i 令 h 0 1x 1 2x 2 nx n,則有 這個很好示意,但是維度標記錯誤了。x 是 m n 1 維,包含 0為 n 1 1 維。若希望h y,則有 x y 我們先來回憶一下兩個概念 單位矩陣 和...