記錄一下李巨集毅機器學習課程關於對抗攻擊的內容;
1、一般模型training過程:
輸入x_0,調整模型network的引數θ,使得輸出y_0和y_true的loss越小越好;損失函式:l_train(θ) = c(y_0, y_true)
non-targeted attack:
固定模型network的引數θ,調整輸入x',使得輸出y'和y_true越遠越好;損失函式:l(x') = -c(y', y_true)
targeted attack:
固定模型network的引數θ,調整輸入x',使得輸出y'和y_true越遠越好,同時讓y'和某個y_false越近越好; l(x') = -c(y', y_true) + c(y',y_false)
constraint:
常見的有兩種約束,l2-norm和l-infinity
1)l2-norm
d(x_0, x') = ||x_0 - x'||2
= (δx_1)2+ (δx_2)2+ (δx_3)2+...
2) l-infinity
d(x_0, x') = ||x_0 - x'||∞
=max
how to attack
x* = min l(x') st d(x_0, x') ≤ ε
大部分attack只是用不同的距離來作為約束, 以及用不同的優化方法來最小化這個距離
defense
passive defense:finding the attached image without modifying the model
proactive defense: training a model that is robust to adversarial attack
初探對抗攻擊 黑盒攻擊 白盒攻擊
對抗攻擊概念 通過對輸入新增微小的擾動使得分類器分類錯誤,一般用於對深度學習的網路的攻擊演算法 最為常見,應用場景包括目前大熱的cv和nlp方向,例如 通過對新增精心準備的擾動雜訊使得分類錯誤,或者通過對乙個句子的某些詞進行同義詞替換使得情感分類錯誤。關於攻擊的型別有很多種,從攻擊環境來說,可以分為...
用 iptables 對抗 CC 攻擊
我們可以使用 iptables 來在一定程度上實現 黑洞 抗 cc 連線耗盡 攻擊的能力,詳細配置如下 1.系統要求 1 linux 核心版本 2.6.9 42 elsmp 或 2.6.9 55 elsmp 其它核心版本需要重新編譯核心,比較麻煩,但是也是可以實現的 2 iptables 版本 1....
攻擊對抗基礎知識
對抗攻擊基礎知識,主要是對抗方法 對抗方法 fgsd fast gradient sign method 一種基於梯度生成對抗樣本的演算法 fgm fast gradient method 對fgsd做了推廣,使其能夠滿足 l2約束 ifgsd iterative gradient sign met...