ML對抗攻擊

記錄一下李巨集毅機器學習課程關於對抗攻擊的內容；

1、一般模型training過程：

輸入x_0，調整模型network的引數θ，使得輸出y_0和y_true的loss越小越好；損失函式：l_train(θ) = c(y_0, y_true)

non-targeted attack：

固定模型network的引數θ，調整輸入x'，使得輸出y'和y_true越遠越好；損失函式：l(x') = -c(y', y_true)

targeted attack:

固定模型network的引數θ，調整輸入x'，使得輸出y'和y_true越遠越好，同時讓y'和某個y_false越近越好; l(x') = -c(y', y_true) + c(y',y_false)

constraint:

常見的有兩種約束，l2-norm和l-infinity

1）l2-norm

d(x_0, x') = ||x_0 - x'||2

= (δx_1)2+ (δx_2)2+ (δx_3)2+...

2) l-infinity　　

d(x_0, x') = ||x_0 - x'||∞

=max

how to attack

x* = min l(x') st d(x_0, x') ≤ ε

大部分attack只是用不同的距離來作為約束，以及用不同的優化方法來最小化這個距離

defense

passive defense：finding the attached image without modifying the model

proactive defense: training a model that is robust to adversarial attack

初探對抗攻擊黑盒攻擊白盒攻擊

對抗攻擊概念通過對輸入新增微小的擾動使得分類器分類錯誤，一般用於對深度學習的網路的攻擊演算法最為常見，應用場景包括目前大熱的cv和nlp方向，例如通過對新增精心準備的擾動雜訊使得分類錯誤，或者通過對乙個句子的某些詞進行同義詞替換使得情感分類錯誤。關於攻擊的型別有很多種，從攻擊環境來說，可以分為...

用 iptables 對抗 CC 攻擊

我們可以使用 iptables 來在一定程度上實現黑洞抗 cc 連線耗盡攻擊的能力，詳細配置如下 1.系統要求 1 linux 核心版本 2.6.9 42 elsmp 或 2.6.9 55 elsmp 其它核心版本需要重新編譯核心，比較麻煩，但是也是可以實現的 2 iptables 版本 1....

攻擊對抗基礎知識

對抗攻擊基礎知識，主要是對抗方法對抗方法 fgsd fast gradient sign method 一種基於梯度生成對抗樣本的演算法 fgm fast gradient method 對fgsd做了推廣，使其能夠滿足 l2約束 ifgsd iterative gradient sign met...

ML對抗攻擊

初探對抗攻擊 黑盒攻擊 白盒攻擊

用 iptables 對抗 CC 攻擊

攻擊對抗基礎知識

相關推薦

初探對抗攻擊黑盒攻擊白盒攻擊