rootkit是一種特殊的惡意軟體,它的功能是在安裝目標上隱藏自身以及指定的檔案,程序和網路鏈結等資訊。
1.資料蒐集
kdd 99 tcp連線內容特徵包括hot ,num_faild_logins ,logged_in ,num_compromised ,root_shell ,su_attempted ,num_root ,num_file_creations ,num_shells ,num_access_files ,num_outbound_cmds ,is_hot_login ,is_guest_login
載入kdd99資料集中的資料:
def load_kdd99(filename):
x=with open(filename) asf:
for line in f:
line=line.strip('\n')
line=line.split(',')
return x
篩選標記為rootkit和normal且是telnet協議的資料:
if (x1[41] in ['rootkit.','normal.']) and (x1[2]=='telnet'):
if x1[41]=='rootkit.':
else:
2.特徵化:挑選rootkit有關的特徵作為樣本特徵
x1 = x1[9:21]
for x1 in v:
v1 =
for x2 in x1:
3.訓練樣本
clf = kneighborsclassifier(n_neighbors = 3)4.效果驗證
print cross_validation.cross_val_score(clf, x, y, n_jobs=-1, cv=10)
學習筆記 K 近鄰演算法
一 k 近鄰演算法概述 適用於 數值型和標量型 1 收集資料 2 準備資料 向量點距離 3 按照距離遞增次序排序 4 選取與當前距離最小的k個點 5 確定選擇k個點所在類別的頻率 6 判斷當前點的的類別 二 k 近鄰演算法實現 python語言實現 共有資料1000行,含有三個資料特徵 每年獲得的飛...
學習筆記34 k近鄰演算法
k nearest neighbor knn 這是一種分類演算法,它的核心思想是 對於新的樣本,根據其k個最近鄰的樣本的類別,通過多數表決等決策規則,決定它的類別。使用k近鄰演算法,首先需要確定三個東西 距離度量,k值的選擇,分類決策規則 特徵空間中兩個樣本點之間的距離反映了這兩個樣本的相似程度,距...
學習筆記(一)k 近鄰演算法(KNN)
終於找到 機器學習實戰 這本書了,在此記錄一些總結,便於回顧。knn的工作原理是 存在乙個樣本資料集合,也稱作訓練樣本集,並且樣本集中每個資料都存在標籤,即我們知道樣本集中每一資料與所屬分類的對應關係。輸入沒有標籤的新資料後,將新資料的每個特徵與樣本集中資料對應的特徵進行比較,然後演算法提取樣本集中...