sklearn作弊手冊

2021-10-02 12:47:13 字數 2099 閱讀 7013

1,資料集

from sklearn.datasets import load_boston

from sklearn.datasets import load_iris

from sklearn.datasets import load_digits

from sklearn.datasets import fetch_20newsgroups

boston = load_boston()

iris = load_iris()

digits = load_digits()

news = fetch_20newsgroups(subset = 'all')

digits.data       .shape

digits.target

digits.descr

digits.target_names

2,訓練/測試資料集劃分

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size = 0.25, random_state = 42)

3,資料預處理

標準縮放預處理,一位有效編碼預處理

from sklearn.preprocessing import standardscaler 

from sklearn.preprocessing import onehotencoder

ss = standardscaler()

x_train = ss.fit_transform(x_train)

x_test = ss.transform(x_test)

特徵提取:字典向量,文字計數向量,文字tfidf向量

from sklearn.feature_extraction import dictvectorizer

from sklearn.feature_extraction.text import countvectorizer

from sklearn.feature_extraction.text import tfidfvectorizer

4,有監督學習:分類器與回歸器

線性模型:邏輯斯蒂回歸,隨機梯度下降

from sklearn.linear_model import logisticregression, linearregression, sgdclassifier, sgdregressor

from sklearn.svm import svc, svr, linearsvc

from sklearn.*****_bayes import multinomialnb

from sklearn.neighbors import kneighborsclassifier, kneighborsregressor

先有決策樹,再有隨機森林,在森林的基礎上作梯度提公升

decisiontree < randomforest < gradientboosting

from sklearn.tree import decisiontreeclassifier, decisiontreeregressor

from sklearn.ensemble import randomforestclassifier, randomforestregressor

from sklearn.ensemble import gradientboostingclassifier, gradientboostingregressor

5,無監督學習

聚類:k均值

from sklearn.cluster import kmeans

6,度量/評價

from sklearn.metrics import classification_report

from sklearn.metrics import r2_score

均方差mse,平均絕對偏差mae

from sklearn.metrics import mean_squared_error, mean_absolute_error

cv2作弊手冊

img cv2.imread cv2.imshow show img cv2.waitkey cv2.destroyallwindows 視窗只會在呼叫waitkey 函式時才會更新 數學表示 所有的波形都可以由一系列簡單且頻率不同的正弦曲線疊加得到。影象由許多頻率組成,分離不同的頻率來理解影象和提...

搜尋引擎反作弊之 鏈結作弊與隱藏作弊

本文節選自 這就是搜尋引擎 核心技術詳解 第八章 8.2 鏈結作弊 所謂 鏈結作弊 是 擁有者考慮到搜尋引擎排名中利用了 鏈結分析 技術,所以通過操縱頁面之間的鏈結關係,或者操縱頁面之間的鏈結錨文字,以此來增加鏈結排序因子的得分,並影響搜尋結果排名的作弊方法。常見的鏈結作弊方法眾多,此節簡述幾種比較...

Alexa作弊實戰

問題 怎麼判斷使用者是否安裝了alexa工具條?要判斷這個問題,只能通過網頁指令碼來進行,然後在使用者登入時,把值送到伺服器。經過本人摸索,alxres.dll中的資源,例如指令碼,可以通過乙個路徑來訪問,用編輯器開啟這個dll,可以看到所有的指令碼。我們通過新建乙個 html頁面,在之間插入乙個引...