1,資料集
from sklearn.datasets import load_boston
from sklearn.datasets import load_iris
from sklearn.datasets import load_digits
from sklearn.datasets import fetch_20newsgroups
boston = load_boston()
iris = load_iris()
digits = load_digits()
news = fetch_20newsgroups(subset = 'all')
digits.data .shape
digits.target
digits.descr
digits.target_names
2,訓練/測試資料集劃分
from sklearn.model_selection import train_test_split
x_train, x_test, y_train, y_test = train_test_split(digits.data, digits.target, test_size = 0.25, random_state = 42)
3,資料預處理
標準縮放預處理,一位有效編碼預處理
from sklearn.preprocessing import standardscaler
from sklearn.preprocessing import onehotencoder
ss = standardscaler()
x_train = ss.fit_transform(x_train)
x_test = ss.transform(x_test)
特徵提取:字典向量,文字計數向量,文字tfidf向量
from sklearn.feature_extraction import dictvectorizer
from sklearn.feature_extraction.text import countvectorizer
from sklearn.feature_extraction.text import tfidfvectorizer
4,有監督學習:分類器與回歸器
線性模型:邏輯斯蒂回歸,隨機梯度下降
from sklearn.linear_model import logisticregression, linearregression, sgdclassifier, sgdregressor
from sklearn.svm import svc, svr, linearsvc
from sklearn.*****_bayes import multinomialnb
from sklearn.neighbors import kneighborsclassifier, kneighborsregressor
先有決策樹,再有隨機森林,在森林的基礎上作梯度提公升
decisiontree < randomforest < gradientboosting
from sklearn.tree import decisiontreeclassifier, decisiontreeregressor
from sklearn.ensemble import randomforestclassifier, randomforestregressor
from sklearn.ensemble import gradientboostingclassifier, gradientboostingregressor
5,無監督學習
聚類:k均值
from sklearn.cluster import kmeans
6,度量/評價
from sklearn.metrics import classification_report
from sklearn.metrics import r2_score
均方差mse,平均絕對偏差mae
from sklearn.metrics import mean_squared_error, mean_absolute_error
cv2作弊手冊
img cv2.imread cv2.imshow show img cv2.waitkey cv2.destroyallwindows 視窗只會在呼叫waitkey 函式時才會更新 數學表示 所有的波形都可以由一系列簡單且頻率不同的正弦曲線疊加得到。影象由許多頻率組成,分離不同的頻率來理解影象和提...
搜尋引擎反作弊之 鏈結作弊與隱藏作弊
本文節選自 這就是搜尋引擎 核心技術詳解 第八章 8.2 鏈結作弊 所謂 鏈結作弊 是 擁有者考慮到搜尋引擎排名中利用了 鏈結分析 技術,所以通過操縱頁面之間的鏈結關係,或者操縱頁面之間的鏈結錨文字,以此來增加鏈結排序因子的得分,並影響搜尋結果排名的作弊方法。常見的鏈結作弊方法眾多,此節簡述幾種比較...
Alexa作弊實戰
問題 怎麼判斷使用者是否安裝了alexa工具條?要判斷這個問題,只能通過網頁指令碼來進行,然後在使用者登入時,把值送到伺服器。經過本人摸索,alxres.dll中的資源,例如指令碼,可以通過乙個路徑來訪問,用編輯器開啟這個dll,可以看到所有的指令碼。我們通過新建乙個 html頁面,在之間插入乙個引...