1.邏輯回歸
from sklearn.linear_model import logisticregression
clf = logisticregression(penalty=
'l1'
,solver=
'saga'
,tol=
0.1,c=
0.1,random_state=0)
clf.fit(x_train_bal,y_train_bal)
y_pred = clf.predict(x_test)
2.k近鄰法(knn)
from sklearn.neighbors import kneighborsclassifier
knn = kneighborsclassifier(n_neighbors=
4,p=p)
#p預設為2 1時是曼哈頓距離,2是歐幾里得距離
knn.fit(x_train_bal,y_train_bal)
y_pred = knn.predict(x_test)
3.套索回歸(lasso回歸)
from sklearn.linear_model import lasso
mod = lasso(alpha=
0.1,tol=
0.01
,random_state=0)
mod.fit(x_train,y_train)
y_pred = mod.predict(x_test)
4.最小二乘線性(ols)回歸
import statsmodels.api as sm
model = sm.ols(y_train,sm.add_constant(x_train)
)results = model.fit(
)results.summary(
)#檢視p>|t|的值》0.05的捨去
y_pred = results.predict(sm.add_constant(x_test)
)
5.高斯樸素貝葉斯:
from sklearn.*****_bayes import gaussiannb
clf = gaussiannb(priors=
[0.5
,0.5])
clf.fit(x_train_bal_new,y_rain_bal)
y_pred = clf.predict(x_test_new)
資料分析之漏斗模型
提起漏斗,讓我首先想到的是它的 形狀 圓錐形的 頂部寬底部窄 其次是它的 功能 過濾雜質,如生了蟲的白面 炸過豆腐的油等。形狀如下圖形狀才能夠有效的行使它的功能職責 過濾。功能過濾雜質 生了蟲的白面 小時候的農村,夏天雨水較多,家裡比較潮濕,缸裡的面經常會有蟲子光顧。那個時候物質匱乏,不捨的扔掉,會...
電商資料分析模型
又是一年年底,又到總結的時候。b2c 們該總結什麼?利潤?毛利?成本?空洞的文字一定會很蒼白,很業餘。資料,用資料說話。筆者根據 b2c運營的的業務特點,建立了整體 b2c運營體系的資料模型,技術部已經開始對接 後台,實施我們 web版的資料分析後台。明年我們的運營部,將逐步實現運營資料化,以資料為...
資料分析面試總結
data node mapreduce 分布式計算 mapreduce流程 mrjob yarn 資源排程協調 第三正規化 不存在屬性對主鍵的傳遞依賴 永續性事務執行成功後,該事務對資料庫的更改是持久儲存在資料庫中的 快排思想 用到了分治思想,和分治演算法一樣為了進行排序需要先對其劃分的子區間進行排...