有幸在組隊最後時刻加入戰隊,開始一段新的學習旅程。
目前已完成task1的學習,關於賽題理解部分,本賽題屬於比較簡單的基礎型專案,適合作為入門。
#檢視訓練/測試資料概況:
import numpy as np
import pandas as pd
path=』./data/』
train_data=pd.read_csv(path+『used_car_train_20200313.csv』,sep=』 『)
test_data=pd.read_csv(path+『used_car_testa_20200313.csv』,sep=』 ')
print(『train data shape:』,train_data.shape)
print(『testa data shape:』,test_data.shape)
print(train_data.info())
print(train_data.columns)
print(train_data.describe())
#關於衡量指標:
import numpy as np
from sklearn.metrics import accuracy_score
from sklearn import metrics
y_pred=[0,1,0,1]
y_true=[0,1,1,1]
print(「acc:」,accuracy_score(y_pred,y_true))
y_pred=[0,1,0,0]
y_true=[0,1,0,1]
print(『precision:』,metrics.precision_score(y_true,y_pred))
print(『recall:』,metrics.recall_score(y_true,y_pred))
print(『f1-score』,metrics.f1_score(y_true,y_pred))
《資料探勘》組隊學習第四次打卡
一 學習內容 task4 建模調參 線性回歸模型 模型效能驗證 嵌入式特徵選擇 模型對比 模型調參 model linearregression normalize true model model.fit train x,train y print intercept model.intercep...
《機器學習基礎》組隊學習打卡1
本節內容 線性回歸的概念 主要學習以下5個方面 1 線性回歸的一般形式 有資料集 其中,1 2 3 其中n表示變數的數量,d表示每個變數的維度。2 線性回歸損失函式 代價函式 目標函式 損失函式 loss function 度量單樣本 的錯誤程度,損失函式值越小,模型就越好。代價函式 cost fu...
組隊學習 分治演算法 打卡
將原本複雜的問題,拆分成相同解決方法的簡單的小問題,然後將小問題的答案歸併成初始問題的解。採用遞迴的方式,將問題層層分解,直到子問題滿足設定好的終止條件結束遞迴求解子問題的解,然後將解歸併。示意圖如下 示例1 輸入 3,2,3 輸出 3 示例2 輸入 2,2,1,1,1,2,2 輸出 2 首先想到的...