在這個作業中,我們將用梯度下降方法**pm2.5的值 hw1要求:
1、要求python3.5+
2、只能用(1)numpy(2)scipy(3)pandas
3、請用梯度下降手寫線性回歸
4、最好的公共簡單基線
5、對於想載入模型而並不想執行整個訓練過程的人:
請上傳訓練**並命名成 train.py
只要用梯度下降的**就行了
hw_best要求:
1、要求python3.5+
2、任何庫都可以用
3、在kaggle上獲得你選擇的更高的分
資料介紹:
本次作業使用豐原站的觀測記錄,分成train set跟test set,train set是豐原站每個月的前20天所有資料test set則是從豐原站剩下的資料中取樣出來。
train.csv:每個月前20天每個小時的氣象資料(每小時有18種測資)。共12個月。
test.csv:從剩下的資料當中取樣出連續的10小時為一筆,前九小時的所有觀測資料當作feature,第十小時的pm2.5當作answer。一共取出240筆不重複的test data,請根據feauure預測這240筆的pm2.5。
自己的實踐能力很差,所以本次作業只能讀他人的部落格,對於一些不懂的地方予以理解。
.iloc:根據標籤的所在位置,從0開始計數,選取列
concat 方法用於連線兩個或多個陣列。
python assert斷言是宣告其布林值必須為真的判定,如果發生異常就說明表達示為假。可以理解assert斷言語句為raise-if-not,用來測試表示式,其返回值為假,就會觸發異常。
numpy中的stack操作:hstack()、vstack()、stack()、dstack()、vsplit()、concatenate()
用法:zeros(shape, dtype=float, order='c')
返回:返回來乙個給定形狀和型別的用0填充的陣列;
引數:shape:形狀
dtype:資料型別,可選引數,預設numpy.float64
dtype型別:t ,位域,如t4代表4位
b,布林值,true or false
i,整數,如i8(64位)
u,無符號整數,u8(64位)
f,浮點數,f8(64位)
c,浮點負數,
o,物件,
s,a,字串,s24
u,unicode,u24
order:可選引數,c代表與c語言類似,行優先;f代表列優先
ones和zeros用法相似。
希望自己能慢慢記錄,革命尚未成功,同志仍需努力!
台大李巨集毅機器學習 學習筆記05
回歸 假設現在有一些資料點,我們用一條直線對這些點進行擬合 這條直線稱為最佳擬合直線 這個擬合的過程就叫做回歸。我們想要的函式應該是 能接受所有的輸入然後 出類別。梯度下降法 這裡需要一點點向量方面的數學基礎 向量 值 方向 梯度 向量 梯度 梯度值 梯度方向 梯度下降法的思想 要找到某函式的最大值...
李巨集毅機器學習 學習筆記
function set就是model 機器學習3大步驟 1.定義模型 function 集合 2.指定模型 function 好壞的評價指標 3.通過演算法選擇到最佳的模型 function alphago下棋模型抽象為棋局向下一步的分類問題 減少擁有label的data用量的方法 1.semi ...
李巨集毅機器學習attack model 學習筆記
loss函式及限制條件 無目標攻擊 l 負的 y 與y true 交叉熵 輸入的x 使y 與y true越遠越好 有目標攻擊 輸入的x 使y 與y true越遠越好且y 與y false越近越好 限制條件 x與x0距離需要小於乙個值,不被發現,否則攻擊就無意義 攻擊的目標是x在乙個小的變化內使模型失...