台大李巨集毅機器學習 學習筆記03

2021-09-23 10:39:39 字數 1753 閱讀 3927

在這個作業中,我們將用梯度下降方法**pm2.5的值 hw1要求:

1、要求python3.5+

2、只能用(1)numpy(2)scipy(3)pandas

3、請用梯度下降手寫線性回歸

4、最好的公共簡單基線

5、對於想載入模型而並不想執行整個訓練過程的人:

請上傳訓練**並命名成 train.py

只要用梯度下降的**就行了

hw_best要求:

1、要求python3.5+

2、任何庫都可以用

3、在kaggle上獲得你選擇的更高的分

資料介紹:

本次作業使用豐原站的觀測記錄,分成train set跟test set,train set是豐原站每個月的前20天所有資料test set則是從豐原站剩下的資料中取樣出來。

train.csv:每個月前20天每個小時的氣象資料(每小時有18種測資)。共12個月。

test.csv:從剩下的資料當中取樣出連續的10小時為一筆,前九小時的所有觀測資料當作feature,第十小時的pm2.5當作answer。一共取出240筆不重複的test data,請根據feauure預測這240筆的pm2.5。

自己的實踐能力很差,所以本次作業只能讀他人的部落格,對於一些不懂的地方予以理解。

.iloc:根據標籤的所在位置,從0開始計數,選取列

concat 方法用於連線兩個或多個陣列。

python assert斷言是宣告其布林值必須為真的判定,如果發生異常就說明表達示為假。可以理解assert斷言語句為raise-if-not,用來測試表示式,其返回值為假,就會觸發異常。

numpy中的stack操作:hstack()、vstack()、stack()、dstack()、vsplit()、concatenate()

用法:zeros(shape, dtype=float, order='c')

返回:返回來乙個給定形狀和型別的用0填充的陣列;

引數:shape:形狀

dtype:資料型別,可選引數,預設numpy.float64

dtype型別:t ,位域,如t4代表4位

b,布林值,true or false

i,整數,如i8(64位)

u,無符號整數,u8(64位)

f,浮點數,f8(64位)

c,浮點負數,

o,物件,

s,a,字串,s24

u,unicode,u24

order:可選引數,c代表與c語言類似,行優先;f代表列優先

ones和zeros用法相似。

希望自己能慢慢記錄,革命尚未成功,同志仍需努力!

台大李巨集毅機器學習 學習筆記05

回歸 假設現在有一些資料點,我們用一條直線對這些點進行擬合 這條直線稱為最佳擬合直線 這個擬合的過程就叫做回歸。我們想要的函式應該是 能接受所有的輸入然後 出類別。梯度下降法 這裡需要一點點向量方面的數學基礎 向量 值 方向 梯度 向量 梯度 梯度值 梯度方向 梯度下降法的思想 要找到某函式的最大值...

李巨集毅機器學習 學習筆記

function set就是model 機器學習3大步驟 1.定義模型 function 集合 2.指定模型 function 好壞的評價指標 3.通過演算法選擇到最佳的模型 function alphago下棋模型抽象為棋局向下一步的分類問題 減少擁有label的data用量的方法 1.semi ...

李巨集毅機器學習attack model 學習筆記

loss函式及限制條件 無目標攻擊 l 負的 y 與y true 交叉熵 輸入的x 使y 與y true越遠越好 有目標攻擊 輸入的x 使y 與y true越遠越好且y 與y false越近越好 限制條件 x與x0距離需要小於乙個值,不被發現,否則攻擊就無意義 攻擊的目標是x在乙個小的變化內使模型失...