忙了乙個月,現在在學習機器學習。之前本科沒選,現在感興趣了。
學習地點:
首先是分類:兩類supervised和unsupervised。supervised分為classification和recession。
supervised之間的區別就乙個,是否提前知道自己在找什麼,輸入是對於特徵的評價,比方給了很多確定病人,說有個病人腫瘤大小為5(特徵),最後診斷為良性(評價)推測現在這個病人。或者去年北京天氣變化,推測今年趨勢。
unsupervised就是給機器一堆東西,讓他根據去分類。我不提前知道結果的可能取值,我提前沒有概念應該分成什麼樣。
事實上測驗錯了一道多選題,區分每個選項是supervised還是unsupervised。可是我找不找答案啊。不知道過後會不會公布。
之後講了線性回歸,當初物理實驗經常用。很快過了。
補充個名詞:square error(cost) function平方差。
線性回歸recession多用,使用的是1/2m作為係數。之所以加個1/2是因為平方差求導後正好能抵消,所以求起來方便簡單看起來也好看。但是又不會影響結果。
我覺得我這樣的筆記應該是不會侵犯版權吧。
機器學習筆記 1
1 機器學習的定義 如果乙個程式可以在任務t上,隨經驗e的增加,效果p隨之增加,則這個程式可以從經驗中學習。過程 單個神經元 2 基於tensorflow的nn 神經網路 用張量表示資料,用計算圖搭建神經網路,用會話執行,優化線上的權重 引數 得到模型。2.1 張量 多維陣列 列表 階 表示張量的維...
機器學習筆記1
高斯分布屬於指數分布族,線性最小二乘就是基於高斯分布。線性最小二乘 最大似然 最小二乘。高斯判別分析 gda 針對的是特徵向量 x 為連續值時的問題,而樸素貝葉斯 nb 針對的是特徵向量 x 為離散值時的問題。gda 比 logistic 回歸有更嚴格的前置假設。當資料服從或大致服從正態分佈時,使用...
機器學習筆記(1)
機器學習筆記。1 經驗誤差與過擬合 2 評估方法 測試集與訓練集互斥 2.1 留出法 資料集劃分為兩個互斥集,乙個用作訓練,乙個用作測試。注意資料分布一致性?分層取樣 正反例比例一致 由於按比例分割可能存在樣本次序的關係,正例 反例的具體化為可能影響結果的分析 需要進行多次隨機劃分,重複實驗取平均值...