假如有如下訓練資料:
(x1,明天),(x2,後天),(x3,大後天)。其中第一項
x
表示乙個事件,第二項表示該事件發生的時間。
現在需要你訓練乙個模型,能夠給定事件x
作為輸入,輸出其發生的時間。
乍一看是乙個分類(classification)問題。
但是如果採用普通的分類方法,由於以上標籤會被one-hot
編碼成:
(x1,(1,0,0)),(x2,(0,1,0)),(x3,(0,0,1))。所以分類的時候,當**錯了類別的時候,損失是一樣的。因為
one-hot
編碼中類別之間距離是一樣的。
即給定x
,如果模型**的結果是明天。我們會發現真實標籤是後天或者大後天都是一樣的損失。這不合理,因為我們觀察到這些標籤有順序關係,**結果是明天時,真實標籤是大後天應該比後天帶來更大的損失才對,因為更加遙遠,更加錯誤。
解決辦法:有序回歸
。
為了突顯有序可以將以上資料編碼成
(x1,0),(x2,1),(x3,2)。
有序分類logistic回歸 R語言
正如字面理解,包含兩個方面 一是有序性,如調研中常用的滿意度常用李克特量表,即有序的因變數 二是logistic分類,如1代表優秀 2代表良好 3代表一般等等。因變數為分類變數,且分類間有次序關係,針對因變數為分型別資料的情況應該選用logistic回歸,故應採用有序多分類的logistic回歸分析...
線性回歸(標準回歸)
今天我們來討論機器學習的另乙個領域 首先我們來討論利用線性回歸來 數值型資料。利用線性回歸進行 的過程就是求解回歸係數的過程,求出回歸係數後進行係數與特徵值乘積求和即可,這裡我們使用最小二乘法進行求解 ex0.txt 提取碼 dbe2 def loaddataset filename numfeat...
回歸學習 線性回歸
匯入資料 from sklearn.datasets import load boston boston load boston print boston.descr 資料分割 from sklearn.cross validation import train test split import ...