常見的資料分類方式有2種,一種是按照資料所屬的類別進行層次分類,一種是採用關鍵字或者標籤的方式進行分類。
到底哪種方式好呢?我想本身並不應該有明顯的界限,如果資料本身就不叫有層次劃分如:生物學中的種、屬、科、目等層次的分類,那麼採用層次分模擬較好;一般而言採用關鍵字的方式比較有彈性,使資料可以隸屬為多個關鍵字,使單一資料適應多個分類。
現在產品的系統中主要採用的層次分類的方式,明顯發現了乙個資料對應多個特性的時候,檢索的不方便,我想最佳的方式是可以兼顧2種方式,以達到更好的效果。
但是在分析的時候發現,關鍵字的提取,就是現在流行的打標籤做法,比較麻煩,如果錄入資料的時候在錄入關鍵字,使用者是比較討厭的,因此如果錄入的資料純文字的,標籤應該可以從錄入的資料中輔助使用者採集,如果錄入的資料是2進製的資料,則只能手工來做了。
現在看通過標籤來擴充套件系統的特性,是乙個很不錯的辦法,我們系統中原先存在乙個「鎖定」的特性,只有「鎖定」和「解鎖」2個狀態,現在使用者希望出現「鎖定、解鎖、臨時鎖定。。。」給「鎖定」增加多種狀態,原先的設計就不合適了,因此關鍵字的做法就更好了。
如何做資料的分類?
常見的資料分類方式有2種,一種是按照資料所屬的類別進行層次分類,一種是採用關鍵字或者標籤的方式進行分類。到底哪種方式好呢?我想本身並不應該有明顯的界限,如果資料本身就不叫有層次劃分如 生物學中的種 屬 科 目等層次的分類,那麼採用層次分模擬較好 一般而言採用關鍵字的方式比較有彈性,使資料可以隸屬為多...
如何做資料的分類?
常見的資料分類方式有2種,一種是按照資料所屬的類別進行層次分類,一種是採用關鍵字或者標籤的方式進行分類。到底哪種方式好呢?我想本身並不應該有明顯的界限,如果資料本身就不叫有層次劃分如 生物學中的種 屬 科 目等層次的分類,那麼採用層次分模擬較好 一般而言採用關鍵字的方式比較有彈性,使資料可以隸屬為多...
SVM LR如何做多分類
參考文獻 西瓜書p63 先回顧基本的二項邏輯回歸 邏輯回歸通過比較兩個條件概率值的大小,將例項分到概率值大的那一類。參考文獻 統計學習方法p80 多項邏輯回歸又稱softmax回歸 參考文獻 參考文獻 有人會覺得對於乙個多分類問題,可以使用多個二分類來完成,對於多分類問題是直接選擇多分類的分類器還是...