機器學習 3 attribute

2021-10-03 14:17:22 字數 893 閱讀 1528

1)特點

標稱屬性的值是一些符號或事物的名稱。

每個值代表某種類別、編碼、狀態,因此標稱屬性又被看做是分類的(categorical)。

標稱屬性的值不具有有意義的序,而且不是定量的。(也就是說,給定乙個物件集,找出這種屬性的均值沒有意義)

2)其它

這些值不必具有有意義的序,在電腦科學中,這些值也被看做是列舉的(enumeration)。

儘管標稱屬性的值是一些符號或「事物的名稱」,但也可以用數表示這些符號或名稱,如 hari_color,可以用 0 表示黑色,1 表示黃色。

但一種屬性中最長出現的值,稱為眾數(mode),是一種中心趨勢度量。

# 例:hari_color(頭髮顏色)、marital_status(婚姻狀況)、occupation(職業),都是標稱屬性,表示物件的特徵

1)特點

屬性對應的可能的值之間具有有意義的序或秩評定(ranking),但是相繼值之間的查是未知的。(也就是對應的值有先後次序)

2)其它

例:drink_size,表示飲料杯的大小:小、中、大,這些值具有有意義的先後次序。

序數屬性可以通過把數值量的值域劃分成有限個有序類別(如,0-很不滿意、1-不滿意、2-中性、3-滿意、4-很滿意),把數值屬性離散化而得到。

可以用眾數和中位數表示序數屬性的中性趨勢,但不能定義均值。

標稱、二元和序數屬性都是定性的,即,它們描述物件的特徵,而不給出實際大小或數值。

1)離散屬性

具有有限個或無限個可數個數,可以用或不用整數表示。

例:hari_color、smoker、drimk_size都有有限個值,因此是離散的。

2)連續屬性

參考:資料探勘:資料(資料物件與屬性型別)

Attribute 學習筆記

一 attribute 是為目標元素新增附加資訊的一種描述宣告,在執行的時候通過反射的方式來獲取附加的資訊。二 使用attributeusage來定義自定義attribute的屬性,attributeusage本身也是乙個attribute,這是專門施加在attribute類的attribute.a...

機器學習 3

如果你希望讓學習演算法能夠達到人類的地步,但是還沒有達到,那麼人工檢查一下你的演算法犯的錯誤,會讓你了解接下來該做什麼。這個過程稱為誤差分析。對於乙個貓狗分類的任務,你最終實現了90 的精度,這遠遠沒有達到你的目標。然後你對出錯的分類進行分析,發現他們看起來是有點像貓。或許你的隊友給你提一些建議,增...

C 特性Attribute學習

起初一直糾結於如何呼叫特性附著在下面那個成員的值,後來發現不需要呼叫,通過反射載入的時候是自動繫結上去的,即 獲得成員物件之後,有乙個方法可以獲得特性標籤。其實從類庫提供者,和類庫使用者的角度,分開來看就很容易理解了。類庫提供者 myclasslib類 myclasslib類有乙個showstrin...