資料預處理 無量綱化處理

2021-10-24 19:34:07 字數 562 閱讀 9495

無量綱化,也稱為資料的規範化,是指不同指標之間由於存在量綱不同致其不具可比性,故首先需將指標進行無量綱化,消除量綱影響後再進行接下來的分析。

無量綱化方法有很多,但是從幾何角度來說可以分為:直線型、折線型、曲線形無量綱化方法。

直線型無量綱化方法是指指標原始值與無量綱化後的指標值之間呈現線性關係,常用的線性量化方法有閾值法、標準化法與比重法。

折線型無量綱化適用於被評價事物呈現階段性變化,即指標值在不同階段變化對事物總體水平影響是不一樣的。

雖然折線型無量綱化方法比直線型無量綱化方法更符合實際情況,但是要想確定指標值的轉折點不是一件容易的事情,需要對資料有足夠的了解和掌握。

有些事物發展的階段性變化並不是很明顯,而前、中、後期的發展情況又各不相同,就是說指標值的變化是循序漸進的,並不是突變的,在這種情況下,曲線形無量綱化方法也更為合適。

綜合評價中的評價指標可以分為正向指標(即指標值越大越好)、逆指標(即指標值越小越好)和適度指標(即指標值落在某個區間最好,大了、小了都不好),指標彼此之間「好」與「壞」並沒有乙個標準,在很大程度上具有一定的模糊性,這時候可以選擇此方法對指標進行無量綱化處理,有興趣自行搜尋學習。

資料預處理 無量綱化

1.無量綱化定義 無量綱化,也稱為資料的規範化,是指不同指標之間由於存在量綱不同致其不具可比性,故首先需將指標進行無量綱化,消除量綱影響後再進行接下來的分析。2.無量綱化方法 無量綱化方法有很多,但是從幾何角度來說可以分為 直線型 折線型 曲線形無量綱化方法。1 直線型無量綱化方法 直線型無量綱化方...

23 資料預處理之資料離散化處理

pandas.cut x,bins,right true,labels x 資料 bins 離散化的資料,或者切分的區間 labels 離散化後各個類別的標籤 right 是否包含區間右邊的值 等寬分箱 df age bin pd.cut df age new 5,labels range 5 不加...

2 預處理 二值化處理

閾值化操作在影象處理中是一種常用的演算法,比如影象的二值化就是一種最常見的一種閾值化操作。opencv2和opencv3中提供了直接閾值化操作cv threshold 和自適應閾值化操作cv adaptivethreshold 兩種閾值化操作介面,這裡將對這兩個介面進行介紹和對比。對灰度影象進行處理...