別看這幾個公式不起眼,資料分析倒是用的很普遍,所以最好記住啊,記不住也沒關係,我都總結好了
一般使用三個指標來度量乙個關聯規則,根據這三個指標可以篩選出滿足條件的關聯規則。
這三個指標是:sup
port
(支援度
)support(支援度)
suppor
t(支援
度)、c on
fide
nce(
置信度)
confidence(置信度)
confid
ence
(置信度
)、lift
(提公升度
)lift(提公升度)
lift(提
公升度)。
以x ,y
x,yx,
y這個關聯規則為例來說明:
先驗前提:x,y
x,yx,
y表示為商品,現有一商場,統計一天內的訂單小票。
表示同時購買x、y
x、yx、
y的訂單數佔總訂單數(研究關聯規則的「長表」中的所有購買的產品的訂單數)的比例。如果用p(x
)p(x)
p(x)
表示購買x
xx的訂單比例,其他產品類推,那麼
s up
port
(x,y
)=p(
x,y)
p(al
l)=同
時購買的
訂單數總
訂單
數support(x,y) = \frac=\frac的訂單數}
suppor
t(x,
y)=p
(all
)p(x
,y)
=總訂單
數同時購
買的訂單
數表示購買x
xx的訂單中同時購買y
yy的比例,即同時購買x
xx和y
yy的訂單數佔購買x
xx的訂單的比例。公式表達:
c on
fide
nce(
x−
>y)
=p(y
/x)=
p(x,
y)p(
x)=同
時購買的
訂單數購
買x的訂
單數
confidence(x->y) =p(y/x) =\frac=\frac的訂單數}
confid
ence
(x−>y)
=p(y
/x)=
p(x)
p(x,
y)=
購買x的
訂單數同
時購買的
訂單數co
nfid
ence
(y
−>x)
=p(x
/y)=
p(x,
y)p(
y)=同
時購買的
訂單數購
買y的訂
單數
confidence(y->x) =p(x/y) =\frac=\frac的訂單數}
confid
ence
(y−>x)
=p(x
/y)=
p(y)
p(x,
y)=
購買y的
訂單數同
時購買的
訂單數
l if
t(x−
>y)
=p(x
,y)p
(x)p
(y)=
p(y/
x)p(
y)=同
時購買的
訂單數×
總訂單數
購買x的
訂單數×
購買y的
訂單
數lift(x->y) =\frac =\frac=\frac的訂單數\times總訂單數}
lift(x
−>y)
=p(x
)p(y
)p(x
,y)
=p(y
)p(y
/x)
=購買x
的訂單數
×購買y
的訂單數
同時購買
的訂單數
×總訂單
數
計算**見:
關聯分析中的支援度 置信度和提公升度
自 1.支援度 support 支援度表示項集在總項集裡出現的概率。公式為 support x y p x,y p i p x y p i num xuy num i 其中,i表示總事務集。num 表示求事務集裡特定項集出現的次數。比如,num i 表示總事務集的個數 num x y 表示含有的事務...
關聯分析中的支援度 置信度和提公升度
1.支援度 support 支援度表示項集在總項集裡出現的概率。公式為 support x y p x,y p i p x y p i num xuy num i 其中,i表示總事務集。num 表示求事務集裡特定項集出現的次數。比如,num i 表示總事務集的個數 num x y 表示含有的事務集的...
R關聯規則演算法(支援度 自信度 提公升度)
用於大量資料中挖掘出有價值的資料項之間的相關關係 常用於使用者購物籃分析,使用它來發現顧客的購買習慣 兩個不相交的非空集合x y,如果有x y,就說x y是一條關聯規則。關聯規則的強度用支援度 support 和自信度 confidence 來描述,關聯規則是否可用,使用提公升度 lift 來描述。...